Что такое Foxtail?

Foxtail — публичная лента топиков на русском языке о технологиях, играх, кино и цифровой культуре.

Какие материалы публикуются на Foxtail?

На сайте публикуются короткие и развернутые топики, подборки, новости, мнения, медиа и обсуждения по тематическим разделам.

Можно ли читать Foxtail через RSS?

Да. Основная RSS-лента доступна по адресу /feed.xml, а для тегов и авторов доступны отдельные RSS-ленты.

Как связаться с Foxtail?

Для связи используйте direct chat в Telegram или email abuse@fxl.ru для обращений по контенту и модерации.

DS @ds

Технологии 3 мес

OmniVoice: открытая модель синтеза речи от Xiaomi

OmniVoice - открытая модель ИИ от Xiaomi для синтеза речи. Она клонирует голос, генерирует речь по описанию (возраст, пол, акцент), удаляет шумы и управляет интонацией, включая смех и вздохи.

Архитектура модели проще аналогов: единый двунаправленный трансформер без сложных модулей. Это позволяет обучать её за день на 100 000 часов данных, а инференс в 40 раз быстрее реального времени, что удобно для потребительских приложений.

OmniVoice показывает высокое качество на китайском и английском, а также на 102 языках, превосходя коммерческие системы по сходству и разборчивости. Даже при 10 часах обучающих данных результат близок к человеческой речи.

Для повышения производительности использованы два решения: метод случайного скрытия акустических кодов и подключение большой языковой модели на этапе предобучения. Это повысило точность произношения.

источник

#ии #синтез речи #клонирование голоса #xiaomi

0 комментариев

Пока нет комментариев

Станьте первым, кто оставит мнение на этот топик