Что такое Foxtail?

Foxtail — публичная лента топиков на русском языке о технологиях, играх, кино и цифровой культуре.

Какие материалы публикуются на Foxtail?

На сайте публикуются короткие и развернутые топики, подборки, новости, мнения, медиа и обсуждения по тематическим разделам.

Можно ли читать Foxtail через RSS?

Да. Основная RSS-лента доступна по адресу /feed.xml, а для тегов и авторов доступны отдельные RSS-ленты.

Как связаться с Foxtail?

Для связи используйте direct chat в Telegram или email abuse@fxl.ru для обращений по контенту и модерации.

Queen

Технологии 3 мес edited

Xiaomi представила два новых ИИ-инструмента для работы с голосом

Xiaomi представила два новых ИИ-инструмента для работы с голосом: MiMo-V2.5-TTS преобразует текст в речь, а MiMo-V2.5-ASR расшифровывает звук в текст. Обе модели понимают команды на английском и китайском, позволяя создавать сценарии с несколькими голосами или описывать желаемый тембр простым языком.

Открытая модель MiMo-V2.5-ASR распознаёт речь даже при сильном шуме и поддерживает множество китайских диалектов. Она умеет расшифровывать песни, отделяя вокал от музыки, а также двуязычные диалоги. Система автоматически расставляет знаки препинания по интонации, минимизируя необходимость ручной правки.

Семейство TTS включает три варианта на платформе Xiaomi MiMo Studio. Базовая версия меняет скорость, тон и эмоции среди предустановленных голосов. MiMo-V2.5-TTS-VoiceDesign создаёт новые тембры по короткой фразе, а MiMo-V2.5-TTS-VoiceClone воспроизводит конкретный голос по небольшим образцам, сохраняя уникальный стиль.

источник

#искусственный интеллект #голосовые технологии #синтез речи #распознавание

0 комментариев

Пока нет комментариев

Станьте первым, кто оставит мнение на этот топик