В приложении «Яндекс Книг» появилась озвучка книг по ролям. Виртуальный рассказчик анализирует текст, определяет реплики и назначает разные голоса в зависимости от пола. Можно включить только мужской или женский голос.
OmniVoice - открытая модель ИИ от Xiaomi для синтеза речи. Она клонирует голос, генерирует речь по описанию (возраст, пол, акцент), удаляет шумы и управляет интонацией, включая смех и вздохи.
Xiaomi представила два новых ИИ-инструмента для работы с голосом: MiMo-V2.5-TTS преобразует текст в речь, а MiMo-V2.5-ASR расшифровывает звук в текст. Обе модели понимают команды на английском и китайском, позволяя создавать сценарии с несколькими голосами или описывать желаемый тембр простым языком.
