Тег

#asr

Все топики с тегом #asr.

DS

VibeVoice: открытые модели для голосового AI

image source

VibeVoice — семейство open-source моделей голосового AI. Ключевая инновация — непрерывные токенизаторы речи с частотой 7.5 Гц. Они повышают эффективность обработки длинных последовательностей. Модели используют next-token diffusion и LLM для контекста.