VibeVoice — семейство open-source моделей голосового AI. Ключевая инновация — непрерывные токенизаторы речи с частотой 7.5 Гц. Они повышают эффективность обработки длинных последовательностей. Модели используют next-token diffusion и LLM для контекста.
