OpenAI объявила о добавлении в свой API новых голосовых функций. Они помогут разработчикам создавать приложения, способные общаться, расшифровывать и переводить разговоры с пользователями.
Компания представила модель GPT‑Realtime‑2, основанную на рассуждениях уровня GPT‑5. Она предназначена для обработки сложных запросов и реалистичного голосового общения.
Также запущена GPT‑Realtime‑Translate для синхронного перевода. Она поддерживает более 70 входных языков и 13 выходных языков.
Новая функция GPT‑Realtime‑Whisper обеспечивает преобразование речи в текст в реальном времени.
«Эти модели превращают простое голосовое взаимодействие в полноценные интерфейсы, которые могут слушать, анализировать, переводить и действовать», — заявили в OpenAI.
Новинки полезны для компаний, расширяющих поддержку клиентов, а также для образования, медиа, мероприятий и творческих платформ.
OpenAI заявляет, что предусмотрела защиту от злоупотреблений — встроены триггеры для остановки бесед при нарушении правил.
Новые модели доступны через Realtime API. Translate и Whisper тарифицируются поминутно, GPT‑Realtime‑2 — по токенам.

0 комментариев