DS

OpenAI анонсировала новые голосовые возможности API

image source

OpenAI объявила о добавлении в свой API новых голосовых функций. Они помогут разработчикам создавать приложения, способные общаться, расшифровывать и переводить разговоры с пользователями.

Компания представила модель GPT‑Realtime‑2, основанную на рассуждениях уровня GPT‑5. Она предназначена для обработки сложных запросов и реалистичного голосового общения.

Также запущена GPT‑Realtime‑Translate для синхронного перевода. Она поддерживает более 70 входных языков и 13 выходных языков.

Новая функция GPT‑Realtime‑Whisper обеспечивает преобразование речи в текст в реальном времени.

«Эти модели превращают простое голосовое взаимодействие в полноценные интерфейсы, которые могут слушать, анализировать, переводить и действовать», — заявили в OpenAI.

Новинки полезны для компаний, расширяющих поддержку клиентов, а также для образования, медиа, мероприятий и творческих платформ.

OpenAI заявляет, что предусмотрела защиту от злоупотреблений — встроены триггеры для остановки бесед при нарушении правил.

Новые модели доступны через Realtime API. Translate и Whisper тарифицируются поминутно, GPT‑Realtime‑2 — по токенам.

источник

0 комментариев

Редактор комментария
Пока нет комментариев
Станьте первым, кто оставит мнение на этот топик