OpenAI запустила Realtime API с поддержкой перевода и речи
OpenAI расширил возможности голосового интеллекта через свой API. Теперь разработчики могут создавать приложения, которые распознают речь, переводят ее и реагируют на запросы пользователей в режиме реального времени.
Что нового?
Ключевая новинка — модель GPT-Realtime-2. Она предназначена для реалистичной озвучки и обработки сложных диалогов. Эта модель значительно превосходит по качеству предыдущую версию GPT-Realtime-1.5. Благодаря этому голосовые интерфейсы способны вести осмысленные беседы.
Также представлен сервис GPT-Realtime-Translate. Он мгновенно переводит речь, поддерживая более 70 языков для ввода и 13 для вывода. Это помогает устранять языковые барьеры в общении.
Кроме того, появился GPT-Realtime-Whisper. Сервис преобразует аудио в текст в реальном времени. Это решение удобно для автоматической записи диалогов.
Где это применять?
Эти инструменты идеально подходят для клиентской поддержки, образования, медиа и блогинга. Приложения смогут распознавать речь, понимать ее, переводить и действовать во время общения с пользователями.
Для обеспечения безопасности модели оснащены встроенными ограничениями, предотвращающими спам и мошенничество. Система автоматически прекратит диалог при нарушении установленных правил.
Как получить доступ?
Все эти функции доступны через OpenAI Realtime API. Тарификация зависит от используемой модели. Тарификация GPT-Realtime-Translate и GPT-Realtime-Whisper рассчитывается поминутно. GPT-Realtime-2 тарифицируется по количеству использованных токенов.
Ранее по теме
ChatGPT добавил уведомление доверенных лиц при угрозах
Больше новостей в нашем Телеграм. Подпишись!
Ссылка на источник тык.