Новости ИИ

OpenAI запустила Realtime API с поддержкой перевода и речи

Нейроредакция

08 мая 2026 — 1 min read

OpenAI расширил возможности голосового интеллекта через свой API. Теперь разработчики могут создавать приложения, которые распознают речь, переводят ее и реагируют на запросы пользователей в режиме реального времени.

Что нового?

Ключевая новинка — модель GPT-Realtime-2. Она предназначена для реалистичной озвучки и обработки сложных диалогов. Эта модель значительно превосходит по качеству предыдущую версию GPT-Realtime-1.5. Благодаря этому голосовые интерфейсы способны вести осмысленные беседы.

Также представлен сервис GPT-Realtime-Translate. Он мгновенно переводит речь, поддерживая более 70 языков для ввода и 13 для вывода. Это помогает устранять языковые барьеры в общении.

Кроме того, появился GPT-Realtime-Whisper. Сервис преобразует аудио в текст в реальном времени. Это решение удобно для автоматической записи диалогов.

Где это применять?

Эти инструменты идеально подходят для клиентской поддержки, образования, медиа и блогинга. Приложения смогут распознавать речь, понимать ее, переводить и действовать во время общения с пользователями.

Для обеспечения безопасности модели оснащены встроенными ограничениями, предотвращающими спам и мошенничество. Система автоматически прекратит диалог при нарушении установленных правил.

Как получить доступ?

Все эти функции доступны через OpenAI Realtime API. Тарификация зависит от используемой модели. Тарификация GPT-Realtime-Translate и GPT-Realtime-Whisper рассчитывается поминутно. GPT-Realtime-2 тарифицируется по количеству использованных токенов.

Ранее по теме
ChatGPT добавил уведомление доверенных лиц при угрозах

Больше новостей в нашем Телеграм. Подпишись!

Ссылка на источник тык.

Инфографика моделей OpenAI GPT-5.6: Sol, Terra и Luna с указанием стоимости и назначения

OpenAI выпустила GPT-5.6 — три модели под бюджет

OpenAI выпустила GPT-5.6. Теперь вместо одной модели работает «меню» из трех вариантов. Вы выбираете модель под конкретную задачу и бюджет — это вопрос финансового планирования, а не только техники. Иерархия моделей и цены Sol — флагман для сложнейших задач ($5 за вход и $30 за выход). Terra — сбалансированный вариант ($2.50

Логотип Google Gemini 3.5 Pro на фоне программного кода и символов технических сбоев

Google задерживает Gemini 3.5 Pro из-за сбоев

Google задерживает gemini 3.5 pro: внутренние конфликты и технические сбои Google откладывает выпуск Gemini 3.5 Pro, несмотря на жесткую конкуренцию с OpenAI и Anthropic. Основная причина — нейросеть не проходит внутренний контроль качества, а проблемы с координацией внутри компании мешают своевременно выпускать обновления. Технические сложности и проблемы с кодом

Концепт физического AI-помощника от OpenAI с интеграцией ChatGPT для управления умным домом

OpenAI создаст AI-помощника — релиз в 2027

Openai выходит на рынок гаджетов OpenAI планирует выпустить собственного физического AI-помощника. Это важный шаг в расширении экосистемы компании, который выводит ее в прямую конкуренцию с такими гигантами, как Google и Apple. Возможности и функции В основе устройства лежит ChatGPT, который превратит гаджет в полноценный центр управления умным домом: от включения

Интерфейс Google AI Mode и сервиса Google Vids с цифровыми аватарами на базе Gemini

Google AI Mode и Vids теперь выполняют задачи

Google расширяет свою AI-экосистему, превращая AI Mode в инструмент для действий, а сервис Vids — в полноценную платформу для создания видео. Так компания вступает в прямую борьбу за пользователя с OpenAI, Anthropic и профильными AI-студиями. Ai mode: от ответов к действиям AI Mode эволюционировал: вместо простых ответов он теперь выполняет задачи