OpenAI / ChatGPT / Codex / リリースノート / 2026/05/07 / 重要
OpenAI 2026年5月7日のリリースノート解説: Realtime 2 と OpenAI Developers plugin
公式リリースノート
OpenAI は 2026年5月7日の API changelog で、Realtime 2、Realtime Translate、Realtime Whisper、Realtime 関連ドキュメント更新、OpenAI Developers plugin for Codex を発表しました。
要点
gpt-realtime-2を含む Realtime 2 をリリースgpt-realtime-translateとgpt-realtime-whisperを追加- Realtime API、translation、transcription sessions のガイドを更新
- OpenAI Developers plugin for Codex を公開
- 音声エージェント、通訳、音声文字起こし、Codex上でのOpenAI API開発に関係する
今回のリリースノートで語られていること
今回の OpenAI API changelog は、Realtime 系の大きな更新と Codex 向け開発支援 plugin の追加を同じ日付で扱っています。Realtime 2 は、speech-to-speech agents 向けの新しい realtime voice model として説明され、configurable reasoning を持つ点が示されています。音声エージェントでは、応答の自然さ、遅延、推論の深さ、会話状態の扱いが実用性を左右します。Realtime 2 は、単なる音声入出力ではなく、より複雑な会話型ワークフローをリアルタイムに動かすための更新として見るべきです。
Realtime Translate は streaming speech translation、Realtime Whisper は streaming speech-to-text を担います。これにより、音声通訳、会議補助、コールセンター、現場作業支援、教育、アクセシビリティなど、音声を中心にしたAI体験の設計範囲が広がります。文字起こしだけを行うのか、翻訳まで行うのか、音声で即時応答するのかによって、使うモデルやAPI、品質評価の観点が変わります。
OpenAI は、Realtime and audio guide、Realtime translation guide、Realtime transcription のドキュメントも更新し、realtime prompting guidance を Using realtime models へ移動したと説明しています。これは、APIの機能追加だけでなく、開発者が Realtime アプリを設計するためのドキュメント構造も整理されたことを意味します。音声AIは、単純なHTTPリクエストより状態管理とイベント処理が複雑なので、ガイドの整理は実装品質に直結します。
同日、OpenAI Developers plugin for Codex も公開されています。これは、Codex の中で OpenAI Platform access や OpenAI API setup guidance を得ながら、AI applications and agents を構築するための plugin と説明されています。Codex を使って OpenAI API アプリを作る場合、公式ドキュメント、API key setup、Agents SDK、Realtime、tools などの文脈にすばやくアクセスできることは開発体験を改善します。
実務では、Realtime 2 系の採用にあたり、音声品質、遅延、翻訳精度、transcription の正確性、コスト、録音や個人情報の扱いを検証する必要があります。Codex plugin は開発効率を上げますが、API key や環境変数、権限の扱いを誤らないように、チームのセキュリティルールと合わせるべきです。
対象になりそうなチーム
- 音声エージェント、通訳、文字起こし機能を開発するチーム
- Realtime API を使った会話型アプリを構築する開発者
- Codex 上で OpenAI API アプリや agents を作るチーム
実務で確認したいポイント
Realtime 2 を試す場合、WebRTC / WebSocket の接続方式、音声ストリーミング、字幕・翻訳の遅延、会話中断時の挙動を確認します。Codex plugin は、API key や project 設定の扱いをチーム標準に合わせてから使うのが安全です。
結局、この更新をどう見るべきか
2026年5月7日の更新は、OpenAI の realtime audio stack を大きく広げるものです。音声AIを本番アプリに入れるチームは、モデルだけでなく、翻訳、文字起こし、ガイド、Codex開発支援まで含めて見直すタイミングです。