Azure AI / Azure OpenAI / リリースノート / 2025/04/01 / 重要
Azure AI / Azure OpenAI 2025年4月のリリースノート解説: GPT-image-1、GPT-4.1、WebRTC
公式リリースノート
Azure OpenAI の2025年4月更新では、Realtime API の WebRTC preview、GPT-image-1 preview、o4-mini と o3、GPT-4.1、GPT-4o audio models がまとめて案内されています。モデルの種類が一気に広がり、テキスト、推論、画像、音声、リアルタイム通信を同じAzure基盤上でどう組み合わせるかが重要になった月です。
要点
- Realtime API preview が WebRTC をサポートした
GPT-image-1が画像生成・編集・inpainting を含むモデルとして preview 提供されたo4-miniとo3が推論モデルとして利用可能になった- GPT-4.1 / GPT-4.1-nano が追加され、GPT-4.1 は100万トークンコンテキストが示された
- GPT-4o 系の音声認識・音声合成モデルも追加された
今回の更新で変わること
この更新は、Azure OpenAI の利用範囲が単一のチャットモデル選定を越えて、マルチモーダルなアプリ設計へ広がったことを示しています。画像を生成・編集する GPT-image-1、長い文脈を扱える GPT-4.1、推論モデル、音声モデル、WebRTC を使った低遅延対話が同じ月に並ぶため、アプリ側では入力・出力形式ごとの評価軸を分ける必要があります。
Realtime API の WebRTC 対応は、ブラウザや音声UIとの接続を考えるチームにとって特に重要です。低遅延の音声体験では、モデル性能だけでなくネットワーク、音声入出力、途中発話、ツール呼び出し、失敗時の復帰まで含めた設計が必要になります。
対象になりそうなユーザー・チーム
- Azure OpenAI で画像生成・編集を試したいクリエイティブ/プロダクトチーム
- 長文処理や推論モデルを評価する開発チーム
- 音声エージェントやリアルタイム対話UIを作るチーム
- モデル一覧とアクセス申請を管理するAI基盤担当
実務で確認したいこと
まず、各モデルのリージョン、アクセス申請、API対応、価格、利用制限を分けて確認する必要があります。特に画像と音声は、入出力データの保存、著作権・肖像、個人情報、監査ログの扱いがテキストより複雑になるため、本番導入前にガバナンス担当を巻き込むのが安全です。