Azure AI / Azure OpenAI のロゴ

Azure AI / Azure OpenAI / リリースノート / 2025/04/01 / 重要

Azure AI / Azure OpenAI 2025年4月のリリースノート解説: GPT-image-1、GPT-4.1、WebRTC

AIPublic Preview

公式リリースノート

Azure OpenAI の2025年4月更新では、Realtime API の WebRTC preview、GPT-image-1 preview、o4-minio3GPT-4.1、GPT-4o audio models がまとめて案内されています。モデルの種類が一気に広がり、テキスト、推論、画像、音声、リアルタイム通信を同じAzure基盤上でどう組み合わせるかが重要になった月です。

要点

  • Realtime API preview が WebRTC をサポートした
  • GPT-image-1 が画像生成・編集・inpainting を含むモデルとして preview 提供された
  • o4-minio3 が推論モデルとして利用可能になった
  • GPT-4.1 / GPT-4.1-nano が追加され、GPT-4.1 は100万トークンコンテキストが示された
  • GPT-4o 系の音声認識・音声合成モデルも追加された

今回の更新で変わること

この更新は、Azure OpenAI の利用範囲が単一のチャットモデル選定を越えて、マルチモーダルなアプリ設計へ広がったことを示しています。画像を生成・編集する GPT-image-1、長い文脈を扱える GPT-4.1、推論モデル、音声モデル、WebRTC を使った低遅延対話が同じ月に並ぶため、アプリ側では入力・出力形式ごとの評価軸を分ける必要があります。

Realtime API の WebRTC 対応は、ブラウザや音声UIとの接続を考えるチームにとって特に重要です。低遅延の音声体験では、モデル性能だけでなくネットワーク、音声入出力、途中発話、ツール呼び出し、失敗時の復帰まで含めた設計が必要になります。

対象になりそうなユーザー・チーム

  • Azure OpenAI で画像生成・編集を試したいクリエイティブ/プロダクトチーム
  • 長文処理や推論モデルを評価する開発チーム
  • 音声エージェントやリアルタイム対話UIを作るチーム
  • モデル一覧とアクセス申請を管理するAI基盤担当

実務で確認したいこと

まず、各モデルのリージョン、アクセス申請、API対応、価格、利用制限を分けて確認する必要があります。特に画像と音声は、入出力データの保存、著作権・肖像、個人情報、監査ログの扱いがテキストより複雑になるため、本番導入前にガバナンス担当を巻き込むのが安全です。