Azure AI / Azure OpenAI のロゴ

Azure AI / Azure OpenAI / リリースノート / 2025/01/01 / 通常

Azure AI / Azure OpenAI 2025年1月のリリースノート解説: o3-mini と GPT-4o 音声更新

AIPublic Preview

公式リリースノート

Azure OpenAI in Azure AI Foundry Models の2025年1月更新では、推論モデル o3-minigpt-4o-audio-previewgpt-4o-realtime-preview 2024-12-17 版が案内されています。年初の更新として見ると、Azure OpenAI がテキスト中心のAPI提供から、推論・音声・リアルタイム対話を組み合わせる方向へ軸足を広げ始めた月です。

要点

  • o3-mini が reasoning model として追加された
  • gpt-4o-audio-preview がグローバルデプロイで利用可能になった
  • Realtime API の 2024-12-17 版では prompt caching、新しい音声、RPM/TPMベースのレート制限が示された
  • 音声アプリでは、モデル可用性だけでなくリージョン、レート制限、既存APIとの接続を確認したい

今回の更新で変わること

1月の更新は、Azure OpenAI を使うチームにとって 推論モデルをどう使い分けるか音声体験をどう本番に近づけるか を同時に考えるきっかけになります。o3-mini は高度な推論を必要とする処理の選択肢を増やし、音声モデルは既存の /chat/completions や Realtime API の設計に影響します。

特に Realtime API では、接続数ベースではなく RPM/TPM ベースのレート制限が示されており、音声ボットや通話型UIでは負荷試験の見方が変わります。単に音声が使えるかではなく、同時利用、応答遅延、キャッシュの効き方、音声の品質をまとめて検証する必要があります。

対象になりそうなユーザー・チーム

  • Azure OpenAI で推論モデルを評価している開発チーム
  • 音声対話、会議支援、コールセンター支援を検討しているプロダクト担当
  • モデルごとのリージョン、レート制限、コスト管理を担うプラットフォームチーム

実務で確認したいこと

まず、o3-mini と音声モデルが利用リージョンとデプロイ方式に合っているかを確認したいところです。次に、Realtime API の新バージョンへ切り替えた場合、既存の音声プロンプト、voice設定、レート制限、監査ログ設計に影響がないかを見る必要があります。

この月の更新は、Azure OpenAI を単発のテキスト生成APIとしてではなく、推論・音声・リアルタイムUIを含むアプリ基盤として評価する入口になります。