Azure AI / Azure OpenAI のロゴ

Azure AI / Azure OpenAI / リリースノート / 2025/12/01 / 重要

Azure AI / Azure OpenAI 2025年12月のリリースノート解説: GPT-image-1.5 と音声モデル更新

AI

公式リリースノート

Azure OpenAI の2025年12月更新では、GPT-image-1.5gpt-4o-mini-transcribe-2025-12-15gpt-realtime-mini-2025-12-15gpt-4o-mini-tts-2025-12-15 が案内されています。画像生成・編集と音声入出力の両方で、品質や実用性を上げる更新がまとまっています。

要点

  • GPT-image-1.5 が利用可能になり、性能、品質、編集制御、顔の保持が改善された
  • 画像編集では high input_fidelity や一部要素の追加・削除をサポートする
  • ASRモデルは英語ベンチマークで前世代よりWERを約50%低減し、日本語やIndicなど多言語性能も改善したと案内された
  • Realtime-mini は instruction-following と function-calling でフル版に近い機能を持つ
  • TTSモデルは多言語音声合成、自然さ、話者類似性の改善が示された

今回の更新で変わること

GPT-image-1.5 は、画像生成だけでなく編集ワークフローへの適用を強める更新です。顔の保持、inpainting、高解像度、入力画像の忠実度は、業務用素材や人物を含む編集で特に重要です。クリエイティブ制作では、生成品質だけでなく、元画像との一貫性や修正指示の通りやすさが評価軸になります。

音声モデル更新も実務上大きな意味があります。ASRの精度向上、多言語対応、無音時の幻覚低減は、会議記録、通話分析、音声エージェントで直接効きます。Realtime-mini と TTS の改善は、低コストまたは軽量な音声体験を組み込みたいチームにとって候補になります。

対象になりそうなユーザー・チーム

  • Azure OpenAI で画像生成・編集機能を本番検討しているチーム
  • 通話、会議、音声エージェントを扱う開発チーム
  • 多言語音声認識や音声合成を必要とするグローバルサービス担当
  • 画像・音声データのガバナンスを担う管理者

実務で確認したいこと

画像では、人物画像の同意、顔保持の扱い、生成物レビュー、権利確認を整理したいところです。音声では、録音同意、話者情報、無音時の誤出力、言語別精度、API-only deployment の運用条件を確認し、既存モデルとの差分を実データで評価する必要があります。