Azure AI / Azure OpenAI / リリースノート / 2025/12/01 / 重要
Azure AI / Azure OpenAI 2025年12月のリリースノート解説: GPT-image-1.5 と音声モデル更新
公式リリースノート
Azure OpenAI の2025年12月更新では、GPT-image-1.5、gpt-4o-mini-transcribe-2025-12-15、gpt-realtime-mini-2025-12-15、gpt-4o-mini-tts-2025-12-15 が案内されています。画像生成・編集と音声入出力の両方で、品質や実用性を上げる更新がまとまっています。
要点
- GPT-image-1.5 が利用可能になり、性能、品質、編集制御、顔の保持が改善された
- 画像編集では high input_fidelity や一部要素の追加・削除をサポートする
- ASRモデルは英語ベンチマークで前世代よりWERを約50%低減し、日本語やIndicなど多言語性能も改善したと案内された
- Realtime-mini は instruction-following と function-calling でフル版に近い機能を持つ
- TTSモデルは多言語音声合成、自然さ、話者類似性の改善が示された
今回の更新で変わること
GPT-image-1.5 は、画像生成だけでなく編集ワークフローへの適用を強める更新です。顔の保持、inpainting、高解像度、入力画像の忠実度は、業務用素材や人物を含む編集で特に重要です。クリエイティブ制作では、生成品質だけでなく、元画像との一貫性や修正指示の通りやすさが評価軸になります。
音声モデル更新も実務上大きな意味があります。ASRの精度向上、多言語対応、無音時の幻覚低減は、会議記録、通話分析、音声エージェントで直接効きます。Realtime-mini と TTS の改善は、低コストまたは軽量な音声体験を組み込みたいチームにとって候補になります。
対象になりそうなユーザー・チーム
- Azure OpenAI で画像生成・編集機能を本番検討しているチーム
- 通話、会議、音声エージェントを扱う開発チーム
- 多言語音声認識や音声合成を必要とするグローバルサービス担当
- 画像・音声データのガバナンスを担う管理者
実務で確認したいこと
画像では、人物画像の同意、顔保持の扱い、生成物レビュー、権利確認を整理したいところです。音声では、録音同意、話者情報、無音時の誤出力、言語別精度、API-only deployment の運用条件を確認し、既存モデルとの差分を実データで評価する必要があります。