Google Gemini / リリースノート / 2025/09/23 / 重要
Google Gemini 2025年9月23日のリリースノート解説: Gemini 2.5 Flash Native Audio Preview
公式リリースノート
Google Gemini / DeepMind の 2025年9月23日のリリースノートでは、Live API 向けに gemini-2.5-flash-native-audio-preview-09-2025 が公開されました。function calling と speech cut off handling の改善が示されています。
要点
- Live API 向けの新しい native audio preview モデルが公開された
- function calling と speech cut off handling が改善された
- 音声エージェントやリアルタイム対話の品質に関係する
今回の更新で変わること
音声エージェントでは、声の自然さだけでなく、ユーザーの割り込み、発話の途中終了、ツール実行との連携が体験を左右します。speech cut off handling が改善されると、会話中にユーザーが話し始めた場合や、音声が途切れた場合の扱いが安定しやすくなります。
function calling の改善も重要です。音声で依頼を受け、予約、検索、計算、社内システム参照などのツールを呼ぶ場合、モデルがいつ・どの引数で関数を呼ぶかが品質に直結します。Live API の native audio モデルがこの領域で改善されることは、音声 UI を実用化するうえで意味があります。
実務で確認したいこと
- ユーザー割り込み、沈黙、聞き間違いのテストケースを用意する
- function calling の誤実行を防ぐ確認フローを設計する
- 音声ログや個人情報の扱いを明確にする
結局、この日の更新をどう見るべきか
2025年9月23日の更新は、Gemini の音声対話をより実用に近づけるものです。音声AIではモデル性能だけでなく、割り込みやツール実行の扱いがユーザー体験を決めます。