Google Gemini のロゴ

Google Gemini / リリースノート / 2025/09/23 / 重要

Google Gemini 2025年9月23日のリリースノート解説: Gemini 2.5 Flash Native Audio Preview

AIPublic Preview

公式リリースノート

Google Gemini / DeepMind の 2025年9月23日のリリースノートでは、Live API 向けに gemini-2.5-flash-native-audio-preview-09-2025 が公開されました。function calling と speech cut off handling の改善が示されています。

要点

  • Live API 向けの新しい native audio preview モデルが公開された
  • function calling と speech cut off handling が改善された
  • 音声エージェントやリアルタイム対話の品質に関係する

今回の更新で変わること

音声エージェントでは、声の自然さだけでなく、ユーザーの割り込み、発話の途中終了、ツール実行との連携が体験を左右します。speech cut off handling が改善されると、会話中にユーザーが話し始めた場合や、音声が途切れた場合の扱いが安定しやすくなります。

function calling の改善も重要です。音声で依頼を受け、予約、検索、計算、社内システム参照などのツールを呼ぶ場合、モデルがいつ・どの引数で関数を呼ぶかが品質に直結します。Live API の native audio モデルがこの領域で改善されることは、音声 UI を実用化するうえで意味があります。

実務で確認したいこと

  1. ユーザー割り込み、沈黙、聞き間違いのテストケースを用意する
  2. function calling の誤実行を防ぐ確認フローを設計する
  3. 音声ログや個人情報の扱いを明確にする

結局、この日の更新をどう見るべきか

2025年9月23日の更新は、Gemini の音声対話をより実用に近づけるものです。音声AIではモデル性能だけでなく、割り込みやツール実行の扱いがユーザー体験を決めます。