Google Gemini / DeepMind / リリースノート / 2025/05/20 / 重要
Google Gemini 2025年5月20日のリリースノート解説: multi-tool、TTS、Lyria、Gemma 3n と学習クイズ
公式リリースノート
Google Gemini / DeepMind の 2025年5月20日の更新は、2025年前半の中でも特に密度の高いリリースです。Gemini API では動画前処理、multi-tool use、Live API の async function calls、URL context、2.5 Flash preview、TTS、Lyria realtime、native audio、Gemma 3n preview などが追加され、Gemini app ではカスタム学習クイズが案内されました。
要点
- Gemini API に動画前処理、multi-tool use、URL context、TTS、Lyria、native audio などが追加された
gemini-2.5-flash-preview-05-20と Gemma 3n preview も公開された- Gemini app では文書やトピックからカスタム練習クイズを作れるようになった
今回の更新で変わること
API 側では、Gemini が単一のテキスト応答モデルから、複数ツール、音声、音楽、動画、URL、open model をまたぐ開発基盤へ広がっています。multi-tool use は、コード実行と Grounding with Google Search を同じリクエストで組み合わせるような設計を可能にし、URL context は外部ページを文脈として扱う入口になります。
音声面では TTS と native audio が追加され、Gemini を音声エージェントや対話型 UI に使う可能性が広がります。Lyria realtime は音楽生成の方向を示し、Gemma 3n はオープンモデルの選択肢を増やします。app 側のカスタムクイズは、文書アップロードや学習支援との相性が高く、Gemini を教育・自己学習の作業環境として使いやすくします。
実務で確認したいこと
- 複数ツールを使う場合、ツール実行順序と失敗時の戻し方を設計する
- 音声・音楽・動画は生成物の利用ルールと保存方針を確認する
- 学習用途では、クイズの正確性と対象年齢、学校・組織アカウントの条件を見る
結局、この日の更新をどう見るべきか
2025年5月20日の更新は、Gemini が「モデル」から「AI機能群のプラットフォーム」へ広がる様子がよく出ています。個別機能を追うだけでなく、どのワークフローを Gemini に任せられるようになるのかを分けて読む必要があります。