Google Gemini / 公式ブログ / 2026/05/19 / 重要
Google、Gemini Omni Flash を発表
公式ブログ原文
Google は 2026年5月19日、Gemini Omni Flash を発表しました。Gemini の reasoning と generative media capabilities を組み合わせ、画像、音声、動画、テキストを入力として扱い、まずは動画生成・編集から展開する model family です。
要点
- Gemini Omni は any input から output を作る multimodal creation model として紹介されている
- 最初の model は Gemini Omni Flash
- Gemini app、Google Flow、YouTube Shorts / YouTube Create App に展開される
- developers と enterprise customers 向け API rollout は今後数週間と説明されている
- 生成動画には SynthID watermark が含まれる
今回のブログ記事で語られていること
Gemini Omni は、Gemini の reasoning と生成メディアモデルを組み合わせる発表です。Google は、画像、音声、動画、テキストを入力として使い、自然言語で動画を編集したり、参照素材をもとに新しい映像を作ったりできる方向性を示しています。最初の出力 modality は動画で、将来的には画像や音声にも広げると説明されています。
記事で強調されているのは、単なる text-to-video ではなく、入力参照を組み合わせ、会話を通じて編集を重ねられる点です。キャラクターやシーンの一貫性、物理表現、文化的・科学的文脈を含む生成などが説明されています。Gemini の世界知識と media generation をつなげることで、説明動画、creative workflow、short-form video、prototype generation などに使える可能性があります。
提供面では、Gemini app、Google Flow、YouTube Shorts / YouTube Create App から始まり、developers と enterprise customers には API が後続で展開される予定です。すべての動画に SynthID watermark が含まれ、Gemini app、Chrome、Search で生成物の確認をしやすくする方向も示されています。
対象になりそうなチーム
- 動画生成・編集を業務や制作 workflow に組み込みたい creative / marketing team
- multimodal generation API を評価する product / developer team
- 生成コンテンツの provenance、watermark、利用ポリシーを管理する governance team
実務で確認したいポイント
API rollout は今後とされているため、現時点では利用できる surface、subscription tier、地域、商用利用条件を確認する必要があります。業務利用では、人物・声・著作物・ブランド素材・watermark / provenance の扱いを先に決めてください。
結局、この発表をどう見るべきか
Gemini Omni は、Gemini を文章やコードのモデルから、動画を含む creation model へ広げる発表です。AI media workflow を検討するチームは、品質だけでなく provenance と公開範囲を見ておくべきです。