Google Gemini / 公式ブログ / 2026/05/19 / 重要

Google、Gemini Omni Flash を発表

AIworkflow

公式ブログ原文

公式ブログ原文: Introducing Gemini Omni

Google は 2026年5月19日、Gemini Omni Flash を発表しました。Gemini の推論と generative media capabilities を組み合わせ、画像、音声、動画、テキストを入力として扱い、まずは動画生成・編集から展開するモデル family です。

要点

Gemini Omni は any input から output を作るマルチモーダル creation モデルとして紹介されている
最初のモデルは Gemini Omni Flash
Gemini アプリ、Google フロー、YouTube Shorts / YouTube Create アプリに展開される
開発者と enterprise 顧客向け API 展開は今後数週間と説明されている
生成動画には SynthID watermark が含まれる

今回のブログ記事で語られていること

Gemini Omni は、Gemini の推論と生成メディアモデルを組み合わせる発表です。Google は、画像、音声、動画、テキストを入力として使い、自然言語で動画を編集したり、参照素材をもとに新しい映像を作ったりできる方向性を示しています。最初の出力 modality は動画で、将来的には画像や音声にも広げると説明されています。

記事で強調されているのは、単なる text-to-video ではなく、入力参照を組み合わせ、会話を通じて編集を重ねられる点です。キャラクターやシーンの一貫性、物理表現、文化的・科学的文脈を含む生成などが説明されています。Gemini の世界知識と media generation をつなげることで、説明動画、creative ワークフロー、short-form video、プロトタイプ generation などに使える可能性があります。

提供面では、Gemini アプリ、Google フロー、YouTube Shorts / YouTube Create アプリから始まり、開発者と enterprise 顧客には API が後続で展開される予定です。すべての動画に SynthID watermark が含まれ、Gemini アプリ、Chrome、Search で生成物の確認をしやすくする方向も示されています。

対象になりそうなチーム

動画生成・編集を業務や制作ワークフローに組み込みたい creative / marketing team
マルチモーダル generation API を評価する product / 開発者 team
生成コンテンツの provenance、watermark、利用ポリシーを管理するガバナンス team

実務で確認したいポイント

API 展開は今後とされているため、現時点では利用できる surface、subscription tier、地域、商用利用条件を確認する必要があります。業務利用では、人物・声・著作物・ブランド素材・watermark / provenance の扱いを先に決めてください。

結局、この発表をどう見るべきか

Gemini Omni は、Gemini を文章やコードのモデルから、動画を含む creation モデルへ広げる発表です。AI media ワークフローを検討するチームは、品質だけでなく provenance と公開範囲を見ておくべきです。