動画生成用の革新的な AI モデルである Gemini Omni が Google I/O に登場

存在を台無しにしたリークから数日後の Google I/O 2026 のオープニング基調講演の機会に、Google は、あらゆる入力から何かを生成するための新しい人工知能モデルである Gemini Omni を正式に発表しました。

このモデルは、前世代のモデルと比較して、世界に対するより深い理解、マルチモーダルな機能、より高い精度のおかげで、最近の OpenAI の撤退も利用して、まずビデオ生成分野に革命を起こすことを約束します。同時に、Google Flow に多くの新機能が追加されます。すべての詳細を調べてみましょう。

Google Discover で Apple Geek LABO をフォローする

Gemini Omni が正式リリース: ビデオ生成が次のレベルへ

の導入をきっかけに、 ドワーフバナナ 2025 年に、Gemini のインテリジェンスを画像生成と編集に拡張したと Google が正式に発表 ジェミニオムニ、Gemini の推論能力と創造能力が融合した生成 AI モデルのファミリー。

Omni は、ビデオをはじめ、あらゆる入力からあらゆるものを作成できる新しいモデルです。 Omni を使用すると、画像、音声、ビデオ、テキストを入力として組み合わせて、Gemini の実世界の知識に基づいて高品質のビデオを生成できます。会話を通じてビデオを簡単に編集することもできます。

Gemini Omni は「会話型」ビデオ編集を可能にします

最初の偉大な革命 ジェミニオムニ 言うのは簡単です。このモデルでは、自然言語を使用してビデオを編集できます。各指示は前の指示に基づいて構築され、キャラクターは一貫性を保ち、物理学は現実的であり、次のシーンでは前のシーンで何が起こったかが考慮されます。

適切なガイダンスがあれば、ユーザーは次のことを行うことができます。特定の詳細を変更したり、すべてを覆したりできます。ビデオ内で起こっていることを再発明する (新しいキャラクター、オブジェクト、またはインタラクションを追加する)。さまざまな編集 (環境、アングル、スタイル、特定の詳細の変更) でビデオを調整します。

例1

リクエスト： 人が鏡に触れると、鏡は液体のように優雅に波打ち、人の腕は反射鏡素材に変化するはずです。

例 2

出発点: ヴァイオリニストが曲を演奏するビデオ。

リクエスト： それはヴァイオリニストをイメージの環境に連れて行きます。

リクエスト： バイオリンを非表示にします。

リクエスト： カメラの角度を変更して、ヴァイオリニストの肩越しに撮影します。

モデルは世界に関する知識を活用してアイデアに命を吹き込むことができます

Google は、現実的に見えるシーンを作成できることに加えて、 ジェミニオムニ 彼は次に何が起こるべきかを推論し、物理学の直観的な理解と歴史的、科学的、文化的知識を組み合わせて物語を現実的かつ一貫したものにします。

このモデルは、重力、運動エネルギー、流体力学の影響を最もよく理解し、言語、イメージ、意味を結び付けることができ、短い兆候から始めて効果的な説明を作成することができます。

例1

プロンプト: 連鎖反応トラック上でビー玉が素早く転がり、連続的でスムーズな射撃が可能です。

例 2

プロンプト: ビデオでは、アルファベットの文字で始まるオブジェクトが表示されます。各文字で始まる珍しい物体がテーブルの上に置かれています (C の場合はカピバラ、D の場合はミラーボール、L の場合は溶岩ランプなど)。 26 個の文字はすべて、その文字を示す対応するキャプションを持つ 26 個のオブジェクトで表す必要があります。一度に使用できるオブジェクトとキャプションは 1 つだけです。各キャプションは、左下の紙片に書かれた黒いマーカーのマークのように見えるはずです。速いペース、24 FPS でオブジェクトあたり約 9 フレーム。最後のコマは「END」と書かれた紙切れ。ビデオ全体には、リラックスできる心地よい音楽が付いています。

例 3

プロンプト: タンパク質の折り畳みの粘土の説明。すべて粘土でできており、手を使わず、ストップモーションで正確です。

あらゆる種類の入力からビデオを作成する機能

ジェミニオムニ また、ユーザーが提供するあらゆるタイプの入力またはリファレンス (画像、テキスト、ビデオ、またはオーディオ) を単一の一貫した出力に変換することもできます。最初は音声リファレンスのみがサポートされます。将来的には、さらに多くの音声入力タイプがサポートされる予定です。

ユーザーは、キャラクター、シーン、図面などの画像を参考として使用し、モデルがユーザーの「ビジョン」と一致するコンテンツを確実に作成できるようになります。ユーザーは、自然言語記述を使用して視覚言語を定義することもできます (これは、モデルが参照として提供されるさまざまな入力をすべて組み合わせることができるためです)。

例1

プロンプト: image_0.png 画像をベースにしたダイナミックな SF 映画風のビデオ。これらの要素は、audio_0.wav の音楽のビートに同期して、video_0.mp4 と同様に点灯します。

例 2

プロンプト: 歩いていると世界が徐々にレトロフューチャー風（画像1のようなザラザラしていて憂鬱な雰囲気）に変わっていくのを想像してみてください。オーディオをレトロフューチャーな BGM として使用します。 10秒。

例 3

プロンプト: すべてを同じにしてこれを編集します。スケートボードから出てくるアニメーションモーションエフェクトを追加します。

Telegram で Google をフォローして、ニュースやオファーを最初に受け取りましょう

Gemini Omni はすでにユーザーが利用可能です

Gemini Omni ファミリーの最初の生成 AI モデル、つまり ジェミニオムニフラッシュは、Google AI Plus、Google AI Pro、Google AI Ultra プランのすべての加入者向けに、Gemini アプリ、Google Flow アプリ (Web および現在は Android 用も) ですでに利用可能です。

今週から、ユーザーは YouTube ショートアプリと YouTube Create アプリでこのツールを（追加料金なしで）利用できるようになります。今後数週間のうちに、このツールは Gemini API を通じて開発者や企業ユーザーにも利用可能になる予定です。

Google は、ファミリーモデルで生成されたすべての動画が ジェミニオムニ 電子透かしを入れる シンセID これにより、AI によって生成されたビデオの性質を検証できます (Gemini アプリ、Chrome の Gemini、および Google 検索経由)。

多くの新機能が Google Flow スイートに追加されます

Google Flow といえば、人工知能を活用したビデオコンテンツ (2026 年の初めからはオーディオも) を作成/生成するスタジオで、Google I/O 2025 で開催されたそのリリースから 1 年後に大量の新機能が提供されました。

このスイートは、Gemini Omni Flash テンプレートの可能性を最大限に活用するために更新されました。このテンプレートは、Google AI プランの加入者に世界中で利用可能で、現実世界のインスピレーションと生成されたコンテンツを融合させることができ、ユーザーは会話形式でプロジェクトを実行し、より高いキャラクターの一貫性を楽しむことができます (アイデンティティと音声はすべてのシーンで保持されます)。

新しい Google Flow Agent はスイートでデビューし、すでに世界規模ですべてのユーザーが利用可能です。ユーザーからの指示を考慮して、複雑なアクティビティを計画し、考えることができるクリエイティブなパートナーです。この「エージェント」は、Gemini モデルに基づいており、プロジェクトを深く理解し、ブレインストーミング段階、作成段階、修正段階でユーザーをサポートすることができます。

たとえば、エージェントは、特定のシーンにおける登場人物間の対話の基準点として機能したり、プロットの変更を提案したりすることもできます。プロジェクトが進むにつれて、エージェントは複数のバリエーションを一度に作成してより多くのオプションを提供し、バッチ編集を行って変更をすべてのアセットに適用することもできます。リソースが作成されると、エージェントはそれらをコレクションに整理したり、名前を直感的に変更したりすることもできます。

Google Flow Music の新機能

ビデオ生成に関する Google Flow の新機能に加えて、さまざまな新機能も Google I/O 2026 で発表されました。リブ音楽生成を担当するスイート、つまり Google Flow Music の:当社の最新機能は、より強力な編集制御と改良されたミュージックビデオ作成を提供します。”。

セクションごとの正確な編集 – さまざまな作成物をより詳細に制御できるようになりました。ユーザーは任意の部分を強調表示して、その部分のみを変更できます。曲の特定のセクションをサンプリングして、まったく別の方向に拡張することもできます。
「カバー」機能 – 元のメロディーと構造を維持したまま、すでに作成された曲のスタイルを変換できます。
Gemini Omni でミュージックビデオを作成する機能 – 最新かつ最も強力な生成 AI モデルのおかげで、Google Flow Music を使用すると、ユーザーはスタイル、主題、シーンを選択してコンテンツをピアノの物語やリズムに合わせてミュージックビデオを作成できます。この機能は、Google AI プランの加入者のみが利用できます。

両ツールの「モバイル」デバイス用アプリが到着予定

専用のプレスリリースの締めくくりとして、GoogleはGoogle Flowモバイルアプリ（数時間前に話しました）とGoogle Flow Musicのリリースを認め、Webバージョンは依然としてすべての機能にアクセスするための参照プラットフォームであり続けるが、モバイルバージョンではいつでもどこでもスマートフォンから直接作成できることを示唆しています。

Google Flow アプリは Android デバイス向けにベータ版で提供されています (近々 iOS でも利用可能になります)。
Google Flow Music アプリはすでに iOS で利用可能になっています (間もなく Android デバイスでも利用できるようになる予定です)。

フォローしてください:Google ディスカバー優先ソースとしての GoogleフェイスブックYouTubeインスタグラムTikTok