Gemini Omni は、Google が取り組んでいる新しいビデオ生成モデルです

Googleの研究所で何かが動いている。これは、Gemini ユーザーが予期せぬ選択肢、つまり、 ジェミニオムニ これには、ビデオをリミックスしたり、チャットで直接編集したりできる新しいビデオ生成モデルについての説明が付いています。

少なくとも現時点では、公式発表はありません。むしろ、よりシンプルなプレビューがチャットボットインターフェイスにほぼ偶然に表示されました。

ただし、Google がビデオ世代に新しいわけではないことを考慮すると、この加速はあらゆる点で驚くべきことではないと言わざるを得ません。たとえば、しばらく前から開発されていますはい、このテクノロジー専用のモデルであり、Gemini 内のさまざまな製品やテンプレートに統合されています。

Omni はこの道に加わるか、その一部を進化させているようです。実際、オンラインで公開されたメタデータは、それがVeo拡張子しかし、この2つの間の正確な関係は今のところ不明のままです。ただし、確かなことは、最初のテストで示された出力は明らかに有望であるということです。

Google Discover で Apple Geek LABO をフォローする

最初のテストでわかったこと

オンラインで配布されている 2 つのデモは、モデルの機能を具体的に示しています。 1 つ目は、教授がいくつかの三角関数の恒等式の証明を黒板に書き、各ステップを説明している様子を示しています。その結果、AI によって生成されたビデオに特有のいくつかの不完全性は残りますが、書かれたテキストは驚くほど正確に処理され、説得力のあるリアリズムを備えた画像が生成されます。

2 番目のテストは、この分野で最も有名かつ皮肉なベンチマークの 1 つである、いわゆる ウィル・スミスのテスト、ビデオモデルで人々が食事をするシーンを再現するのが難しいことで有名になりました。そのプロンプトには、高級な海辺のレストランで、慎重にセットされたテーブルに座り、スパゲッティを食べながら静かに会話をしている二人の男性の様子が記載されていた。制作されたビデオは特にミスもなくテストに合格し、数カ月前に比べて技術が大幅に進歩していることが確認できた。

Telegram で Google をフォローして、ニュースやオファーを最初に受け取りましょう

使用制限と計算コスト

二世代 ただし、実際的な影響がないわけではありません。 この機能を発見したユーザーの報告によると、実際、2 つのクリップは AI Pro プランで利用可能な 1 日のクォータの 86% を消費しており、高品質のビデオを作成するには依然としてかなりの計算リソースが必要であることがわかります。驚くことではないが、Google は自社の AI サービスに対してより明確な使用制限の導入に取り組んでいるようだ。

今年初めに OpenAI が Sora の閉鎖に伴いビデオ生成から撤退したが、同社は正式な説明を行わず、Google がその穴を埋めようとしているようだ…

Apple Geek LABO を Google の優先ソースとしてチェックしてください