リアルタイムで対話できる Google の AI アシスタントのバージョンである Gemini Live には、しばらくの間影響を与えているいくつかの革新があります。これらの革新は、高度な機能だけでなく、Gemini Live が画面に表示される方法、つまりユーザーと対話する方法にも関係します。この観点から、会話の調子に適応するという Gemini Live の最近の変更と、マルチタスクを簡素化するための新しいオーバーレイが見られるはずです。 Android 上の Gemini Live によって提供されるエクスペリエンスが明らかに向上する、さらなる前進が実現しました。

新しいインターフェース

これまでほぼ常に全画面で動作していたアシスタントは、デバイスの使用中にユーザーを追跡できるフローティング要素として表示される新しいインターフェイスを導入しています。この再設計により、インタラクションがより柔軟になり、ライブ モードをアクティブにするたびにスマートフォンから切り離される感覚が軽減されます。これまでは、全画面表示を終了すると、ステータス バーに小さなインジケーターのみが表示されていました。新しいソリューションは、電話の通常の動作と統合された、目に見えてすぐにアクセスできる要素を提供します。

Gemini Live の使用体験はどのように変化するか

新しいインターフェイスは、テキスト コマンド専用のオーバーレイのスタイルを思い起こさせるモバイル錠剤のように見えます。オーバーレイ自体をアクティブにするか、Gemini Live の全画面に切り替えることでアクセスできます。このパネルから、会話と主な機能を制御できます。ユーザーは、カメラまたは画面共有を開始したり、マイクをミュートしたり、セッションを終了したりできます。この錠剤は、Gemini Live オーディオの特徴的なグラフィカルな動きも表示し、リアルタイムで文字起こしを表示または非表示にする機能を提供します。会話がまだ始まっていない場合、キーボードを使用するとテキスト インターフェイスへの移行が容易になりますが、会話中はインターフェイスが対話の転写を直接開きます。

他のアプリケーションに切り替えると、錠剤が縮小して小さな動く円になり、画面上で自由に移動できます。このロジックは、数年前に一部のメッセージング アプリで導入されたチャット バブル モデルを彷彿とさせ、進行中のアクティビティを妨げることなく、アシスタントを常に利用可能な状態に保つことができます。タップして展開するか、下にスワイプして閉じます。ただし、ビデオ モードでは引き続き全画面インターフェイスが使用されますが、Gemini アプリを再度開くことで全画面表示に戻る可能性は残ります。

現時点では、このイノベーションは、Google アプリの安定版(17.3)にすでに存在している場合でも、一部のデバイスでのみ利用できます。限定リリースは、多くの場合、Gemini Live の背後にあるモデルの大規模なアップデートに先立って、制御された配布が行われることを示唆しています。

Gemini Live インターフェースに対するこの最新の変更は、AI アシスタントをより統合し、より低侵襲にするために Google が実施している作業に続くものです。新しいデザインは、アシスタントが視覚的なコンテキスト、音声、テキストの間を自然に移動するプロジェクトである Project Astra に関連するデモンストレーションで示されたいくつかのソリューションを思い出させます。フローティング ピルの採用は、より継続的で一貫したエクスペリエンスを構築することを目的として、この方向に正確に適合し、厳格な手順や中断を課すことなく日常活動中にユーザーをサポートできます。