ここ数か月間、Gemini は Android 上で急速に進化を続けており、多くの場合、インタラクションをより自然かつ即時化することを目的としたアップデートが行われています。現在配布されている最新のイノベーションは、特に音声入力に関するもので、ユーザーによく知られているパラダイム、つまりメッセージング アプリからの音声メッセージのパラダイムからインスピレーションを受けて完全に再考されました。
これは一見単純な変更ですが、実際にはこれまでとは異なる使用哲学が導入されており、すぐには誰もが納得できないかもしれません。
Google Gemini の音声メッセージ スタイルの波形が登場します
これまで、Gemini アプリ内のマイク アイコンをタップすると、ユーザーは、脈動する青い円の上にリアルタイムの音声文字起こしが表示される、かなり古典的なインターフェイスに直面していました。
このモードは完全に消えるわけではなく、ジェスチャーまたは電源ボタンの長押しでアクティブ化できるオーバーレイで引き続き利用できますが、完全に異なるアプローチによってサポートされています (実際、メイン エクスペリエンスで置き換えられています)。
新しいインターフェースでは、録音中のテキストフィールドがなくなり、主要なメッセージングアプリのボイスメモと同様に波形が導入されます。
初めて使用すると、その仕組みを説明する短いガイド メッセージが表示されます。話し終わったら、「停止」または「送信」をタップします「。動作はかなり直感的で、[停止]ボタンを押すと録音が停止し、メッセージのテキストが表示されます。一方、[送信]ボタンを押すとコマンドがすぐに Gemini に送信されます。アクションがない場合、録音は数秒間アクティブのままです。
多くのユーザーが評価するであろう興味深い詳細は、マイクのミュートを解除しても、すでに入力されたテキストは削除されないことです。これにより、エクスペリエンスがより柔軟になり、長い会話でのイライラが軽減されます。
視覚的および機能的な観点から見ると、新しいシステムは明らかに、統合された習慣を活用して、より自然で親しみやすいように設計されています (WhatsApp や Telegram を使用したことがある人なら、音声メッセージがどのように機能するかを正確に知っています)。
ただし、明らかな妥協点があります。特に、エラーをすぐに確認して修正することに慣れている人にとって、リアルタイムで文字起こしが表示されないことは、最初は奇妙に感じるかもしれません。
とはいえ、このようなケースではよくあることですが、Google の選択は具体的なデータに基づいている可能性があり、実際、最新の音声認識システムが非常に正確になっているため、ユーザーが文字起こしをほとんど変更しないことも考えられます。
Gemini の新しい音声入力は現在段階的にリリースされていますが、現時点では Android のみと互換性があります。したがって、一部のユーザーは、デバイスでニュースを見るまでに少し長く待つ必要があります。
この変更が気に入らない人のために、キーボードから音声ディクテーションを使用するか、現時点ではリアルタイムで文字起こしを維持する Gemini オーバーレイに依存するという代替手段があります。この選択は、Googleが、少なくとも現時点では、無理をせずに段階的な移行を進めたいと考えていることを示している。
このアップデートは、Gemini をますます便利なアシスタントに変えるプロセスのさらに 1 つのステップを表します。 人間 従来のインターフェイスにあまり束縛されません。実際、ボイスメモのインスピレーションはランダムではなく、対話をより即時的かつ自然にし、ユーザーの日常習慣と一致させることを目的としています。
この新しい設定が本当に全員を納得させることができるのか、それとも Google が数歩後退するか、少なくともより多くのカスタマイズ オプションを提供せざるを得なくなるのかを見極める必要がある。
