終わりに近づいているのは、双子座を中心に展開するすべてのものにとって非常に重要な週でした。双子座は、人工知能に基づく Google のアシスタントとしか認識されませんが、実際には、最も異なる目的で AI を活用する広範なモデルに対応します。

昨日、マウンテンビューの巨人は、翻訳エクスペリエンスをより流動的かつ一貫性のあるものにするだけでなく、モデルの改善も目的として、Google 翻訳と検索に Gemini を統合すると発表しました。 ジェミニオーディオ 音声インタラクションを強化します。すべての詳細を調べてみましょう。

Google は Gemini を Translate に統合し、翻訳を次のレベルに引き上げます

当初の予想通り、Google は翻訳に関する重要なイノベーションを発表し、Gemini の機能を Google 翻訳と Google 検索結果に統合しました。

最先端のテキスト翻訳品質を導入しています。これは、どこを検索しても、よりインテリジェントで自然かつ正確なテキスト翻訳が得られることを意味します。また、リアルタイム翻訳の新しいベータ版もリリースします。これは、Gemini の新しいネイティブ音声翻訳機能のおかげで、リアルタイムで自然な音声の翻訳をヘッドフォンに直接提供します。さらに、翻訳アプリで練習できる言語をさらに追加しています。

よりスマートでより自然な翻訳

最初の革新は単純な翻訳に関するもので、マウンテンビューの巨人が検索結果だけでなく、Google 翻訳の基本機能を通じても利用できるようにするものです。

Gemini の機能のおかげで、翻訳が向上し、ニュアンス、イディオム、現地の表現、スラングを含む文を正しくレンダリングできるようになりました。アシスタントは文脈を分析して、表現の本当の意味を捉えた翻訳を提供します。

Google 翻訳ウェブ - ジェミニの可能性

リアルタイム音声翻訳

Google 翻訳は、Gemini Audio モデルの新しいリアルタイム音声翻訳機能 (詳細は後述) を統合し、新しい「ヘッドフォン内」リアルタイム翻訳エクスペリエンスをユーザーに提供します。

「翻訳された」スピーチでは、さまざまな話者の口調、強調、リズムが維持され、対話がより自然になります。この機能はモードの代わりになります (イタリアには到着しないため、スポイラーになります)。 会話

Google翻訳の「練習」モード

のニュースもあります 練習する、Gemini をベースにした Google 翻訳学習機能は、最近イタリアにも導入され (英語学習をサポート)、新しい言語のサポートを受けました。

新しい言語や「領土」の拡大に加え、 練習する ユーザーをテストし、学習目標の達成を促す新しいメカニズムを導入し、進捗状況 (たとえば、連続した数日の学習) と長期的な一貫性を監視しました。

Telegram で Google Italia をフォローして、ニュースや特典を最初に受け取りましょう

Google が Gemini Audio モデルを強化して音声インタラクションを改善

モデルアップデートをきっかけに ジェミニ 2.5 プロ そして Flash テキスト読み上げGoogle は最近、テンプレートの更新版をリリースしました。 Gemini 2.5 フラッシュ ネイティブ オーディオ これは、より複雑なワークフローを処理し、ユーザーが提供する指示をナビゲートし、より自然な変換をサポートするモデルの能力を向上させることを目的としています。

ライブ音声エージェント

モデル Gemini 2.5 フラッシュ ネイティブ オーディオ は、次の 3 つの主要領域の改善により、幅広い会話エクスペリエンスを提供できます。

  • より正確な関数呼び出し – アシスタントは、会話中にリアルタイムで情報を取得する必要がある状況をより正確に識別し、フローを中断することなく、取得したデータを応答に挿入できます。
  • 命令の信頼性 – 複雑な命令の処理が向上し、より完全で信頼性の高い応答が得られます。
  • よりスムーズな会話 – アシスタントは会話のさまざまなステップのコンテキストを取得して、よりコンテキストに即した有意義なその後の応答を提供できます。

ライブ音声翻訳

翻訳関連のニュースについて話したとき、ライブ音声翻訳について話しましたが、この可能性はモデルの可能性を最大限に活用しています。 Gemini 2.5 フラッシュ ネイティブ オーディオ、一方向の会話の場合と双方向の会話の場合の両方。

Gemini リアルタイム翻訳は、次の主要な機能を活用します。

  • 対応言語 – 音声を 70 以上の言語と 2,000 の言語ペアに翻訳し、多言語の知識とスキルをネイティブ音声機能と組み合わせます。
  • スタイルの転送 – 会話のトーンを理解し、話者のイントネーション、リズム、トーンを維持しながら翻訳に変換します。
  • 多言語入力 – モデルは単一のセッションで中断することなく同時に複数の言語を理解できるため、ユーザーは設定を変更する必要がなく、周囲の複数の言語を話す人々との会話に参加できます。
  • 自動検出 – モデルは、特定の言語を設定することなく、対話者が話した言語を自動的に識別し、翻訳を開始できます。
  • ノイズ耐性 – このモデルは周囲のノイズを除去できるため、騒がしい屋外環境でもリアルタイム翻訳機能を使用できます。

これらの新しい Gemini 機能の利用可能性

最後に到達したので、Google が発表したこれらの新機能がどこに登場し、誰が利用できるかを見てみましょう。まず、翻訳に関連するものから始めます。

  • よりスマートでより自然な翻訳 – 米国とインドの Google 翻訳アプリとウェブで、英語から 20 近くの言語まで利用できます。
  • 新しい会話型ヘッドセット モード – 米国、メキシコ、インドの Android でベータ版で利用可能で、70 以上の言語をサポートしています。 2026 年に iOS およびその他の国でリリースされる予定です。
  • 「練習」モード – Android および iOS のベータ版で利用可能。イタリアを含む新しい国 (合計 20 か国) に到着し、英語からドイツ語およびポルトガル語へ、またはさまざまな言語 (イタリア語を含む) から英語への翻訳が可能です。

オーディオ ニュースに移ります。モデルの音声エージェントです。 Gemini 2.5 フラッシュ ネイティブ オーディオ Vertex AI でテストでき、Google AI Studio 経由でテストできる Gemini API でプレビューできます。更新されたモデルも展開されます ジェミニライブ そして ライブ検索 からの AIモード。音声合成モデル ジェミニ 2.5 フラッシュ そして ジェミニ 2.5 プロの代わりに、Google AI Studio の Gemini API を介して利用できます。