Google、Gemini 3.5 Live Translateを発表—自然な音声翻訳を実現

Google は、Gemini 3.5 Live Translate を発表しました。これは、70 以上の言語に対してほぼリアルタイムの音声翻訳を提供する最新の音声モデルです。

Gemini 3.5 Live Translate の機能と特徴

Google によると、このモデルは 70 以上の言語を自動的に検出し、話者のトーン、スピード、ピッチを保持しながら流暢で自然な翻訳音声を生成します。従来の逐次翻訳システムとは異なり、Gemini 3.5 Live Translate は音声を継続的に生成でき、品質向上のために文脈を待つことと、話者と同期を保つための即時翻訳とのトレードオフをバランスよく取ります。これにより、翻訳プロセス中に気まずい間が生じることはなく、会議全体で数秒の遅れのみが発生します。

「今日は、Gemini 3.5 Live Translate を発表し、リアルタイム音声翻訳のための最新の音声モデルを提供する次のステップを踏み出しました。」

Google

Gemini 3.5 Live Translate のアプリケーションシーン

Gemini 3.5 Live Translate は、Google の製品で利用可能になり、開発者は Gemini Live API と Google AI Studio を通じてパブリックプレビューにアクセスでき、企業ユーザーは Google Meet でプライベートプレビューを行うことができます。一般ユーザーは、Android および iOS の Google Translate アプリを通じてこの機能を利用できます。

「Gemini 3.5 Live Translate はリアルタイムのストリーミング音声を処理し、言語を超えた接続をよりシームレスにします。」

Google

ユーザー体験の向上

Google Meet では、音声翻訳が Gemini 3.5 Live Translate を使用し、70 以上の言語のサポートを提供し、2000 以上の言語の組み合わせに拡張されることで、ユーザー体験が向上します。この更新は今月中に選定された Google Workspace ビジネス顧客に向けて開始され、今年後半にはより広範な展開が計画されています。

「ユーザーは Google Translate アプリのリアルタイム翻訳機能を通じて、よりスムーズな翻訳を体験し、ヘッドフォンなしで直接スマートフォンから翻訳を聞くことができます。」

Google

さらに、このモデルによって生成されたすべての音声は SynthID によってウォーターマーク処理され、AI によって生成されたコンテンツが検出可能であることを保証し、誤情報の拡散を防ぎます。

資料出典：Google 公式発表

Gemini 3.5 Live Translate の機能と特徴

Gemini 3.5 Live Translate のアプリケーションシーン

ユーザー体験の向上

stone