Google は本日、Nano Banana 2 Lite と Gemini Omni Flash のプレビュー版を発表しました。これは最新のメディア生成モデルで、開発者や NotebookLM ユーザー向けに提供されます。Nano Banana 2 Lite(正式名称は Gemini 3.1 Flash-Lite Image)は、Google がこれまでに開発した「最も速く、コストパフォーマンスに優れた画像生成および編集モデル」です。
このモデルは本日正式にリリースされ、Google の技術によると、4秒以内に画像を生成できるとのことです。従来の Nano Banana(Gemini 2.5 Flash Image)と比較して、この新しいモデルは「迅速な画像生成を提供し、視覚的な質と能力において顕著な向上を示します」。
このモデルの能力には以下が含まれます:世界知識:正確な状況シーンの迅速な草案、粗いデータの可視化、特定の場所のシミュレーション画像;キャラクターの一貫性:複数回の迅速な生成の中でキャラクターのアイデンティティとオブジェクトのリアリティを維持し、ストーリーボードツールの構築やバーチャル試着室の埋め込みを容易にする;迅速なテキストとローカライズ:即時にコピーを草案し、迅速な生成を通じて可読なテキストを直接レンダリングし、ローカル広告の変化におけるタイポグラフィの効果を観察します。
Gemini Omni Flash が公開プレビューに
同時に、Gemini Omni Flash は一般公開プレビュー段階に入りました。この動きは、I/O カンファレンスで発表された Gemini アプリケーションに続くものです。このモデルの機能には以下が含まれます:対話型編集:自然言語を使用してキャラクターを交換したり、シーンを再照明したり、角度を変更したりしながら、元の音声とビデオトラックを自然に保持します;マルチモーダル入力:テキスト、画像、ビデオ入力を組み合わせてビデオ生成を指導します。Gemini Omni Flash は、各ビデオ出力においてネイティブに音声を生成し、キャラクター、オブジェクト、スタイルの一貫性を維持します。
さらに、このモデルの世界知識とシミュレーション能力は、物理に対する直感的な理解と Gemini の歴史、科学、文化的背景知識を組み合わせ、写真リアリズムと意味深い物語の間に橋を架けます。テキストとアクションの同期機能は、可読テキストとグラフィックをビデオに直接レンダリングし、動的なタイポグラフィと解釈テキストを画面の動きと同期させます。
Gemini Omni Flash の価格は Veo 3.1 Fast と同じで、毎秒 720p のビデオ出力は ¥20(US$0.10) です。これらの二つのモデルは、Google AI Studio と Gemini Enterprise Agent Platform で提供されています。NotebookLM は Nano Banana 2 Lite を使用して短いビデオの概要を作成しています。
この新しいフォーマットは、60 秒の縦型ビデオを提供し、「物語の解説と教育アニメーション」を含み、Cinematic Video Overviews に似ており、今後数週間でリリースされる予定です。

