画像作成・編集モデル「Nano Banana Pro」が公開 Gemini 3 Proベースにビジュアルやテキストが強化

 Googleは画像生成および編集モデル「Nano Banana Pro」を公開した。Gemini 2.5 Flash Imageモデル Nano Bananaの最新モデルにあたる。

 「Nano Banana Pro」は、Gemini 3 Proを基盤とし、データからのインフォグラフィック作成、手描きのスケッチの図表化など、あらゆるアイデアを視覚化、デザインできる。

 さらに今回のモデルでは、テキストのレンダリングが正確に行え、画像内で直接作成するのに向いている。そのため、質感、フォント、カリグラフィー表現に対応するほか、複数言語でのテキスト生成も容易だ。

 デザインの一貫性では、最大14名の画像を組み合わせて最大5人までの人物の特徴、類似性を維持したまま画像を生成する。

 編集機能では、画像内の任意の部分を選択、調整できる。カメラアングルの調整、フォーカス変更、洗練されたカラーグレーディングの適用、さらには昼から夜への変更、ボケ効果の作成など、シーンライティング調整も可能だ。出力する解像度も2K、4Kに対応している。

 AIで生成した画像なのか確認しやすくするSynthID技術が追加された。この技術を使うことで、Geminiアプリに画像をアップロードし、Google AIが生成したものかを簡単に確認できる。画像から対応を開始し、今後は音声、動画にも拡大する予定だ。

■関連記事
公式ブログ:https://blog.google/intl/ja-jp/company-news/technology/nano-banana-pro/

関連記事