Nano Banana 2 Lite の紹介
Simon Willison は Google の最新画像生成モデル「Nano Banana 2 Lite」を実験し、その高速性と低コストを評価しつつも、テキスト認識における誤字の欠陥も指摘した。
キーポイント
新モデルの特性と位置づけ
Gemini 3.1 Flash Lite Image(通称 Nano Banana 2 Lite)は、速度とスケーラビリティを重視した「最速かつ最安値」の画像生成モデルとして登場した。
複雑なプロンプトへの対応
「ハムレディオを持つアライグマを探せ」という Where's Waldo 形式の複雑な指示に対し、詳細な描写とキャラクター配置を高い精度で生成した。
既存モデルとの比較評価
以前の Nano Banana モデルと比較して、この新モデルはより優れた結果を出したが、フォントやテキストの正確性には依然として課題が残っている。
影響分析・編集コメントを表示
影響分析
この発表は、生成 AI の画像分野において「高品質」だけでなく「高速・低コスト」という実用性が重視される方向へシフトしていることを示しています。特に大規模なバッチ処理やリアルタイム応用を想定する開発者にとって、コストパフォーマンスに優れた選択肢が追加されたことは重要です。ただし、テキストの正確性に関する指摘は、LLM の視覚的推論能力がまだ完璧ではないという現実的な課題を浮き彫りにしており、今後の技術進化の焦点となるでしょう。
編集コメント
「最速・最安」を謳う新モデルの実証実験において、視覚的な複雑さへの対応は成功しましたが、テキストの正確性という基本的な課題が依然として残っている点が興味深いです。実運用ではコストと速度が優先される一方で、細部の精度も無視できないバランス感覚が求められます。
Gemini 3.1 Flash Lite Image (gemini-3.1-flash-lite-image API 内)としても知られるこのモデルは、「速度とスケーラビリティのために設計された、最も高速で安価な Gemini 画像生成モデル」です。
私は AI Studio を使用して、以下のプロンプトを実行しました:
ウォーリーを探せスタイルの画像を作成してください。ただし、ハムレシーバーを持ったアライグマはどこでしょうか。

これは 4 月に試した際の他の Nano Banana モデル からの結果 よりも気に入っています。ただし、「Forest Festival」という単語を 2 つの異なる方法で誤記していました。
Via Hacker News
Tags: google, ai, generative-ai, llms, gemini, text-to-image, llm-release, nano-banana
原文を表示
Also known as Gemini 3.1 Flash Lite Image (gemini-3.1-flash-lite-image in their API), this is the "fastest and cheapest Gemini image model, engineered for velocity and scale".
I used AI studio to run this prompt:
Do a where's Waldo style image but it's where is the raccoon holding a ham radio

I like that one better than the results I got from the other Nano Banana models when I tried this back in April. It spelled Forest Festival wrong in two different ways though.
Via Hacker News
Tags: google, ai, generative-ai, llms, gemini, text-to-image, llm-release, nano-banana
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み