跳到主要内容

Google Nano Banana 2 上手指南

Summary

Google Nano Banana 2(基于 Gemini-3.1-Flash)以极低成本提供 Pro 级约 95% 的图像生成能力。关键特性包括 Image Grounding(模型生成前可搜索互联网了解主题真实外观)、512px 分辨率、极端宽高比支持(1:8、1:4)以及可控的 Think Mode(启用/禁用推理过程)。实用 Prompt 示例涵盖卡通肖像、动漫转真人照片、历史场景和蜡笔风格艺术等。应用案例包括 Window Seat、Pet Passport Adventure 和 Global Kit Generator。

Key Concepts

  • Nano Banana 2 - Google 的高性价比图像生成模型,基于 Gemini-3.1-Flash
  • Image Grounding - 模型生成前搜索互联网了解主题真实外观
  • Think Mode - 可启用/禁用的模型推理过程控制
  • AI Image Generation - AI 图像生成技术
  • Gemini Flash - Google 的轻量高效模型系列

Detailed Content

模型定位

Nano Banana 2(Gemini-3.1-Flash)以一小部分成本提供 Pro 约 95% 的能力,是高性价比的图像生成选择。

关键特性

模型对比:Nano Banana 1 vs. 2 vs. Pro 能力矩阵,展示各版本差异。

Image Grounding:模型可在生成前搜索互联网查找特定图像,了解真实世界中的主题外观。附带 Python Colab notebook 供实验。

新参数:支持 512px 分辨率和极端宽高比(1:8、1:4),适用于特殊构图需求。

Think Mode 控制:可启用或禁用模型的推理过程,平衡生成质量与速度。

实用 Prompt 示例

  • 卡通肖像生成
  • 动漫转真人照片风格转换
  • 历史场景重现
  • 蜡笔风格艺术创作

应用案例

  • Window Seat - 窗景生成
  • Pet Passport Adventure - 宠物护照冒险
  • Global Kit Generator - 全球套件生成器
  • AI Image Generation
  • Gemini Flash
  • Prompt Engineering
  • Google AI