2 月 26 日,Google 发布了 Nano Banana 2,Nano Banana 图像生成系列的第三款模型。
技术名称为 Gemini 3.1 Flash Image,它试图解决一个此前横亘在开发者和普通用户面前的矛盾:想要 Pro 级画质,就得忍受 Pro 级的价格和等待;想要快和便宜,就只能将就初代 Nano Banana 的能力天花板。
先简单回顾一下这条产品线。2025 年 8 月,初代 Nano Banana(Gemini 2.5 Flash Image)以匿名身份在 LMArena 上亮相后迅速出圈,成为 Google 近年来少有的病毒传播 AI 产品。三个月后的 11 月,Nano Banana Pro(Gemini 3 Pro Image)发布,带来了 4K 分辨率、精准文字渲染和 " 先推理再画图 " 的架构升级,被视为图像生成领域的新标杆。
现在又过了三个月,Nano Banana 2 把 Pro 的核心能力装进了 Flash 的壳里,并且将全面替代 Pro,成为 Google 全线产品的默认图像生成模型。
半年三代,这个推进节奏在 Google 的 AI 产品矩阵中也属罕见。
Pro 的能力,Flash 的成本
Nano Banana 2 最直观的变化是 "Pro 级能力 + Flash 级速度 " 的组合,但具体拆开来看,几个能力点值得关注。
联网搜索增强的世界知识。 这可能是 Nano Banana 2 与市面上大多数图像生成模型最本质的差异。生成过程中,模型可以调用 Google Search 获取实时信息和图片参考,再将其融入生成结果。
Google 在开发者博客中展示了一个名为 "Window Seat" 的 demo 应用:给定一个地点名称,模型会先搜索该地点的实时天气和街景图片,再生成一张对应的窗外风景。它不再单纯依赖训练数据进行 " 回忆 ",转为基于实时信息开展创作。
这个能力让 Nano Banana 2 在生成信息图、数据可视化、或涉及特定真实场景的内容时,具备了传统扩散模型难以匹配的优势。
联网搜索为全球任意窗户生成更精准的窗外景观。
文字渲染与图内翻译。 文字生成一直是 AI 图像模型的痛点,初代 Nano Banana 在这方面表现尤其不稳定。Nano Banana 2 继承了 Pro 版本的字符级验证机制,能逐字检查生成文字的准确性。

更实用的是,它新增了图内多语言翻译功能。给定一张包含英文标识的图片,可以直接要求模型将文字翻译为其他语言并重新渲染,同时保持画面一致性。Google 官方 demo 展示了一个 "Native Wildlife" 路牌被翻译为印地语的案例,文字替换后画面的光照和质感保持了连贯。

水循环图解生成效果
主体一致性。 Nano Banana 2 支持在单个工作流中维持最多 5 个角色的外貌一致性,以及最多 14 个物体的视觉保真度。这对需要连续叙事的场景来说是关键能力,比如故事板、品牌素材、漫画分镜等。
Google 展示了一组案例,三个毛绒角色搭建树屋的六格连续故事,每格的角色服装和面部特征保持稳定,但表情和姿态有自然变化。

三个毛绒角色搭建树屋的六格故事
分辨率与格式覆盖。 支持 512px 到 4K 的四档分辨率输出。其中 512px 是新增的低分辨率档位,专为需要快速迭代的批量生成场景设计。宽高比方面新增了 4:1、1:4、8:1、1:8 等极端比例,覆盖了从竖版社交媒体到超宽 banner 的各类需求,这些是 Pro 版本此前不支持的。
可配置思考深度。 面向开发者的新功能:允许调节模型的推理强度,从 Minimal(默认,最快)到 High/Dynamic(更慢但更精准)。相当于把 " 画质 vs 速度 " 的取舍权交到了开发者手中,可以根据场景灵活选择。

发布后,独立评测机构 Artificial Analysis 在 X 上公布了 Arena 排名结果,Nano Banana 2 以 Pro 一半的价格拿下了文生图榜单第一,图像编辑方面排名第三,仅次于 GPT Image 1.5 和 Nano Banana Pro。独立开发者 levelsio 在获得提前体验后也表示,主体一致性是这次最大的突破," 照片终于真正像你训练的那个人了,而不是有点像 "。
在 Google 官方公布的 GenAI-Bench 评测结果中,NB2 在开启联网搜索和 Thinking 模式后,三项指标均领先于 Nano Banana Pro 和 GPT-Image 1.5。
把图像生成变成基础设施
如果只看能力升级,Nano Banana 2 是一次常规的版本迭代。但 Google 围绕它做的产品布局,透露出更大的意图。
全线替换为默认。 Nano Banana 2 将成为 Gemini App 中 Fast、Thinking 和 Pro 三个模式的默认图像生成引擎,直接替换此前的 Nano Banana Pro。绝大多数 Gemini 用户接触到的图像生成能力,都将由 NB2 提供。
Pro 版本并未下线,但被推到了一个更小众的位置:只有 Google AI Pro 和 Ultra 的付费用户可以通过 " 三点菜单 → 重新生成 " 来手动调用。
产品渗透范围。 除 Gemini App 外,NB2 同步上线了 Google Search 的 AI Mode 和 Lens(覆盖 141 个新国家和地区、8 种新增语言)、Flow(Google 的 AI 创意工具,NB2 成为默认且零积分使用)、Google Ads(生成广告素材建议)、AI Studio、Gemini API、Vertex AI 和 Google Antigravity。

Google 做了一个演示应用 " 全球广告本地化器 " 来展示 NB2 的能力
几乎覆盖了 Google AI 产品矩阵中所有与图像相关的触点。目前 NB2 已开始滚动上线,普通用户打开 Gemini App 即可体验(已替换为默认模型),已在搜索(覆盖 141 个国家)以及 Flow+ 中推出,开发者可通过 AI Studio 和 Gemini API 接入,Antigravity 也已上线,目前为 preview 状态。
定价策略。 API 端的价格值得单独说。1K 分辨率下,NB2 的单张生成成本约 $0.067,相比 Pro 的 $0.134 几乎砍半;4K 分辨率约 $0.151,较 Pro 节省近 40%。Batch 模式(异步处理,24 小时内交付)在此基础上再打对折。文本 token 的输入输出价格也较 Pro 低了约 75%。

把这些动作放在一起看:Google 的意图不在发布一个供用户挑选的新工具,而是在把图像生成能力以尽可能低的摩擦嵌入其所有产品。当 NB2 成为 Search、Ads、Flow 的默认引擎时,大量用户甚至不需要主动选择就已经在使用它。对开发者而言,大幅下降的 API 成本让大规模调用成为现实。
NB2 的竞争策略不完全是在图像模型的维度上对标竞品,而是利用 Google 的分发优势和生态整合能力,让图像生成渗透到用户的日常工作流里。
对手在卷画质,Google 在卷覆盖
Nano Banana 2 并非在真空中发布。前段时间阿里 Qwen 团队推出了 Qwen-Image-2.0,一个 70 亿参数的图像模型,社区评价认为其质量已接近 Nano Banana Pro。虽然权重尚未公开,但前代 Qwen-Image 系列均以 Apache 2.0 协议开源,社区普遍预期 2.0 也会跟进,届时企业就可以在自己的基础设施上运行,无需按张付费。
Qwen 不是个例。去年 11 月,由 Stable Diffusion 原班人马创立的 Black Forest Labs 发布了 FLUX.2 系列,其最高配置 FLUX.2 [ max ] 拥有 320 亿参数,同样集成了语言模型推理和联网搜索能力,直接对标 Nano Banana Pro。字节跳动也在今年 2 月推出了 Seedream 5.0 Lite,同样具备联网搜索和推理生图能力,并已嵌入剪映和 CapCut,走的也是能力内嵌到现有产品的路线。
加上此前各家陆续释出的图像模型,这个赛道上的替代方案正在迅速丰富起来,在文字渲染、风格控制、编辑能力等不同维度上各有所长。
NB2 的回应方式并不是单纯的质量碾压。来自 The Decoder 的早期实测显示,在一个包含马骑人的复杂反常识 prompt 测试中,NB2 成功完成了任务,此前只有 Pro 版本能稳定做到。但评测者也指出,Pro 在整体画面的真实感和动态感上仍然优于 NB2,后者在某些场景下还有一种略显人工的质感。

上:NB2 下:NBPro
Google 显然也清楚这一点,否则没有必要继续为付费用户保留 Pro 选项。NB2 的竞争策略更准确地说是,用 Flash 级的成本提供 " 足够好 " 的质量,然后靠 Google 的分发网络在规模上取胜。这和开源阵营追求的在自有基础设施上运行最好的模型形成了两条完全不同的路径。
在安全标记方面,所有 NB2 生成的图像都将携带 SynthID 水印,并支持 C2PA Content Credentials 标准。Google 称自去年 11 月上线 SynthID 验证功能以来,该功能已被使用超过 2000 万次。
半年时间,Google 把 Nano Banana 从一个病毒传播的实验功能推进到了覆盖核心产品线的默认能力。当 AI 图像生成的成本不断趋近于零、质量趋近于足够好,Google 没有选择在模型竞赛中争夺每一个百分点的画质优势,而是把这个能力做成水电一样的东西,默认开启,随处可用。对于 Google 来说,Nano Banana 系列真正的产品不是图像模型本身,而是 " 让十亿级用户在不知不觉中开始使用 AI 图像生成 " 这件事。




登录后才可以发布评论哦
打开小程序可以发布评论哦