
继 Gemini 3 Pro 上线后,当地时间 11 月 20 日,谷歌紧接着就宣布推出 Nano Banana Pro。这款图像生成和编辑模型的官方名称为 Gemini 3 Pro Image,但其广为流传的昵称 "Nano Banana Pro" 得以保留。
Nano Banana Pro 基于最新发布的 Gemini 3 Pro 模型构建,充分利用了该基础模型最先进的推理能力和现实世界知识,旨在以前所未有的方式将信息可视化。
作为对数月前发布的原始 Nano Banana(Gemini 2.5 Flash Image)的全面升级,Nano Banana Pro 不仅继承了旧模型在修复旧照片和生成微型模型方面的优势,更在控制力、文本渲染及世界知识融合方面实现大幅提升,赋能创作者将构想转化为影棚品质的设计。
01 超越创作,赋能思考:以 " 视觉推理 " 重新定义 AI 图像生成
Nano Banana Pro 的设计目标是帮助用户将任何想法可视化,并实现从原型设计到数据信息图表化,再到将手写笔记转换为图表的广泛应用。
谷歌首席执行官桑达尔 · 皮查伊称 Nano Banana Pro 是谷歌 AI 迈向 " 创意伙伴 " 的关键一步。他指出,其核心突破在于强大的推理能力,能像工程师一样理解并可视化复杂逻辑,而不仅仅是生成图片。

其主要功能亮点包括:
1. 基于增强的推理能力、世界知识和实时信息,生成更准确、上下文更丰富的视觉效果
借助 Gemini 3 Pro 的高级推理能力,Nano Banana Pro 不仅能生成精美的图像,还能帮助用户创作更具实用性的内容。用户可以获取准确的教育讲解图,或基于提供的上下文及现实世界事实生成信息图和图表。
Nano Banana Pro 还能连接到谷歌搜索的庞大知识库,快速生成食谱概览或可视化天气、体育等实时信息。
示例说明:
1)植物信息图: 用户可提示模型生成关于常见室内植物 "String of Turtles"(海龟串椒草)的信息图,模型将包含其起源、养护要点和生长模式等准确信息,形成专业且易懂的植物介绍图。

2)食谱可视化: 通过提示制作 " 豆蔻茶 " 的信息图,Nano Banana Pro 能够清晰展示制作步骤,有效可视化食谱并融入现实世界中的烹饪知识。

3)实时天气信息图: 模型能够通过搜索功能引入实时天气数据,并将其以波普艺术风格呈现为漫画风格的天气信息图,兼具实用性与艺术性。

2. 通过直接在图像中生成更准确、更清晰的多种语言文本,创造更好的视觉效果
Nano Banana Pro 在图像中正确渲染清晰可读的文本方面表现卓越,无论是短标语还是长段落。Gemini 3 Pro 对深度和细微差异的理解,为图像编辑和文本处理带来了无限可能。
用户可以在模型图或海报中创建更详细的文本,并利用更广泛的纹理、字体和书法风格。借助 Gemini 增强的多语言推理能力,模型能用多种语言生成文本,实现内容本地化和翻译。
示例说明:
1)电影故事板: 用户只需提示 " 为此场景创建一个故事板 ",模型即可生成黑白草图,展示电影场景的远景、中景、特写和主观视角镜头,并清晰标注文字说明。

2)文字融入建筑: 提示模型以柏林街景为背景,将 "BERLIN" 一词巧妙融入建筑立面,模型能以蓝色、红色、白色和黑色的块状字母形式展现,且建筑形态保持自然。

3)表达性文字标志: 用户可提示制作 8 个极简标志,让文字通过视觉传达其含义,如 "Crash, whoosh" 等词语,模型将生成受意义启发的书法,展示富有纹理和字体的表现力文本。

4)多语言翻译: 提示将 " 三个黄蓝相间罐子上的所有英文文本翻译成韩文 ",模型能准确渲染韩文文本,同时保持罐子及其他元素不变,适用于国际营销场景。

5)复古排版设计:模型能够根据详细描述,生成具有复古丝网印刷纹理的 "TYPOGRAPHY" 平面设计,字母粗壮、块状且高度压缩,通过亮蓝色和热粉色重叠层创造 3D 效果。

6)创意文本融合: 通过提示将短语 "How much wood would a woodchuck chuck if a woodchuck could chuck wood" 由土拨鼠扔出的木头制成,模型将文本与劈木场景创意融合。

3. 通过升级的创意能力创建高保真视觉效果
● 保持设计一致性: Nano Banana Pro 能够融合更多元素,最多可使用 14 张图像,并保持最多 5 个人物的一致性和相似性。这使得将草图转化为产品原型、蓝图转化为逼真 3D 结构成为可能。用户可以轻松将期望的视觉外观应用于模型图,确保品牌在各触点上的无缝一致性。
示例说明:
1)复杂场景中人物一致性: 提示生成 "14 个毛绒角色挤在一起看电视 " 的场景,模型能在复杂构图中保持所有毛绒角色的一致性,同时营造温暖、舒适的氛围。

2)多元素组合: 用户可将礼服、植物和椅子的图像组合为一幅图像,通过提示将模特身上的裙子替换为提供的礼服图像,模型能有序安排元素以打造生活场景。

3)超现实景观创作:通过组合多个输入图像,模型能够创造出超现实的未来主义日落景观。

4)时尚社论风格照片: 提示将五个人和一只狗融入沙漠景观中的时尚社论风格照片,模型能保持所有人物及狗的身份一致性,并以不同角度和距离自然融入场景,光线和色彩亦保持和谐。

● 影棚级创意控制: Nano Banana Pro 提供高级创意控制功能,用户可通过改进的局部编辑功能,选择、优化和变换图像的任意部分。这包括调整摄像机角度、改变焦点、应用复杂的色彩分级,甚至变换场景照明(例如,将白天变为夜晚,或创建散景效果)。支持多种宽高比以及 2K 和 4K 分辨率,确保创作成果适用于从社交媒体到印刷的广泛平台。
示例说明:
1)宽高比调整: 通过减少背景将宽高比改为 1:1,角色保持原位不变,从而改变图像外观以适应不同平台。

2)场景照明控制: 提示将雪地里的狐狸场景变为夜晚,模型能应用照明和焦点控制,将白天场景转变为夜晚效果。

3)局部光线调整:提示生成一张具有强烈明暗对比效果的图像,仅照亮男子面部眼睛和颧骨,面部其余部分处于深暗阴影中,实现特定的戏剧效果。

4)景深调整: 提示 " 聚焦在花朵上 ",模型能通过调整景深,将焦点从花田中的女子转移到前景的花朵上,突出细节。

02 全面登陆谷歌生态,为各类用户重塑 AI 视觉工作流
Nano Banana Pro 已于今日开始逐步推出,用户可在谷歌的多项产品和服务中体验:
消费者和学生:在全球范围内的 Gemini 应用中,选择 " 创建图像 " 并使用 " 思考 "(Gemini 3 Pro)模型即可使用。免费层用户将获得有限配额,之后可使用原始 Nano Banana 模型。Google AI Plus、Pro 和 Ultra 订阅用户将享有更高的配额。在美国地区,Nano Banana Pro 在谷歌搜索的 AI 模式中对 Google AI Pro 和 Ultra 订阅者开放。NotebookLM 也面向全球订阅者提供此功能。
专业人士: Google Ads 中的图像生成功能已升级至 Nano Banana Pro。它也将逐步向 Workspace 客户在 Google Slides 和 Vids 中推出。
开发者和企业:在 Nano Banana Pro 开始逐步登陆 Gemini API 和 Google AI Studio,并在 Google Antigravity 中用于创建 UX 布局和模型图。企业可立即在 Vertex AI 中规模化创作,并将很快登陆 Gemini Enterprise。
创意人士:在谷歌的 AI 电影制作工具 Flow 中,Nano Banana Pro 将逐步向 Google AI Ultra 订阅者推出,为创意人士、电影制作人和营销人员提供对画面和场景的更高精度和控制力。
03 构建可信 AI 生态:谷歌推出双重水印策略,坚守负责任部署承诺
Google DeepMind 强调了 AI 内容透明度的重要性。所有由谷歌工具生成的内容都将嵌入其不可感知的 SynthID 数字水印。
同时,谷歌还推出了一项验证工具:用户现在可以将图像上传到 Gemini 应用,直接询问其是否由 Google AI 生成,此功能得益于 SynthID 技术,并将很快扩展到音频和视频。

为便于识别,免费和 Google AI Pro 层用户生成的图像将保留可见水印。同时,考虑到专业工作对视觉洁净度的需求,Google AI Ultra 订阅者和 Google AI Studio 开发者工具生成的图像将移除可见水印。此举与行业对内容真实性的关注相符,TikTok 也表示将使用 C2PA 元数据 AI 生成内容进行隐形水印标记。
Google DeepMind 产品经理 Naina Raisinghani 表示,Nano Banana Pro 赋能了普通创作者表达他们的创造力,代表了图像编辑领域的重大进步。此次发布,不仅提升了谷歌在生成式 AI 领域的竞争力,也重申了其在推动 AI 技术发展的同时,致力于负责任地部署 AI 产品的承诺。
04 网友点评
宾夕法尼亚大学沃顿商学院教授、生成式 AI 实验室联合主任伊桑 · 莫利克评论道,这款模型之所以引人瞩目,正是因为它实现了从 " 执行指令 " 到 " 理解意图 " 的跨越。

其他网友对 Nano Banana Pro 的表现可以说是赞不绝口,这位称其无疑是当前图像生成领域的标杆。它不仅能够精准执行复杂指令,更具备卓越的推理能力。

Nano Banana Pro 被网友誉为 " 地球上最具电影感的 AI 模型 ",或将重塑好莱坞!

还有网友被 Nano Banana Pro 炸裂的中文生成能力感到震撼!

(文 / 腾讯科技特约编译金鹿,编辑 / 郝博阳)


