量子位 3小时前
Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

谷歌乘胜追击!Gemini 3 Pro 好评如潮没两天,最强文生图模型 Nano Banana 也推出 Pro 版本。

自推出以来还未被任何人追赶上,谷歌自己就给他升级了,真是不让其他家喘口气。

这次不仅仅是提升图像生成质量。

这次 Nano Banana Pro 又名 Gemini 3 Pro Image,整合了 Gemini 3 Pro 的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。

比如生成一张自行车维修保养注意事项海报。

招牌技能多个图片混合,这次最多支持 14 张输入图片,全都能保持一致性,多个人物角色和复杂场景也不惧。

此外还在 Nano Banana 基础上强化了文本渲染,结合多模态理解能力,可以直接把图片中的英文文字翻译成韩文、中文或其他语言,同时保持原有的设计风格不变。

谷歌这番操作秀翻全网:

Nano Banana Pro 让人感觉 AI 图像创作一夜间迈入了新阶段。

从创意到生产的完整工作流

Nano Banana Pro 最引人注目的技术进步体现在几个方面。

首先是文字渲染能力的大幅提升,不仅能在图像中准确生成清晰可读的文字、艺术字,还支持多种语言的直接渲染。

营销团队可以用它快速设计生成营销素材,实现创意快速迭代:

这项功能的背后是 Gemini 3 Pro 的强大推理能力。模型不仅理解图像内容,还能理解文字的语义上下文,这让它能够在保持原始艺术风格和布局的同时,准确地进行语言转换。

另一个重大突破是模型与 Google Search 的深度集成。

这不是简单的搜索功能,而是让模型能够基于谷歌搜索庞大知识库、实时信息生成准确的图表、地图和信息图。

比如你要制作一份关于印度奶茶的食谱图解,模型不仅能生成美观的步骤图,还能确保配料比例和制作步骤的准确性。

还可以升级美化原本简约的 PPT 页面,就像这款小沙发椅,从原料、生产到运输的全流程,它可以自动在地图上清晰标示说明:

Gemini 3 高级推理加持下,生成的针对性强、专业的信息图,可以帮助用户快速将复杂知识可视化。

比如创建一个胰岛素 - 葡萄糖反馈回路的解释图。

最终生成结果遵循提示词用箭头显示胰腺(β / α 细胞)、肝脏与血液之间的通信方向,清楚标注了高葡萄糖和低葡萄糖状态:

创建一张关于生态系统中营养级和能量转移的详细信息图,它直接生成了标注着生产者、初级消费者、次级消费者和三级消费者的金字塔,包含 10% 能量转移规则的说明,配有生态系统场景插图:

在分辨率和格式支持上,Nano Banana Pro 支持 2K、4K 高清分辨率,能满足专业制作的要求;支持多种宽高比,从社交媒体的方形图片到电影级的 2.76:1 超宽画幅都能轻松应对。

另外,它还支持自由调整图像的光线、镜头、对焦、色彩调校等物理属性和构图:

比如通过光线和明暗对比重塑画面的视觉逻辑,嗯,这感觉确实不一样了:

指定角色,它还可以快速生成符合某个主题的定制化图片。

例如以雪人为核心角色,聚焦 " 节日庆祝 " 主题,在输入框中输入 "snowman celebrating the holidays doing a variety of festive activities"(雪人庆祝节日,进行各种节日活动)。

紧接着这个雪人就会出现在滑雪缆车、雪地雪橇、宽扎节布置、厨房烤饼干、烛光晚餐等不同场景中。

工作流整合 Veo 3 视频生成模型,还可以一键用刚生成的图当关键帧继续生成视频。

全面铺开:从开发者到普通用户都能用上

谷歌这次的发布策略相当全面,覆盖了从开发者到普通用户的各个层面。

对于普通用户,模型将、通过多个渠道提供。在 Gemini 应用中选择 " 创建图像 " 功能时就能使用,免费用户有限额配额,超出后会回退到原始的 Nano Banana 模型。Google AI Plus、Pro 和 Ultra 订阅用户则享有更高的配额。

对于开发者,Nano Banana Pro 已经通过 Gemini API 在 Google AI Studio 和 Vertex AI 中提供。企业级用户可以享受到预配置吞吐量、按需付费以及高级安全过滤器等功能。

谷歌还在新的 AI 开发平台 Google Antigravity 中集成了这项技术,让编码代理能够直接利用图像生成功能来生成详细的 UI 模型或新的视觉资产。

第三方设计工具如 Adobe Photoshop 和 Figma 也会集成 Nano Banana Pro。

最后,谷歌宣布在 Gemini app 中推出 AI 图像验证功能,依托其 2023 年推出的 SynthID 数字水印技术(给 AI 生成的内容加一层 " 隐形水印 ")。

用户可通过上传图像并提问 " 这是 AI 生成的吗?",确认其是否由谷歌 AI 生成或编辑。

官方表示未来这个功能还将扩展至视频、音频等更多格式及搜索等更多平台。

与此同时,即日起 Gemini app、Vertex AI、Google Ads、Flow 中的 Nano Banana Pro 生成图像中将被嵌入 C2PA 元数据。

换句话说,在这些平台上用 Nano Banana Pro 做出来的图片,都会自带能查来源和创作信息的专属 " 数字档案 "。

官方 Blog:https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

参考链接:

[ 1 ] https://x.com/GoogleDeepMind/status/1991522595129139486

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  快来量子位 MEET2026 智能未来大会,与我们畅聊 AI 吧!

‍张亚勤孙茂松等 AI 行业重磅嘉宾,以及百度京东高通亚马逊等头部 AI 企业已确认出席,RockAI、太初元碁、自变量、小宿科技等业内新秀也将参与分享,还有更多嘉宾即将揭晓  了解详情

  12 月 10 日

北京金茂万丽酒店

,期待与你共论 AI 行业破局之道  

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 nano 技能 物理 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论