智东西 22小时前
时隔4个月,谷歌Nano Banana再发新模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

智东西

编译 | 杨京丽

编辑 | 李水青

智东西 7 月 1 日消息,今天,谷歌宣布开放两款新模型:图像生成模型Nano Banana 2 Lite和视频生成编辑模型Gemini Omni Flash

谷歌推出 Nano Banana 2 Lite 和 Gemini Omni Flash(图源:X)

今年 2 月,谷歌推出Nano Banana 2,在保持较低延迟的同时提升图像生成质量,支持更强的推理能力和搜索能力。今年 5 月,谷歌在 I/O 大会上首次展示Gemini Omni Flash,定位为原生多模态的视频生成编辑模型,但当时并未向开发者开放。

此次更新的模型 Nano Banana 2 Lite 是初代 Nano Banana 的推荐替代模型,主打实时、较高质量图像生成,单张 1K 分辨率图像生成延迟约 4 秒、价格 0.034 美元(约合人民币 0.23 元)起;Gemini Omni Flash 则首次面向开发者公开预览,支持文本、图像和视频输入,可用自然语言进行多轮视频编辑,目前支持 10 秒视频生成,视频输出价格为每秒 0.10 美元(约合人民币 0.68 元)

评测结果显示,Nano Banana 2 Lite 在图像生成和图像编辑 Elo 分数上略低于 Nano Banana 2,但速度更快,成本更低;Gemini Omni Flash 在视频编辑模型对比中,整体偏好和指令遵循两项 Elo 评分均位列第一,领先 HappyHorse、Kling v3 Pro、Seedance 2.0 等模型

两款模型现已登陆 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform,其中 Gemini Omni Flash 还可在 Gemini app 和 Google Flow 中使用。

此次更新后,用户可以先用 Nano Banana 2 Lite 快速生成图像,再通过Gemini Omni Flash将静态图像转化为可继续编辑的视频内容。谷歌还推出了 Anywhere、Space Lift、Omni Product Studio 等演示应用,展示从自拍换地标、室内设计预览到电商视频生成等图像到视频工作流。

一、Nano Banana 2 Lite 替代初代模型,速度快性价比高

谷歌称,Nano Banana 2 Lite(

gemini-3.1-flash-lite-image)是当前使用初代 Nano Banana(gemini-2.5-flash-image)的推荐替代模型,在图像质量、生成速度和成本等维度都有明显提升。

虽然该模型优先强调速度,谷歌仍称其保留了较稳定的提示词遵循能力、角色一致性和图中文字渲染能力。谷歌列出了 Nano Banana 2、Nano Banana 2 Lite 与多款竞品 AI 图像模型的性能对比,评估维度包括图像生成和图像编辑的 Elo 分数、单张 1K 分辨率图像的生成延迟,以及对应价格。

Nano Banana 2 Lite 与其他图像生成模型评测对比(图源:谷歌)

Nano Banana 2 Lite 图像生成 Elo 分数为 1251,略低于 Nano Banana 2 的 1270,高于 Flux 2 Klein 9B、Grok Imagine Image 和 Seedream v5 Lite 等对照模型;在图像编辑上,Nano Banana 2 Lite 得分为 1308,在对照模型中位列中等水平

速度和成本是 Nano Banana 2 Lite 最突出的优势。生成一张 1K 分辨率图像的延迟约为 4.0 秒,明显快于 Nano Banana、Nano Banana 2 和 Seedream v5 Lite 等模型。价格方面,Nano Banana 2 Lite每张 1K 图像约 0.034 美元(约合人民币 0.23 元)起,成本低于谷歌其他图像模型,价格与 Seedream v5 Lite 的 0.035 美元(约合人民币 0.24 元)接近,高于 Flux 2 Klein 9B、Grok Imagine Image。

为了便于消费者理解 Nano Banana 产品线,谷歌也列出表格在延迟、成本、视觉质量、推理能力四大方面对其模型进行对比。

Nano Banana 系列三款模型对比(图源:谷歌)

(1)Nano Banana 2 Lite(Gemini 3.1 Flash Lite Image)生成速度快,主打近实时、高流量工作流;

(2)Nano Banana 2(Gemini 3.1 Flash Image)为通用型模型,在性能与成本之间取得平衡,以较低延迟维持较高的生成质量;

(3)Nano Banana Pro(Gemini 3 Pro Image)则面向复杂专业场景,强调控制能力和高级推理;

(4)Nano Banana(Gemini 2.5 Flash Image)则被归为旧款模型,建议开发者升级到 Nano Banana 2 Lite,追求更高的质量、更低延迟和更低的成本。

除开发者平台外,Nano Banana 2 Lite 也会进入谷歌消费端产品,包括搜索中的 AI Mode、Gemini 应用、NotebookLM、Google Photos、Stitch、Google Flow 和 Google Ads。

X 上部分网友测试了这一模型,称 Nano Banana 2 Lite 生成质量与 Nano Banana 2 接近,但速度明显更快。

海外网友测试 Nano Banana 2 Lite(图源:X)

二、Gemini Omni Flash 开放公测,支持 10 秒视频生成,每秒 0.10 美元

前段时间,视频生成编辑模型 Gemini Omni Flash 曾在谷歌 I/O 大会上亮相,但尚未开放;此次谷歌正式开启公开预览,用户现在可以通过Gemini API 和 Google AI Studio使用该模型。

Gemini Omni Flash 根据原视频生成魔术特效(图源:谷歌)

该模型把 Gemini 的多模态推理能力与视频生成、编辑能力结合起来,支持从文本、图像和视频输入中生成或编辑视频,并可通过自然语言进行多轮修改。每秒视频输出为 0.10 美元(约合人民币 0.68 元),与 Veo 3.1 Fast 相同。

Gemini Omni Flash 核心能力包括对话式视频编辑、多模态参考输入、调用 Gemini 知识构建视频内容,以及通过提示词让文字、图形和视频动作实现同步。

谷歌列出了 Gemini Omni Flash 与多款竞品视频编辑模型的 Elo 评分对比。无论是整体表现还是指令遵循,Gemini Omni Flash 都具备较高领先优势。

Gemini Omni Flash 与其他视频模型评测对比(图源:谷歌)

从整体偏好看,Gemini Omni Flash 得分为 1087,位列第一,高于 HappyHorse 的 1044、Kling v3 Pro 的 1020、Seedance 2.0 的 946 和 Wan 2.7 的 902。在指令遵循能力上,Gemini Omni Flash 同样排名第一,得分为 1082,领先 HappyHorse 的 1036、Kling v3 Pro 的 1022、Seedance 2.0 的 960 和 Wan 2.7 的 900。

不过,该模型目前仍有限制。谷歌称,Omni Flash 当前支持 10 秒视频生成,后续会推出更长时长;Gemini API 暂不支持上传音频参考和场景扩展;API schema 虽可接受最长 3 秒的视频参考,但模型现阶段还不能正确处理;在切换场景或平移动作时,角色一致性仍有局限。

三、两款模型可串联使用,先快速出图再生成视频

谷歌此次同步更新了图像与视频生成能力,因而用户可以先用 Nano Banana 2 Lite 快速出图,再通过Gemini Omni Flash 将静态图像转化为可继续编辑的视频内容。用户可通过 Interactions API 保留会话历史和上下文,最多可叠加三次连续编辑。

为展示这一路径,谷歌推出了几个演示应用,供用户体验。

Anywhere 应用可以把用户 " 带到 " 世界各地。用户上传照片后,Nano Banana 2 Lite 能将图像背景换成世界知名地标,之后 Gemini Omni Flash 还能把生成的图像变成该地点的动画短片。

Anywhere 根据用户照片生成动态视频(图源:谷歌)

Space Lift 面向室内设计,可根据房间照片,利用 Nano Banana 2 Lite 生成不同装修风格,并利用 Gemini Omni Flash 生成动态展示视频。

Space Lift 根据照片生成房间动态展示视频(图源:谷歌)

Omni Product Studio 则可把 Nano Banana 2 Lite 生成的静态图,用 Gemini Omni Flash 转成电商风格视频。

Omni Product Studio 生成的电商视频(图源:谷歌)

结语:谷歌加速补齐可编辑视频生成能力

此次更新后,谷歌的生成式媒体能力进一步延伸到视频编辑工作流。用户可以先用 Nano Banana 2 Lite 快速生成图像素材,再通过 Gemini Omni Flash 把静态图像转化为可继续修改的视频内容,多轮编辑、提示词同步和多模态参考输入成为这次更新的核心看点。

随着 Nano Banana 系列图像模型进一步分层,谷歌也在把类似思路延伸到视频生成领域。谷歌此次推出视频编辑模型 Gemini Omni Flash,有助于尽快收集应用场景和反馈,并推动图像、视频、自然语言编辑在 Gemini 生态内形成更连贯的创作链路。

来源:谷歌

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 nano google 分辨率
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论