
现在无论哪一家要发布视频模型,都免不了要被拉来和 Seedance 2.0 对比。
而最近比较沉寂的 Google,似乎在悄悄憋一个大招,来重夺视频生成的王座。
今天凌晨,有网友在 Gemini 中意外触发了一个全新的视频生成模型—— Omni(全能)。
在 Gemini 的聊天页面,直接显示着「用 Gemini Omni 来创作,认识一下我们全新的视频生成模型。重混你的视频、在对话中直接进行编辑、尝试丰富的模板,以及更多功能。」

▲得到意外访问的 Gemini 截图
不过,这位网友表示他再次打开 Gemini 应用时,不仅 Omni 功能没了,Gemini 界面也恢复到了旧版。
从目前泄露的初测结果来看,Gemini Omni 在某些场景下的表现,相当出色,很有当年 Nano Banana 一统图片生成的感觉。
曝光的两个测试案例里,就像 Nano Banana 解决文本渲染一样,Gemini Omni 也解决了此前 AI 视频生成的两个痛点:文本连贯性和人物进食的物理逻辑。

▲ 视频来源:X@chetaslua|提示词:A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.
这个挑战复杂数学板书的 10s 视频,提示词只有一句话「一位教授在传统的黑板上写出三角恒等式的数学证明,并解释他目前在方程式中执行的步骤。」
尽管在画面中依然能找到一些 AI 生成的小破绽,但整个视频完美处理好了黑板上的「文本」内容,这是曾经很多视频模型的一个大 Bug,此外,视频整体的真实感也非常强。
网友们对这个视频的态度是「太疯狂了」,AI 超创博主 @Azed_ai 也在爆料视频下留言,「如果这是实际输出,那么文本一致性确实令人难以置信。」

▲ 视频文件链接:https://gemini.google.com/share/7d5dc678c80a
有网友质疑这个视频的来源,可能并不是由 Gemini Omni 生成的,爆料的博主直接放上了 Gemini 的官方链接。
我们把同样的提示词丢给 Seedance 2.0 进行测试,画面的真实感同样可圈可点,但是板书的内容,似乎和三角恒等式的关系不是很大,黑板上的一些文字渲染还是有问题。

▲由 Seedance 2.0 生成
另一个爆料的视频是致敬「威尔 · 史密斯吃意大利面」,这个测试案例几乎成了所有视频生成模型的必跑提示词之一。

▲ 来源:Reddit@Zacatac_391|提示词:Can you create a scene with two men at a table seaside at an upscale restaurant on outdoor deck seating. They are at a circular table with a nice white table cloth, and all of the fancy accessories, all the spoons forks and knives, fancy napkins, centerpiece. One man is Distinguished: A mature African-American man in his 50s with a short beard and confident posture, wearing a tailored, sophisticated suit, the other is is friend, both approaching the table to eat a plate of spaghetti. In the beginning the men approach the table, exchange brief niceties, and begin to eat the spaghetti calmly In between bites sharing conversation.
获得提前访问的测试者表示,当他尝试输入威尔 · 史密斯意大利面测试时,被 Google 的内容生成护栏限制了,所以他描述了一个长相酷似威尔 · 史密斯的人。
Gemini Omni 生成的这个视频,虽然比 Google 自家的视频生成模型 Veo 3.1 更好,从声音和画面真实质量上,都更像真人视频。
但也有网友发现,他们站着的时候,盘子里没有意大利面,但是坐下来之后就有了,紧接着是吃的时候,根本没吃,意大利面就没了。
我们同样把这套提示词交给 Seedance 处理,在吃的时候,结果比 Gemini Omni 的表现要自然不少。

▲ 由 Seedance 2.0 生成|提示词:你能想象两个男人在海边一家高档餐厅的露天餐桌旁用餐的场景吗?他们围坐在铺着洁白桌布的圆桌旁,桌上摆放着各种精致的餐具,包括勺子、叉子、刀叉、漂亮的餐巾和中心装饰品。其中一位男士风度翩翩:一位五十多岁、成熟稳重的非裔美国男士,留着短须,身着剪裁合身的精致西装,姿态自信。另一位是他的朋友,两人都来到桌边,准备享用一盘意大利面。一开始,两人走到桌边,简单地寒暄了几句,然后开始平静地吃意大利面,并不时地闲聊几句。
在 Reddit 上有网友质疑他是否有用过最新的视频生成模型,这位测试博主表示他用过最好的是 Kling 3.0。
网友回复他说,Seedance 2.0 要比 Kling 3.0 好上不少,所以 Gemini Omni 的表现对我(用过 Seedance 2.0 的人)来说一点都不惊讶。
而在 X 上,也有网友认为 Gemini Omni 的表现,要比 Seedance 2.0 更好。

▲ X 上不少网友转发这些爆料视频,表示效果要胜过 Seedance
更让人意外的时候,Google 这次不只是推出视频生成的功能,Gemini Omni 还支持视频的编辑功能。
像是可以把原视频中的意大利面,直接替换成一碗像是冬阴功的泰式风味汤。

还能把之前 Sora 生成的带水印视频,直接编辑为去掉水印。


▲视频来源:X@Waguri_Kaoruko8
从测试结果来看,Gemini Omni 成功地把原 Sora 视频中,持续移动的 Sora 水印去掉了,并保持和原视频基本一致。
还有网友测试了 Gemini Omni 在动漫视频生成上的表现。

和初代的 Nano Banana 主打图片编辑,让我们制作各种桌面手办一样。不少人也认为 Gemini Omni 也会走这样的路,视频生成能力较差,但视频编辑能力会更强,要等到 Gemini Omni 3 代,可能视频生成能力才是最好的。
在曝光的界面中,还出现了一个使用量(Usage)截图。数据显示,仅仅生成了数学板书和吃面两个视频,就耗费了该用户 AI Pro 订阅计划每日额度的 86%,他提到自己当天只是使用过一些 Gemini Flash。

AI 视频显然还是一门相当烧钱的生意,但只要效果足够好,买单的人不会少。
这段时间,一些 AI 视频在网络上爆火,不仅有更长的时长、更真实的场景、对话、演技、故事性都比去年爆火的那些 AI 视频要强。
视频生成平台 Runway 的技术美术师 Marko Slavnic 在 X 上发一了段用 Runway 制作的的鸽子视频,Runway 上可以使用 Seedance 2.0 模型,视频很快就获得了百万次浏览。
有网友说,这段 47s 的视频完全没发现任何 AI 的痕迹或不自然的动作,迪士尼动画可能真的需要警惕了。

▲ 视频来源:X@Markoslavnic
还有之前在微博热搜上的话题「AI 短片 量产爱死机」,视频被转载到外网后,也直接冲到了 1200 万次观看。
转发这个视频的是一位生成式 AI 视频与广告领域的创作者,同时也是一家 AI 广告公司的创始人 PJ Ace。他直接说,
这是我近年来看过最好的短片之一。
很快,我们将不再称其为「AI 电影」,而直接称其为电影。

▲ 视频来源:X@PJaccetturo
而在原视频的 B 站评论区里,也有网友提到视频非常火,不仅有国外的 PJ Ace 想发 Offer,也有广州的 AI+ 创作团队向他伸出了橄榄枝。
对视频的好评也是毫不吝啬地表达,「这是预告片我会去电影院」、「一流的作品,色彩、构图、剧情都无可挑剔,除了时长稍短,放在任何一季爱死机里都不突兀。」、「几年前这要一个顶级团队花费几个月几百万做出来」……

▲ 视频来源:【Ai 原创短片《丧尸清道夫》- 重制版,国产 " 爱死机 "!】https://www.bilibili.com/video/BV1FFRQB2Eqw/
和以前每月推荐几部电影一样,现在也有网友开始总结「本月四部不容错过的 AI 短片」。

除了那些被诟病为是 AI Slop 的内容,随着生成质量的提升,AI 视频开始成为主流的媒介是无法避免的趋势。
Google 此次曝光的 Gemini Omni 或许也是为了给下周即将举行的 Google I/O 大会造势,如果能在今年的大会上,看到 Gemini Omni 开放,新的 AI 视频生成下半场又将开启。


登录后才可以发布评论哦
打开小程序可以发布评论哦