壹娱观察 10-14
即梦VS可灵,谁能「对标」Sora2?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

欢迎阅读 "AI 视频 " 系列

《可灵 vs 即梦,决战 AI 短剧》

《即梦 VS 可灵,下一步战火烧向何方?》

文 / 大娱乐家

AI 视频的战争,才刚刚开始。

在生成式 AI 的大航海时代,文字、图像、代码的疆界已相继被重绘,唯独 " 视频 " 这一最复杂、最昂贵、最具传播势能的内容形态,始终处在被技术反复叩门却未彻底攻陷的高地。

这个局面,似乎终于要被 OpenAI 在 10 月 1 日推出的 Sora2 而改变。

图源:网络

如果说今年早些时候的 Sora 只是一次 " 从文本到视频 " 的早期演示,那么 Sora2 则更像是一次内容范式的重塑:它不仅能生成物理一致性更强、镜头语言更成熟的动态画面,还在音画同步、环境声效、人物对白等方面实现了重大突破—— AI 不再只是 " 画面导演 ",而是第一次同时担任了摄影师、编剧、配乐师和演员。

与此同时,OpenAI 还选择将它打包成一个社交平台级产品—— Sora App,而不只是模型本身:创作者可以一键生成视频、上传人像 cameo、Remix 他人作品,甚至像刷 TikTok 一样在流里发现 AI 内容。

Sora App

这也是为何,长期对视频生成持谨慎态度的知名分析师 Ben Thompson 态度大变,称之为 " 一个可能撼动 Meta 和 Tiktok 社交帝国根基的威胁 " —— Sora 不再是技术的展示,而是内容分发逻辑的重塑。

当 AI 不仅能生成视频,还能决定 " 视频如何被观看 "" 创作者如何被推荐 " 时,整个内容平台的生态规则都可能被重写。

面对这股浪潮,中国的科技巨头们自然不会坐视不理。字节跳动的即梦和快手的可灵作为 AI 文生视频工具也已存在多时,并在国内用户增长和产品功能上迅速迭代,正因如此,当 Sora2 引爆话题之时,社交媒体上也传出了大厂国庆连续加班研究的消息。

Sora2 生成视频

于今其所要面对的问题是,在 Sora2 已经将 "AI 生成视频工具 " 升级为 "AI 内容平台 " 的今天,谁能最先在国产赛道上拿出可对标的产品?或许这一次的战略性 " 对标 ",反而能够为其始终未能找到出路的 AI 内容真正解套。

从模型到平台:

Sora2 为何成为 " 现象级产品 "

要理解 Sora2 所引起的轰动效应,必须先认识到它带来的,其实并非单纯意义上 " 视频生成能力 " 的升级,反而是长久以来对于 "AIGC 内容 " 叙事范式的再定义。

首先,Sora2 在内容生产的维度上实现了质变。

它最大的突破在于 " 音画同步 " 和 " 物理一致性 " 的双重跃迁:视频中的光影、重力、碰撞、镜头语言都比前代自然得多,甚至连人物对话、背景音效、情绪氛围都可以自动生成。

这意味着 AI 第一次具备了 " 编导级 " 的综合叙事能力——不仅能 " 画出 " 一个世界,还能 " 让这个世界活起来 "。在传统影视行业,这相当于从一支美术团队变成了一个完整的制作公司。

其次,Sora2 的产品形态本身更具战略意味。

OpenAI 没有让它停留在 "API 模型 " 或 " 开发者工具 " 的层面,而是直接推出了 Sora App,一个具备创作、分发、互动、推荐等功能的 "AI 原生内容平台 "。

这一决策背后是对未来互联网内容生态的深刻洞察:AI 不只是生产力工具,更是平台竞争的新核心。当生成能力与分发逻辑绑定,创作者行为就会被平台设计重新塑造,生态壁垒也将因此建立。

Sora App 截图

接着,Sora2 的 "Cameo" 功能进一步拉近了人与 AI 内容的距离。

用户只需上传一张人像或一段音频,AI 就能在生成的视频中 " 代入 " 你的形象。" 自我投射 " 的能力,使 AI 视频不再只是 " 看 " 的内容,而是 " 参与 " 的内容。这是 " 用户创作行为的彻底重构 " ——它把创作门槛降到零,同时激活了人类最本能的表达欲望。

最后,也是最具产业级意义的一点:Sora2 的社交属性使其从 " 工具 " 变成了 " 平台 "。

它不再仅仅只是一个 AI 文生视频大模型,而是一个内容分发系统;它不只是为创作者服务的 API,而是一个可能吸引数亿用户日活的短视频入口。

可以说正是这一架构使其对 Meta 和 Tiktok 产生了结构性威胁,因为它有潜力从根本上重塑短视频平台的竞争格局——当 " 视频生产 " 本身不再是人的专属能力,平台之间拼的就不再只是内容,而是 " 生成 + 分发 " 的一体化体验。

并且,  OpenAI 可以毫无包袱的去做这件事,毕竟对他们来说,将更具娱乐消费属性的 Sora 与生产力属性更强的 ChatGPT 区隔开来,反而有助于两个平台各自的有效增长。

追兵的机会与困局:

即梦 vs 可灵

如果说 OpenAI 的 Sora2 为全球 AI 视频赛道树立了新的标杆,那么,在中国市场,最有机会追上的,显然是字节跳动的即梦 与快手的可灵。

两者都已经迈出了第一步,但前路各有优势与短板。

从基础能力看,即梦更像是 " 产品派 " 的代表。

它背靠字节的剪映、抖音生态,具备天然的分发入口和用户场景优势。即梦的 Seaweed 模型已经支持文本生成视频、动作模仿、多模态参考等功能,平台内还集成了创作、编辑、分享的完整生产链条。

即梦 AI 制作的短片《权利童话》

字节的强项显然不在于最前沿的模型研发,更多还是依靠产品逻辑做成生态闭环:只要生成质量达到 " 可用 " 水平,就可以借助抖音的流量分发迅速起量。这也是为什么即梦虽然相对后发,却同样能够快速获得大批用户青睐。

它的短板同样明显:目前的即梦在音画同步、物理细节、长时视频一致性上,仍与 Sora2 甚至是可灵存在着差距。更重要的是,抖音如此巨大的体量之下,除非是 AI 视频的确有什么巨大突破,否则很难说服大部分用户必须用即梦来做视频。

可灵的路线则更偏 " 技术派 "。

可灵 AI 生成视频截图

快手从一开始就强调模型层面的突破:在 2.0 版本中,可灵引入了多模态视觉语言(MVL)、多图参考、3D 轨迹控制等技术模块,目标是逐步接近 Sora2 的生成质量。

更重要的是,可灵已具备生成数分钟长视频和复杂镜头语言的能力,并开始探索 " 视频续写 "" 镜头编排 " 等更贴近影视制作的方向。从技术潜力来看,可灵也许比即梦更接近 " 对标产品 " 的目标。

然而,快手需要面对的是生态问题:它的分发能力和创作者生态不如字节庞大,平台对用户生成内容的承载能力相对有限。换句话说,可灵或许能先跑出 " 模型层面的对标 ",但未必能先跑出 " 产品层面的平台 "。

可灵 AI 单元故事集《新世界加载中》

然而,真正制约这场竞争走向的,或许并不是技术,更多还是商业层面的考量。国内 AI 文生视频目前最大的困境在于,依然没有找到真正的商业模式。

根据快手发布的 2025 年第二季度财报显示,可灵 AI 在该季度的营收达到了 2.5 亿元,较去年有了数倍增长,然而,影响的客户其实依然还是专业机构或是自媒体。本质上来说,AI 视频生产工具并不属于大众消费产品。

即便是过去一年被寄予厚望的 "AI 短剧 ",也没有演化出一个足够有规模、有利润的生态系统。多数项目仍然依赖补贴或营销预算驱动,无法自我造血,用户的留存和付费意愿也远未验证。在这种背景下,如果让文生视频作为 " 功能模块 " 嵌入到抖音、快手等主平台之中,便很难成为业务增长的新支点。

用户生成的 AI 短剧

更重要的是,如果让抖音和快手本体直接承担 AI 视频生产的任务,不仅面临注意力被稀释、用户体验受影响的风险,也会引出复杂的伦理与法律问题——例如真人视频与 AI 视频的混杂如何标注、内容责任如何界定、算法推荐是否应区分来源等。

正因如此,从产品形态的角度来看,打造一个 " 只允许 AIGC 视频存在 " 的独立平台,不仅是未来竞争的方向,也可能是行业走向成熟的必要条件。

Sora2 的出现,让 "AI 视频 " 从技术演示变成了行业主战场。它不只是重新定义了 " 内容怎么生产 ",还在重塑内容如何被分发、创作者如何被激发、平台如何被重构。

对于抖音和快手而言,压力同样来源于需要用 AI 产品来和自己原本的内容平台打擂台,这其实是 OpenAI 所不需要考虑的问题,毕竟它只是从零开始去颠覆,才能够如此不管不顾。

这倒是也是为什么按照国内产品 " 对标 " 的能力,原本以为加班一个国庆大概就应该已经有类似产品的 1.0 版本出现,但快两周过去,大家依然还是热火朝天的在讨论 Sora2,却没见到两家大厂的跟进动作。

理论上来看谁愿意先做出真正意义上的 " 国产 Sora2",其实也决定两家公司各自的 AI 战略走向,更重要的是在 AI 创作内容这个层面," 视频 " 始终还是皇冠上的明珠,无法在这一能力上占得一席之地,其实到头来也很难说把 "AI 故事 " 讲完整。

Recommend

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 物理 tiktok 字节跳动 导演
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论