狂奔20天，全网“追赶”Sora2

文 | 定焦 One，作者 | 陈丹，编辑 | 魏佳

Sora2 的发布，再次搅动了全球人工智能行业的神经。

9 月 30 日，OpenAI 正式推出其视频生成模型的重大升级版本—— Sora2，以及基于该模型的社交应用 Sora App。与前一代相比，Sora2 在物理模拟的精确度、画面逼真度和生成可控性上显著提升，并实现了音频与人物对话的同步生成。这不仅让 AI 视频更 " 像真的 "，也让视频生产 " 像写字 " 一样简单。

短短五天，Sora App 下载量便突破百万次；应用分析机构 App Figures 数据显示，其首周 iOS 下载量达 62.7 万次，高于 ChatGPT 首周的 60.6 万次。尽管 Sora App 仍处 " 仅限邀请 " 阶段，但它的下载量增速超过了当年的 ChatGPT。有观点称其为 AI 版的 "TikTok"，被寄望成为下一个全球现象级应用。

在国内，Sora2 同样掀起热潮。国庆期间，OpenAI CEO 萨姆 · 奥特曼成为社交媒体上流量担当。他开放了个人肖像权，点燃了网友们的创作热情，其数字分身从商店偷 GPU 被抓包、与李小龙对打。这些病毒式传播的短视频，也加速了 Sora2 的出圈。

除了用户端，Sora2 的发布也让行业按下了加速键。大厂加速产品迭代，10 月 15 日，百度宣布旗下视频生成模型百度蒸汽机再次升级，支持 AI 长视频实时交互生成；次日，谷歌发布视频模型 Veo3.1 与 Veo3.1Fast，主打更丰富的音频、更强的叙事控制和真实感。与此同时，创业团队也在全力冲刺。多位 AI 视频的创业者向「定焦 One」透露，他们最近一直在加班，两位创业者甚至只有在深夜才有时间接通电话。

如今，公众热度已趋平稳，但在 AI 行业内部，一场静悄悄的技术竞赛，正在全速展开。

追赶 Sora2 的人

仿佛一声发令枪，Sora2 让 AI 视频领域进入 " 超级加速 " 阶段。

国庆假期刚过，社交媒体上便传出消息：快手 AI 团队假期 8 天无休，全力追赶 Sora2 的技术进度。

主攻 AIGC 创作的纪录片、广告片导演丁一向「定焦 One」透露，据他了解到的情况，几乎所有国内 AI 视频创业团队都已进入 " 全员加班 " 状态。他预测，不出两个月，国产版 Sora2 类产品可能就会出现，" 所有的大厂、模型厂商都卷起来了 "。

好耶科技创始人吴杰茜也证实了这种紧迫氛围，其团队同样连轴工作，对 Sora2 进行测试、拆解。她的创业项目 FilmAction 是一个 AI 电影生成平台，与 Sora2 在功能上有不少重叠。Sora2 的横空出世，让她既兴奋又有压力——兴奋于技术的天花板被再次抬高，焦虑于行业的迭代速度超出了所有人的想象。

Sora2 发布仅半个月后，谷歌于 10 月 16 日推出 Veo3.1 与 Veo3.1Fast，被普遍解读为正面迎战 OpenAI 的举措。

同一天，OpenAI 也宣布 Sora2 两项升级：Pro 用户现可通过网页端使用 " 故事板 " 功能，同时全平台视频生成时长获得提升。普通用户可在 App 及网页生成 15 秒视频，Pro 用户网页端更支持生成 25 秒内容，较此前标准版 10 秒、Pro 版 15 秒的设定显著延长。

" 这像极了 ChatGPT 刚出现时的那一刻，" 吴杰茜说，" 所有人都在拼命追赶。"

综合多位从业者的说法，Sora2 的震撼来自于三个层面的技术突破：

首先，是物理世界的拟真突破。Sora2 能精准模拟水流、光影、重力与碰撞效果，甚至处理浮力与重心转移等复杂物理场景，极大提升了人物动作的连贯性与主体稳定性。

其次，是多模态融合。Sora2 可直接生成同步音频，自动匹配环境声、动作音效与多语言对白。在此之前，只有少数几个软件有此功能，但音质差不说，人物的语音和口型往往也不匹配。丁一团队还试着用不同的方言对 Sora2 进行测试，口音自然，口型精准，足见其技术成熟度。

Sora2 真正的颠覆，并非仅是生成视频的 " 以假乱真 "，而在于它理解了 " 镜头语言 "。

吴杰茜的测试印证了这一点：她将小说或剧本原文直接输入 Sora2，生成的视频不仅画面与文本高度契合，其镜头运用、节奏把控等视听语言，更是达到了专业创作者的水准。

要知道，在 Sora2 出现之前，AI 视频创作始终受制于 " 镜头思维缺失 "。过去，创作者需先手动拆解剧本，反复琢磨镜头衔接逻辑、人物视角选择、场景转换方式，耗费大量时间。市面上多数 AI 工具也只能生成单个简单镜头，若想串联成连续叙事，还需用户具备专业的视听语言知识与分镜设计能力，门槛并不低。

Sora2 打破了这一局限：用户只需一句话的文本指令，它便能自动生成包含多镜头切换、剧情连贯推进的完整视频。换句话说，Sora2 不再是单纯的 " 画面生成工具 "，而是初步具备了导演的叙事逻辑与剪辑师的镜头调度能力。

" 如果把 Sora2 比作一位剪辑师，那么他的能力已经超越了市场上 95% 的人。" 在丁一看来，其他 AI 视频软件目前还只是辅助工具，但 Sora2 一定程度上已经具备 " 智能体 " 的雏形。

创作门槛坍塌：AI 正在重写 " 专业 "

但技术狂奔的另一面，是行业秩序的松动。当 AI 视频进入 " 后 Sora 时代 "，最先感到震动的，往往是那些曾依靠专业壁垒生存的人。

" 既兴奋又焦虑。" 丁一如此总结 Sora2 发布二十天来的心情。

他的团队是首批测试用户，结果 Sora2 几乎立刻改变了他们的工作方式。在现在丁一团队的工作流程中，Sora2 已经深度嵌入，承担了很多前期的筹备工作，比如说分镜头的设计。注册四五个账号，可以快速的生成大量方案，并从中抽取最满意者。效率比人工快太多，而且质量也不差，包括视频概念、气氛、镜头运动方式这些因素都在其中。

Sora2 一句话便能生成 15 秒成片，这意味着他们团队平时接的一些便宜的商单，基本上没有了技术门槛。他告诉「定焦 One」，目前 Youtube 上的一些小推流广告，已经在使用 Sora2 生成。

另一位创作者等登等噔（以下简称 " 等登 "）也受到了震动。

在最新的一支短片中，他用 Sora2 完成几个分镜头的构思：先上传参考图片，再用文字描述故事背景与情节，Sora2 便能自动生成包含 3-4 个分镜头的视频，完整呈现剧情。而且据他测算，平均操作 3 次就能得到符合预期的版本，" 抽卡率 " 远高于其他软件。

技术进步带来的创作便捷性让他感叹不已，但兴奋过后，等登心中也有一丝不安：分镜设计曾是专业创作者与普通用户的分水岭，但 Sora2 正在抹平这个门槛。

等登告诉「定焦 One」，在 Sora2 出现之前，还没有哪个软件是支持分镜头自动生成，部分软件可以做到一些简单的分镜头，但还是需要使用者明确的提示词，比如第一个镜头是什么、第二个镜头是什么，然后它会在十秒内给出一个分镜头的组合。

Sora2 可以直接生成一个动态视频。比如有网友将归有光的《项脊轩志》最后一句输给 Sora2，生成的视频第一个镜头是归有光和枇杷树的特写，第二个镜头是归有光与妻子种植枇杷树的回忆，回忆镜头与归有光睹树思人的镜头来回切换。在这个视频里机位、角度以及镜头的切换 AI 都已经设计好了。

在 AI 时代，由于技术进步，带来的专业壁垒的消解，可能是很多人都需要面对的课题。

AI 导演、AI 分镜师等新职业原本是 AIGC 带来的新红利，但随着 Sora2 具备 " 理解剧本 " 的能力，这些岗位或许也会被再次淘汰。

丁一对此感触尤深。

他入行时也是一名分镜师，后来进入导演组、成为执行导演，最终一步步做到导演。过去只要精通一项工具——哪怕是 Photoshop，就能找到工作。而现在，纯技术岗位的空间越来越小。今年早些时候，他拍的一个实验性质短片试图找过一些分镜师，但最后只能不了了之，因为 " 效率太慢了、沟通成本也很高 "。

焦虑之后，他也开始调整心态。最起码从现阶段来看，AI 生成的内容最终成果还是需要人的把关，个人的经验、审美、判断都会对最终的结果产生影响。丁一相信，未来人类的工具就是交互式的 AI，就像现在的笔和键盘一样，但最终比拼的仍旧是内容和创意。

英伟达 CEO 黄仁勋曾对媒体说：" 如果世界没有新的创意，AI 的生产力提升终将转化为失业。" 在 Sora2 带来的剧烈震荡中，这句话显得格外应景。

从 " 技术奇观 " 到现实考题

在 AI 应用层出不穷的时代，爆红与冷却往往只隔几天。很多人也在观望，Sora2 是否只是 " 昙花一现 "。

从热度来看，Sora2 的确已经降温。

微信指数和百度指数显示，Sora2 在国内热度高峰仅维持数日后迅速回落。等登认为，一方面国内用户无法直接访问 Sora2，另一方面清晰度与水印限制也让创作者难以商用，从而削弱了话题度。

Sora2 近 30 天微信指数走势截图

吴杰茜则指出，作为新闻事件，它注定会降温；但作为新的创作工具，它的普及才刚开始。

从前景上看，东莞证券的研报也佐证了这一观点，认为 Sora2 及其配套社交应用的发布，标志着 AI 视频生成与社交互动进入融合阶段，" 有望重塑内容创作和分发生态，或迎来 AI 视频生成的 ChatGPT 时刻。"

回顾语言模型的发展史，ChatGPT 的出现是 AI 从实验室走向大众的决定性转折点。从这个意义上讲，Sora2 也标志着视频生成领域的一个关键拐点——即从技术尝鲜迈向普遍应用。

但类似 Sora2 这样的产品要想成为全民表达的工具，需要克服的不仅仅是技术难题。

首先是版权的迷雾。Sora2 初期采取的 " 选择退出 ( Opt-out ) " 机制，默认可以使用互联网公开内容训练模型，将维权举证责任推给版权方。这种做法迅速招致了好莱坞经纪公司、美国电影协会乃至日本政府的强烈抵制和法律威胁。

面对集体施压，OpenAI 迅速调整了策略，奥特曼宣布放弃 Opt-out，转而采用更审慎的 " 主动同意 ( Opt-in ) " 模式，即需版权方签署明确授权协议才能使用其 IP。奥特曼还建议引入 IP 分成收益机制，与授权方共享平台收入。

有律师认为，OpenAI 的这一机制将矛盾从法律博弈转向商业合作。尽管仍有局限，但它预示 AI 行业正迈向付费许可与生态共建的新阶段。一位好莱坞制片人的评论颇具代表性：" 未来的影视公司，其运营模式可能更趋近于版权管理机构，而非传统的内容制造者——这一趋势几乎无可避免。"

其次是变现模式的拷问。目前 Sora2 的主要使用场景仍以娱乐为主，如生成趣味视频或表情包。这类低价值、高频交互难以支撑庞大的模型训练与运维成本。未来，专业用户或高质量内容创作者的 " 付费模式 " 或将成为主流。如何在广告变现与用户体验之间取得平衡，仍是所有 AI 视频厂商的共同考题。

这些现实的疑问和战略调整，勾勒出 AI 视频行业从 " 野蛮生长 " 转向 " 理性发展 " 的轨迹。

用丁一的话说，随着 Sora2 的出现，全球 AI 视频赛道正迈向更高维的竞争阶段。各家模型厂商 " 卷 " 得更深，训练数据涵盖影视、动漫、广告、纪录片等多种素材，"AI 正在学习全人类的影像史 "，而当技术卷到极致，拼的将不再是算法，而是创意与落地能力。"

Sora2 发布二十天后，世界或许并未立刻改变。但在每个 AI 视频创作者的电脑上，故事的生成方式，已经悄然不同。

宙世代

一起剪

相关标签