钛媒体 18小时前
狂奔20天,全网“追赶”Sora2
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 定焦 One,作者 | 陈丹,编辑 | 魏佳

Sora2 的发布,再次搅动了全球人工智能行业的神经。

9 月 30 日,OpenAI 正式推出其视频生成模型的重大升级版本—— Sora2,以及基于该模型的社交应用 Sora App。与前一代相比,Sora2 在物理模拟的精确度、画面逼真度和生成可控性上显著提升,并实现了音频与人物对话的同步生成。这不仅让 AI 视频更 " 像真的 ",也让视频生产 " 像写字 " 一样简单。

短短五天,Sora App 下载量便突破百万次;应用分析机构 App Figures 数据显示,其首周 iOS 下载量达 62.7 万次,高于 ChatGPT 首周的 60.6 万次。尽管 Sora App 仍处 " 仅限邀请 " 阶段,但它的下载量增速超过了当年的 ChatGPT。有观点称其为 AI 版的 "TikTok",被寄望成为下一个全球现象级应用。

在国内,Sora2 同样掀起热潮。国庆期间,OpenAI CEO 萨姆 · 奥特曼成为社交媒体上流量担当。他开放了个人肖像权,点燃了网友们的创作热情,其数字分身从商店偷 GPU 被抓包、与李小龙对打。这些病毒式传播的短视频,也加速了 Sora2 的出圈。

除了用户端,Sora2 的发布也让行业按下了加速键。大厂加速产品迭代,10 月 15 日,百度宣布旗下视频生成模型百度蒸汽机再次升级,支持 AI 长视频实时交互生成;次日,谷歌发布视频模型 Veo3.1 与 Veo3.1Fast,主打更丰富的音频、更强的叙事控制和真实感。与此同时,创业团队也在全力冲刺。多位 AI 视频的创业者向「定焦 One」透露,他们最近一直在加班,两位创业者甚至只有在深夜才有时间接通电话。

如今,公众热度已趋平稳,但在 AI 行业内部,一场静悄悄的技术竞赛,正在全速展开。

追赶 Sora2 的人

仿佛一声发令枪,Sora2 让 AI 视频领域进入 " 超级加速 " 阶段。

国庆假期刚过,社交媒体上便传出消息:快手 AI 团队假期 8 天无休,全力追赶 Sora2 的技术进度。

主攻 AIGC 创作的纪录片、广告片导演丁一向「定焦 One」透露,据他了解到的情况,几乎所有国内 AI 视频创业团队都已进入 " 全员加班 " 状态。他预测,不出两个月,国产版 Sora2 类产品可能就会出现," 所有的大厂、模型厂商都卷起来了 "。

好耶科技创始人吴杰茜也证实了这种紧迫氛围,其团队同样连轴工作,对 Sora2 进行测试、拆解。她的创业项目 FilmAction 是一个 AI 电影生成平台,与 Sora2 在功能上有不少重叠。Sora2 的横空出世,让她既兴奋又有压力——兴奋于技术的天花板被再次抬高,焦虑于行业的迭代速度超出了所有人的想象。

Sora2 发布仅半个月后,谷歌于 10 月 16 日推出 Veo3.1 与 Veo3.1Fast,被普遍解读为正面迎战 OpenAI 的举措。

同一天,OpenAI 也宣布 Sora2 两项升级:Pro 用户现可通过网页端使用 " 故事板 " 功能,同时全平台视频生成时长获得提升。普通用户可在 App 及网页生成 15 秒视频,Pro 用户网页端更支持生成 25 秒内容,较此前标准版 10 秒、Pro 版 15 秒的设定显著延长。

" 这像极了 ChatGPT 刚出现时的那一刻," 吴杰茜说," 所有人都在拼命追赶。"

综合多位从业者的说法,Sora2 的震撼来自于三个层面的技术突破:

首先,是物理世界的拟真突破。Sora2 能精准模拟水流、光影、重力与碰撞效果,甚至处理浮力与重心转移等复杂物理场景,极大提升了人物动作的连贯性与主体稳定性。

其次,是多模态融合。Sora2 可直接生成同步音频,自动匹配环境声、动作音效与多语言对白。在此之前,只有少数几个软件有此功能,但音质差不说,人物的语音和口型往往也不匹配。丁一团队还试着用不同的方言对 Sora2 进行测试,口音自然,口型精准,足见其技术成熟度。

Sora2 真正的颠覆,并非仅是生成视频的 " 以假乱真 ",而在于它理解了 " 镜头语言 "。

吴杰茜的测试印证了这一点:她将小说或剧本原文直接输入 Sora2,生成的视频不仅画面与文本高度契合,其镜头运用、节奏把控等视听语言,更是达到了专业创作者的水准。

要知道,在 Sora2 出现之前,AI 视频创作始终受制于 " 镜头思维缺失 "。过去,创作者需先手动拆解剧本,反复琢磨镜头衔接逻辑、人物视角选择、场景转换方式,耗费大量时间。市面上多数 AI 工具也只能生成单个简单镜头,若想串联成连续叙事,还需用户具备专业的视听语言知识与分镜设计能力,门槛并不低。

Sora2 打破了这一局限:用户只需一句话的文本指令,它便能自动生成包含多镜头切换、剧情连贯推进的完整视频。换句话说,Sora2 不再是单纯的 " 画面生成工具 ",而是初步具备了导演的叙事逻辑与剪辑师的镜头调度能力。

" 如果把 Sora2 比作一位剪辑师,那么他的能力已经超越了市场上 95% 的人。" 在丁一看来,其他 AI 视频软件目前还只是辅助工具,但 Sora2 一定程度上已经具备 " 智能体 " 的雏形。

创作门槛坍塌:AI 正在重写 " 专业 "

但技术狂奔的另一面,是行业秩序的松动。当 AI 视频进入 " 后 Sora 时代 ",最先感到震动的,往往是那些曾依靠专业壁垒生存的人。

" 既兴奋又焦虑。" 丁一如此总结 Sora2 发布二十天来的心情。

他的团队是首批测试用户,结果 Sora2 几乎立刻改变了他们的工作方式。在现在丁一团队的工作流程中,Sora2 已经深度嵌入,承担了很多前期的筹备工作,比如说分镜头的设计。注册四五个账号,可以快速的生成大量方案,并从中抽取最满意者。效率比人工快太多,而且质量也不差,包括视频概念、气氛、镜头运动方式这些因素都在其中。

Sora2 一句话便能生成 15 秒成片,这意味着他们团队平时接的一些便宜的商单,基本上没有了技术门槛。他告诉「定焦 One」,目前 Youtube 上的一些小推流广告,已经在使用 Sora2 生成。

另一位创作者等登等噔(以下简称 " 等登 ")也受到了震动。

在最新的一支短片中,他用 Sora2 完成几个分镜头的构思:先上传参考图片,再用文字描述故事背景与情节,Sora2 便能自动生成包含 3-4 个分镜头的视频,完整呈现剧情。而且据他测算,平均操作 3 次就能得到符合预期的版本," 抽卡率 " 远高于其他软件。

技术进步带来的创作便捷性让他感叹不已,但兴奋过后,等登心中也有一丝不安:分镜设计曾是专业创作者与普通用户的分水岭,但 Sora2 正在抹平这个门槛。

等登告诉「定焦 One」,在 Sora2 出现之前,还没有哪个软件是支持分镜头自动生成,部分软件可以做到一些简单的分镜头,但还是需要使用者明确的提示词,比如第一个镜头是什么、第二个镜头是什么,然后它会在十秒内给出一个分镜头的组合。

Sora2 可以直接生成一个动态视频。比如有网友将归有光的《项脊轩志》最后一句输给 Sora2,生成的视频第一个镜头是归有光和枇杷树的特写,第二个镜头是归有光与妻子种植枇杷树的回忆,回忆镜头与归有光睹树思人的镜头来回切换。在这个视频里机位、角度以及镜头的切换 AI 都已经设计好了。

在 AI 时代,由于技术进步,带来的专业壁垒的消解,可能是很多人都需要面对的课题。

AI 导演、AI 分镜师等新职业原本是 AIGC 带来的新红利,但随着 Sora2 具备 " 理解剧本 " 的能力,这些岗位或许也会被再次淘汰。

丁一对此感触尤深。

他入行时也是一名分镜师,后来进入导演组、成为执行导演,最终一步步做到导演。过去只要精通一项工具——哪怕是 Photoshop,就能找到工作。而现在,纯技术岗位的空间越来越小。今年早些时候,他拍的一个实验性质短片试图找过一些分镜师,但最后只能不了了之,因为 " 效率太慢了、沟通成本也很高 "。

焦虑之后,他也开始调整心态。最起码从现阶段来看,AI 生成的内容最终成果还是需要人的把关,个人的经验、审美、判断都会对最终的结果产生影响。丁一相信,未来人类的工具就是交互式的 AI,就像现在的笔和键盘一样,但最终比拼的仍旧是内容和创意。

英伟达 CEO 黄仁勋曾对媒体说:" 如果世界没有新的创意,AI 的生产力提升终将转化为失业。" 在 Sora2 带来的剧烈震荡中,这句话显得格外应景。

从 " 技术奇观 " 到现实考题

在 AI 应用层出不穷的时代,爆红与冷却往往只隔几天。很多人也在观望,Sora2 是否只是 " 昙花一现 "。

从热度来看,Sora2 的确已经降温。

微信指数和百度指数显示,Sora2 在国内热度高峰仅维持数日后迅速回落。等登认为,一方面国内用户无法直接访问 Sora2,另一方面清晰度与水印限制也让创作者难以商用,从而削弱了话题度。

Sora2 近 30 天微信指数走势截图

吴杰茜则指出,作为新闻事件,它注定会降温;但作为新的创作工具,它的普及才刚开始。

从前景上看,东莞证券的研报也佐证了这一观点,认为 Sora2 及其配套社交应用的发布,标志着 AI 视频生成与社交互动进入融合阶段," 有望重塑内容创作和分发生态,或迎来 AI 视频生成的 ChatGPT 时刻。"

回顾语言模型的发展史,ChatGPT 的出现是 AI 从实验室走向大众的决定性转折点。从这个意义上讲,Sora2 也标志着视频生成领域的一个关键拐点——即从技术尝鲜迈向普遍应用。

但类似 Sora2 这样的产品要想成为全民表达的工具,需要克服的不仅仅是技术难题。

首先是版权的迷雾。Sora2 初期采取的 " 选择退出 ( Opt-out ) " 机制,默认可以使用互联网公开内容训练模型,将维权举证责任推给版权方。这种做法迅速招致了好莱坞经纪公司、美国电影协会乃至日本政府的强烈抵制和法律威胁。

面对集体施压,OpenAI 迅速调整了策略,奥特曼宣布放弃 Opt-out,转而采用更审慎的 " 主动同意 ( Opt-in ) " 模式,即需版权方签署明确授权协议才能使用其 IP。奥特曼还建议引入 IP 分成收益机制,与授权方共享平台收入。

有律师认为,OpenAI 的这一机制将矛盾从法律博弈转向商业合作。尽管仍有局限,但它预示 AI 行业正迈向付费许可与生态共建的新阶段。一位好莱坞制片人的评论颇具代表性:" 未来的影视公司,其运营模式可能更趋近于版权管理机构,而非传统的内容制造者——这一趋势几乎无可避免。"

其次是变现模式的拷问。目前 Sora2 的主要使用场景仍以娱乐为主,如生成趣味视频或表情包。这类低价值、高频交互难以支撑庞大的模型训练与运维成本。未来,专业用户或高质量内容创作者的 " 付费模式 " 或将成为主流。如何在广告变现与用户体验之间取得平衡,仍是所有 AI 视频厂商的共同考题。

这些现实的疑问和战略调整,勾勒出 AI 视频行业从 " 野蛮生长 " 转向 " 理性发展 " 的轨迹。

用丁一的话说,随着 Sora2 的出现,全球 AI 视频赛道正迈向更高维的竞争阶段。各家模型厂商 " 卷 " 得更深,训练数据涵盖影视、动漫、广告、纪录片等多种素材,"AI 正在学习全人类的影像史 ",而当技术卷到极致,拼的将不再是算法,而是创意与落地能力。"

Sora2 发布二十天后,世界或许并未立刻改变。但在每个 AI 视频创作者的电脑上,故事的生成方式,已经悄然不同。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 百度 谷歌 创业者
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论