全天候科技 02-09
凌晨三点,彻底失眠:Seedance 2.0告诉我们,AI对现实世界工作流“压缩”正在加速
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文作者:申思琦

来源:硬 AI

凌晨三点,看到影视飓风 Tim 更新的字节即梦 Seedance 2.0 视频,我彻底睡不着了。

这是过去一年多来,AI 的进步第一次让我感到如此兴奋。或者说,战栗。

很多人都在等视频领域的 GPT-3.5 时刻,大家觉得那还要两三年。Seedance 2.0 告诉我们,它已经近在眼前了。

它的强悍之处,在于它把运镜、分镜、音画匹配,全部 AI 化了,并且做到很棒。它理解了光影、透视、镜头语言。

Tim 在视频里展示的,是控制,是 AI 对物理世界的完美复刻。

AI 的逻辑正在变得清晰而简单,AI 正在疯狂压缩我们的工作流:从导演、拍摄到剪辑、配乐;从产品经理、开发到测试、交付。

所有的中间环节都在逐步压缩。

这篇文章,我想聊聊 AI 正在如何改变工作流、如何重构我们的工作。

01 视频工业的GPT3.5时刻

Tim 在视频里那种抑制不住的兴奋,我感同身受。

以前我们认为运镜是物理世界的特权,滑轨、摇臂、无人机、斯坦尼康。这些设备很贵,操作这些设备的人更贵。

Seedance 2.0 把这些都变成了参数,视频里演示的图生视频,一张主角的照片 + 一张场景的照片。

它能让这个主角,在这个场景里,按照你指定的运镜方式动起来,多主体一致性得到了惊人的保持。

推拉摇移,以前需要铺设轨道,需要灯光师配合调整每一秒的光位。

现在这只是 Prompt 里的一行字,物理世界的物理限制,被数学世界的参数限制取代了。

Seedance 2.0 似乎理解了三维空间的一致性。

它知道当镜头左移时,背景物体应该如何产生视差。它知道当光线从右边打来时,影子的长度应该如何变化。

Seedance 2.0 开始涉足剪辑,AI 能够理解视频的节奏,能识别画面中的情绪高点,能自动匹配音乐的鼓点。

对于剪辑师来说,以前需要耗费几个小时的 " 粗剪 " 工作,现在可能只需要几秒钟。

声音也是一样,画面里篮球场,赛场复杂的声音同步出现。

这种感知上的一致性,是人类大脑判断 " 真实 " 的重要依据,AI 做到了。

影视后期原本是一个极度复杂的系统工程。导演负责构思,摄影师负责将构思转化为光影,剪辑师负责将光影重新组合成叙事,配乐师负责用声音调动情绪。

这是一个极其昂贵、低效、且充满摩擦的线性工作流。Seedance 2.0 把这个链条打碎了,它把这些工种全部压缩进了一个模型里。

本质上,AI 现在在做的内容就是不断压缩我们的各种工作流。

从 Seedance 2.0 看到了 AI 在压缩导演、拍摄、剪辑、配乐这些人员的工作流雏形。

视频领域的 GPT-3.5 时刻已经到来。

接下来的两三年,将是行业洗牌的时刻,旧的秩序正在崩塌。

02 AI正在极致压缩我们的工作流

视频领域的变革只是 AI 重塑工作流的一个切面,更深刻的变革,发生在软件领域,发生在我们的手机屏幕上。

最近用阿里千问点了一次奶茶,这个体验让我思考了很多。

它可能预示了 App 时代的终结,或者说,它预示了 " 即时软件 " 时代的到来。

我们现在的互联网体验,是被 "App" 这个形态锁死的。

你想点一杯奶茶,你需要解锁手机,找到外卖 App,点击进入,等待开屏广告,点击搜索框,输入 " 奶茶 ",在几十个商家列表中筛选,点击进入商家页面,在几十种商品中选择,选择甜度,冰度,点击下单,支付。

这是一个极其冗长的链路。

为什么我们要经历这个过程?因为 App 在试图满足所有人的需求,它在找最大公约数,它不得不把低频需求塞进二级页面,它不得不为了商业化加入各种推荐。

对于我来说,我不需要这些,我常点的就是那 3 家店,我知道哪家的柠檬茶最好吃,知道哪家的后厨最干净。

我只需要:" 帮我点一杯我常喝的那家,无糖。"

千问现在的能力,正在接近这个理想状态。

你给它一个指令,它在后台通过代码,通过 Agent,直接调用接口,完成交付。

这就是 " 意图界面 ",你输出意图,AI 交付结果。中间的 UI、交互、跳转,全部被压缩了。

当 AI 的能力从 Andrej Karpathy 提出的 "Vibe Coding" 进化到足够强大的 Agent,我们的每一个需求都将通过即时生成的 " 一次性 App" 来交付。

传统的 " 产品经理需求文档 - 开发编写代码 - 测试找 Bug- 最终交付 " 这一长达数周甚至数月的链路,将被 AI 瞬间压缩至 1 分钟以内。

这引发了一个根本性的商业追问:既然我可以用 1 分钟生成一个 "App" 来满足我当下的需求,那我为什么还要下载一个几百兆的 App?

现有的 App 生态存在着无法克服的结构性矛盾,每个人的需求都是独特的,AI 可以通过即时代码将用户的自然语言需求直接转化为交付结果。

这实际上是 AI 为用户量身定制了一个 " 专属 App",用完即走,无需留存。

这对于现在的互联网巨头是巨大的挑战。他们的护城河建立在 App 的装机量上,建立在用户的使用时长上。

如果 App 消失了,如果入口变成了 AI Agent,那他们的流量从哪里来?广告往哪里投?

下一个时代的入口可能逐渐清晰。

为什么所有大厂都在疯狂做大模型,争夺那个唯一的 " 超级 Agent" 的答案呼之欲出。

对于很多 App 这种集合需求形态的产品,是不是在 AI 时代会转向个性化需求的 AI 内产品呢?

现在的 App 开发商,可能会变成 " 数据 API 服务商 ",随着交付链路的大幅压缩和成本降低,App 需求实际变成了 API 需求。

每一次产品对话,都是自己作为产品经理的一次结果交付。

最终,传统工作流的消失,意味着公司组织的解体

公司这种组织形式,本质上是为了降低交易成本而存在的。因为沟通很贵,信任很贵。所以我们要把人聚在一起,签合同,发工资。

当一个人 +AI 就能完成以前需要一个团队做的事情,庞大的组织就变得没有必要了,我们会看到越来越多的 " 一人公司 " ……

这样看,

我相信,AI对世界的改变,正在加速

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 尼康 物理 导演
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论