光锥智能 3小时前
快手AI的围城与重构
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

前沿科技,数智经济

年底似乎又到了 AI 厂商们展示实力的日子。上周,快手上演了一场为期五天的全能灵感周技术展示;本周,智谱的连续开源也如期而至。

在这五天的时间内,快手带来了三个大模型、一个助力 AI 落地的数字人和功能更新:

统一多模态大模型模型 o1、能做到 " 音画同步 " 的可灵 2.6、全量开放的 o1 图片模型;可灵数字人 2.0 有望继续造福商家和广告营销;o1 主体库和对比模版,可以说进一步降低了 AI 视频生成的应用门槛,让 AI 生成效果更接近落地。

你可以看到,可灵 AI 早已不仅仅是快手的新营收来源,作为造血的一份子,通过做广告素材、做直播间特效等方式,它也为快手提供降本增效的助力。

从模型层的突围与重构,到 AI 短剧对内容生产关系的彻底改造,再到深埋水下的 AI 广告体系,快手已经通过 AI 改写了企业的运行。

但可灵 AI 和快手同样面临着不小的压力,无论是 Runway gen-4.5、Veo 3.1 等新模型的威胁,或是快手本身用户池增长放缓,靠短剧提升用户黏性,快手这场 AI 赋能的故事背后,也同样面对不少压力。

从突围到守家

可灵的 2025 年

作为率先从 2024 年杀出的视频生成 " 黑马 ",可灵 AI 在 2025 年的两个主线,一是继续维持模型技术优势,二是通过竞争,揽获更多 P 端用户。

最新上线的 o1,就是快手对行业竞争对手的一次回击。

需要明确的是,o1 不再是简单的版本升级,而是底层架构的重构。

区分于可灵 1.0、2.0 等模型的命名,新系列的 o1 是统一多模态大模型。和以往的多模态大模型不同的是,统一多模态大模型实现了架构上的统一,把文字、图片和视频的训练都放在同一个框架下。

统一的好处是,o1 支持在一个模型内实现对文字、图片、视频信息的处理,比如既可以给它提供参考图,让它根据图片生成视频,还可以把视频作为参考投喂给模型,根据视频内容进行编辑、修改。

简言之,图片、视频的编辑和修改,都能交给 o1 一个大模型就搞定。

在光锥智能测试中,我们先是把一张 AI 图片投喂给可灵生成视频,再要求它基于该视频,把任务的裙子从红色改成水蓝色,再给女生的手里加一朵向日葵。可灵 o1 完整执行了这两项指令,虽然在裙子袖口的细节上做的还不够还原,但整体达到了要求。

但在物理规律的测试上,可灵的表现和 Veo 3.1 还有一些差距。比如,我们在测试中要求在台球桌上通过击打白球,使红球掉入口袋。对比两者给出的效果来看,虽然 Veo 3.1 没有让红球落到口袋里,但基本遵循了指令;但可灵 o1 仅仅给出了两球碰撞的效果,对指令的遵循上效果不够理想。

在技术方面,可灵今年面对着海内外模型技术赶超的压力。

今年,可灵家族的核心版本更新主要有两次,分别是于今年 4 月更新的可灵 2.0,以及本月发布的统一多模态大模型 o1。虽然在八个月间,可灵持续发布了基于可灵 2.0 模型的升级版本 2.1、2.5 及 2.5 Turbo 版本,但这些版本均是在一致性、画面效果等方面的小幅度更新,没有取得突破性进步。

同时,AI 视频赛道的下半年,一系列强劲对手的加入,让可灵 AI 开始承受更多压力。

先是 Google Veo 3、Veo 3.1 凭借原生多模态大模型,实现音画同步和文生视频的提升,成为谷歌又一破圈模型;Runway 也在 12 月 2 日发布新慢跑鞋 gen-4.5,在 Artificial Analysis 榜单上超过 Kling-2.5 Turbo。

从技术上来说,Runway Gen-4.5、VEO 3" 神仙打架 " 之下,可灵 AI 需要拿出能够再度证明实力的新模型。

在这个过程中,快手先从性价比入手。不仅提升模型在文本理解、风格一致性上的表现能力,同时压下了模型成本的 30%,做了一个性价比更高的新模型。

据官方数据显示,根据 AI 基准测试机构 Artificial Analysis 的全球视频生成大模型榜单中,可灵 2.5Turbo 模型发布后登顶图生视频、文生视频赛道榜首。

再到最近 12 月可灵的 5 天开源,就是一次实力展示。无论是统一多模态大模型 o1,还是快手首个做到音画同步的可灵 2.6 模型,都是可灵在积攒实力后做的一次反击。

从这次快手的模型更新来看,可灵 AI 在追技术的同时,也更加聚焦在落地应用的实用性上。

相比于做一个类似 Veo 3.1 这类成本高、文生视频效果突出的模型,可灵 AI 新模型追齐音画同步的同时,做一个能够把编辑视频、图生视频等功能集为一体的新模型,显然对于专业生产者来说更加实用。

但如何在技术上持续突破,超过 Veo 3 们,可灵 AI 还需要继续努力。

试水 AI 短剧、漫剧

快手寻求 P 端用户

在成为快手 " 第二增长曲线 " 之外,可灵 AI 目前最核心的方向,就是助力 AI 影视。

" 可灵 AI 的愿景是让每个人都能用 AI 讲出好故事。我们会围绕‘ AI 影视创作’这个目标聚焦资源,深入技术和产品的能力。"Q3 电话会上,快手 CEO 程一笑说。

从 2024 年开始,可灵 AI 就在持续推进 AI 短剧落地的尝试。去年 9 月,可灵 AI 联合包括李少红、贾樟柯在内的 9 位知名导演发起 " 导演共创计划 ",制作出品 9 部 AIGC 电影短片。

但对于 AI 短剧行业来说,想完全靠 AI 大模型做出一部完整的 AI 作品还不够现实,彼时 AI 视频在人物一致性、画面真实性等效果上,AI 视频生成的结果不达预期。落到涉及编剧、分镜等涉及多个复杂环节的工作中,也仍需磨合。

" 我们创作的准确需要导演脑海当中的画面,并不是出现一个飘飞的奇观就是合适的,它有很多惊喜," 和可灵 AI 联合出品 AI 短剧《新世界加载中》的导演陈翔宇说,"但真实地使用它,你会发现,不管是 AI 还是所谓的 AI 影像,还有一段路需要去走。"

由此,AI 在短剧上很大一部分应用,仍然聚焦在降本增效上。

不过,相较于更写实的现实题材,AI 视频生成开辟出了一条更贴合当下的路线—— AI 漫剧。

2025 年,是 AI 漫剧爆发的关键节点。据巨量引擎数据,2025 年上半年漫剧流水增长 12 倍,预计全年市场规模将突破 200 亿元。

在市场利好的情况下,通过 AI+ 漫剧的制作方式,能够让 AI 漫剧追平制作短剧的周期,同时收入表现理想。比如生数科技联合伯乐科技发布的 AI 漫剧《明日周一》,据悉,第一季预计总收入在 120 万至 150 万元之间。

今年 9 月,快手同样加入到 AI 漫剧的试水中。

比如联合可灵 AI 推出的 " 灵感・新纪元 AIGC 创投计划 ",通过联合出品和联合运营两种模式,可灵 AI 出算力、快手则提供流量扶持,寻找创作者合伙做项目,给出单部漫剧最高 1000 万灵感值(可灵 AI 消耗单位)和 1 亿流量扶持的条件。

无论是推动短剧还是漫剧,可灵 AI 当下聚焦的关键任务是,怎么让 AI 视频生成在专业领域更可用,从而推动 P 端用户为可灵 AI 付费。

从商业化来看,快手收入增长的轨迹十分清晰,且算是视频生成赛道收入的佼佼者。但后起之秀正在追赶其脚步。

据快手财报,从 Q1 收入约 1.5 亿元,Q2 增长至 2.5 亿元,再到 Q3 继续增长至 3 亿元。可以看到,可灵 AI 的收入处在稳步增长的阶段。和同行业玩家对比,这个收入算得上位列前茅。

随着收入的提升和稳定,快手上调了对可灵 AI 的收入预期。

在 Q3 财报电话会上,快手宣布上调可灵全年收入预期目标,由年初的 6000 万美元转向 1.4 亿美元。目前,可灵 AI 全球用户规模目前已达 4500 万。

不过,这还不足以让快手高枕无忧。爱诗科技两个月前公布,其产品拍我 AI 和海外版 Pixverse 目前的 ARR(年度经常性收入)达到 4000 万美元,走的是先 C 后 B 的路线;而生数科技则在年初公布过月超 2000 万的 ARR 收入,靠先 B 后 C 的方式做商业化。

越来越卷的 AI 视频生成赛道,快手必须抢跑。好在拥有平台做流量支撑的情况下,快手先天比创业公司具备优势。

模型打底

快手用 AI 重构营销

除了显性的对外收入,快手也在通过可灵、可意、可图等 AI 模型大模型矩阵的搭建,将它们融入快手内部生态,从而起到降本和提效两大作用。

从线上营销业务看,快手在短期增速短暂放缓的情况下,逐渐靠 AI 找回了增速。快手财报显示,Q1 其线上营销收入为 180 亿元,同比增长 8%,首次增速降到个位数。

踩在 Q1 的末尾,3 月 31 日,在快手举办的 2025 磁力大会上,快手宣布对商业化营销经营各环节进行全面改造,将磁力引擎打造为下一代 AI 智能商业引擎。

可以看到,快手把核心聚焦在广告营销的关键三点:素材生成、投放、算法匹配上。通过搭建起完整的工具体系,目前线上营销收入增长已经初见成效。

广告素材的流水线上,可灵 AI 早早上阵。 在广告业务中,视频素材的生命周期短、消耗大,传统的实拍素材成本高、效率低。

针对这个问题,快手通过 AIGC 内容生产来实现降本。其中,可意大模型负责文字素材的输出,可图生成 AI 图片,可灵支撑短视频广告营销;女娲数字人直播等 AI 产品则用来满足多元化素材的需求。快手官方数据显示,AIGC 内容生产可以将素材制作成本降低 70%。

聚焦广告投放环节,则涉及到素材的选用和不同场景的推广。在推荐上,快手靠两个大模型做投放,据快手财报,两者共为国内线上营销服务收入带来约 4 – 5% 增量。

一是端到端生成式推荐大模型 OneRec,快手用其重建推荐系统,在大幅降低成本的同时,提升推荐精度。

" 传统的推荐系统,可以简单理解为一条分段作业的流水线系统,遵循先筛选召回、再粗排精排的多阶段级联架构,每一段都有自己的模型和目标。这样的架构虽然稳定,但带来的问题是算力效率低下、目标冲突乃至推荐不精准。" 程一笑在 Q3 电话会上说。

作为端到端生成式 AI 架构的推荐大模型,OneRec 的解法,一是改变多个环节串联导致的算力浪费,将其运营成本压缩到了传统方案的 10.6%,二是通过对用户信息的学习训练和强化学习,提升了广告匹配的精准度。

二是生成式强化学习出价模型 G4RL,通过学习广告主和市场相关行为,将广告素材和需求做匹配,提升出价效率。

在靠 AI 赋能的工具体系布置上,快手则是靠 AI Agent 上线广告全自动化投放解决方案(UAX ) 。把全流程交给 AI 完成。可以看到,从 Q1 季度公布的 UAX 的客户渗透率已接近 60%,到 Q3 的 75%,AI 工具的使用覆盖范围在逐步提升。

由此,快手三季度线上营销服务收入 201 亿元,同比增长 14%。财报也表示,这受益于 AI 能力的深度落地。

从可灵 o1 在模型层的突围与重构,到 AI 短剧对内容生产关系的改造,再到 OneRec 对流量分发逻辑的改写,快手用 AI,重写了自己的 " 技术 - 商业 " 闭环。

光锥智能"AI 交流群 "已建立,

感兴趣的朋友可以添加小助手微信(GZZN2019)沟通进群。

联系我们

王一粟

创始人 / 主编

ID:cishicike000

商务合作请添加微信:GZZN2019

转载开白请留言或添加微信:GZZN2019

进群交流请添加微信:GZZN2019

※添加时请备注公司 + 姓名 + 来意

「往期精彩推荐」

深度研报:

AI 大爆炸:

云计算:

数智化案例:

更多精彩内容,欢迎关注:

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 快手 效果 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论