风云突变!阿里终于在字节的窒息中成功反杀。
连日来,一款名为 HappyHorse(欢乐马)的神秘模型频频在全球屠榜,将炙手可热的 Seedance 斩落马下。
颇具戏剧性的是,字节一脸懵逼三天后,阿里举手说,这是我干的。而且快乐马的操盘手张迪,不仅是抖音老冤家快手的 " 可灵之父 ",现在又跑到了现任生死大敌阿里这里捅了一刀。
更具侮辱性的是,阿里宣布开源,这让要百万保证金的字节猝不及防。

神秘的 HappyHorse 是 4 月 7 日开始屠榜的。
没有任何官方背书、没有任何公司认领的神秘模型,悄然空降 AI 视频领域最权威的第三方评测榜单 Artificial Analysis Video Arena,以 1333 Elo 分的成绩登顶视频竞技场排行榜,在文本生成视频(含音频 / 不含音频)、图片生成视频(含音频 / 不含音频)四个赛道中均位列第一。
第二天,阿里巴巴集团 CEO 吴泳铭发布全员信,宣布 AI 相关组织的重大调整,成立集团技术委员会,原通义实验室升级为通义大模型事业部,ATH 创新事业部浮出水面。
4 月 10 日,碾压级表现还在继续。
在文本生成视频(不含音频)赛道,HappyHorse 得分达到 1389,领先排名第二的字节跳动 Seedance 2.0 达 115 分;在图片生成视频(不含音频)赛道,HappyHorse 更是跑出了 1415 分的高分,刷新了该榜单的历史纪录。
即便在含音频的综合评测中,HappyHorse 文本生成视频(含音频)得分已超过 Seedance 2.0;而图片生成视频(含音频)仅以微弱差距紧随其后,得分 1162 分,仅比 Seedance 2.0 的 1164 分低 2 分。
Artificial Analysis 被全球认可很重要的原因在于盲测机制:所有模型匿名提交,用户完全不知道视频来自哪个模型,仅凭观感投票打分,再通过类似国际象棋的 Elo 评分系统汇总排名。
因此,欢乐马接连登顶,立刻引发了全网的 " 寻马 " 热潮。

各种猜测在 4 月 10 日终于水落石出。
HappyHorse 开通了微博账号,并发布首条官宣内容:HappyHorse 属于阿里 ATH 创新事业部,其正在内测中,目前尚未上线。
将欢乐马的欢乐推向高潮的是两个传言:一个是操盘手张迪,一个是字节紧急变阵。
这让整个 AI 视频圈都为之侧目张迪,张迪的履历堪称传奇。
他本硕毕业于上海交通大学。
2010 年加入阿里巴巴,担任阿里妈妈大数据与机器学习架构负责人。
2020 年,他跟随阿里妈妈前技术总监盖坤跳槽快手。2024 年,他以 " 技术一号位 " 身份牵头可灵 AI 的全链路研发,主导了可灵 1.0 和 2.0 两代底层架构,被业内称为 " 可灵 AI 之父 "。
2025 年 9 月,张迪短暂加入哔哩哔哩担任技术条线负责人,但仅任职约两个月便再次离开。
2025 年 11 月正式回归阿里,出任淘天集团未来生活实验室负责人,职级 P11,直接向淘天首席科学家郑波汇报。
也就是说,张迪先在快手做出了可灵 AI,然后跳到阿里做出了 HappyHorse 来打败可灵,还帮被字节搞得颇为狼狈的阿里出了口恶气。
有网友调侃:" 可灵最大的竞争对手,不是 Seedance,是张迪本人。"
更令人惊叹的是效率。张迪回归阿里后,仅用 5 个月时间,带领团队打造出了 HappyHorse-1.0。而传统大模型开发周期通常在 12 至 18 个月,OpenAI 的 Sora 从立项到发布用了近两年,字节 Seedance 2.0 也花了差不多一年。
HappyHorse 之所以能在短时间内实现弯道超车,与其独特的技术路线密不可分。
它是目前全球首个原生支持音视频联合生成的开源视频大模型,参数量为 150 亿,采用 40 层统一自注意力 Transformer 架构,单张 H100 显卡生成一段 5 秒 1080p 视频耗时仅约 38 秒。不同于传统模型 " 先生成无声视频、再单独配音、再做口型对齐 " 的多工序流程,HappyHorse 将所有模态的 Token 拼成同一个序列,让模型在一次前向推理中直接输出带声音的成片,口型、脚步声、环境音全部在同一过程中生成,无需后期拼接。此外,HappyHorse 原生支持英语、普通话、粤语、日语、韩语、德语、法语七种语言的唇形同步,词错误率在同类开源模型中最低。
不过,HappyHorse 也并非全无短板。有机构实测报告指出,HappyHorse 的场景感、真实感、成片感是其最大长板,但在复杂动作控制和分镜调度上,尚不如 Seedance 2.0 成熟。它更像一个 " 很会拍漂亮镜头的摄影师 ",还不是一个 " 真正成熟的动作导演 "。
HappyHorse 的横空出世,让原以为大局已定的 AI 格局风云突变。
过去一年,AI 视频生成的竞争格局泾渭分明:字节跳动凭借 Seedance 系列稳坐头把交椅,快手可灵 AI 凭借庞大的用户生态占据第二梯队,而阿里在这一赛道长期缺乏一款能打的产品。
阿里举全集团之力力捧的千问,在用户活跃度和市场普及度的消费级应用榜单上,一直被豆包压着一头。
此前,阿里还因为前阿里千问大模型负责人林俊旸的出走而备受争议。

HappyHorse 的诞生,无疑是对于阿里 ALL IN AI 的组织变革最好的礼物,林俊旸的那句 " 快乐马简直高兴疯了 " 更让一扫此前阴霾。
让字节无比被动的是开源带来的巨大压力。
此前,字节 Seedance 2.0 虽然面向企业用户开放公测,但同时设置了各种严苛的要求和准入条件:仅面向完成企业认证的主体,默认并发数锁定在 10;真人人脸生成与自定义人像功能暂不开放,仅可使用平台公共虚拟人像库进行二次创作。想要解锁高级能力或新签约团队还需签署保底合作协议,和支付 100 万元保证金及 10% 预付款。
因为版权和产品问题一直让 Seedance 不敢免费放开。
2 月 12 日,Seedance 2.0 正式上线,凭借超写实的视频生成能力和多模态音视频联合架构惊艳全球,但美国电影协会(MPA)和美国影视演员协会(SAG-AFTRA)先后发布声明,谴责 Seedance 2.0 大规模擅自使用受版权法保护的作品,存在公然侵权行为。字节跳动随后决定暂缓 Seedance 2.0 在全球发售的计划。
同时 Seedance 2.0 也存在一些局限性问题,如细节稳定性、文字与字幕处理缺陷、多主体与复杂交互处理不足等。在生成复杂场景或长视频时,可能出现角色动作不连贯、场景元素漂移等情况;在高并发使用或生成长视频时,可能出现生成时间延长、任务排队等待或偶尔生成失败的情况。
产品的成熟度不佳、并发不够用、版权问题等等,使得 Seedance 2.0 只针对大客户开放。这些限制性条款虽然出于版权风险管控的考量,却在客观上抑制了产品的普及速度。

据知情人士透露,HappyHorse 屠榜并宣布即将开源的消息传来后,字节 AI 视频团队紧急召开会议,原定对 Seedance 2.0 实施的严格准入限制,包括企业认证、百万元保底保证金、并发数锁定等条款,被连夜提上调整日程,计划在 10 日全面放开。
中国 AI 视频正式进入三国杀时代。
字节和阿里的双雄会终于有了点看头。
来源:星河商业观察


登录后才可以发布评论哦
打开小程序可以发布评论哦