36氪 4小时前
HappyHorse没有惊喜
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者   |   兰杰

编辑   |   乔芊

4 月 27 日,预热已久的 HappyHorse 终于开启测试,颇为遗憾的是,它没能像横空出世的 Seedance2.0 那样掀起巨浪。没有惊喜,对于 HappyHorse 来讲是一个颇为中肯的评价。 

HappyHorse 是阿里巴巴 ATH 事业群旗下创新事业部研发的视频模型,于 4 月 27 日开启灰测,并接入千问 App。

该视频模型饱受关注的原因有二。 

一是因为在开放测试前,HappyHorse 在未标注厂商的情况下,登顶了以盲测为主要形式的权威 AI 评测平台 Artificial Analysis AI Video Arena 排行榜,以更高的 Elo 分数(通过比赛输赢和对手强弱来动态计算实力排名的数字),力压字节跳动旗下 Seedance 2.0、快手旗下可灵 AI、Google Veo 3 Fast 等视频模型,一炮而红。 

随后关于其出处、能力的热议不断,甚至有数个假官网冒名顶替,吸引了无数不知情的围观群众。

二是因为该视频模型背靠阿里。登顶测评榜后三天,4 月 10 日,阿里 ATH 创新事业部正式认领。

HappyHorse 和其所在的 ATH 事业群都很年轻,后者是由阿里巴巴 CEO 吴泳铭于 3 月成立并亲自挂帅的,整合了通义实验室、MaaS 业务线、千问事业部、悟空事业部及 AI 创新事业部五大板块。在官方的叙事中,ATH 创新事业部已启动一个 AI 时代的全新交互方式探索计划,HappyHorse 是这个探索方向的一部分,更多的产品会陆续推出。 

据接近阿里人士表示,今年 3 月 ATH 事业部成立之后,阿里定下了 AI 业务日均消耗达到百万级的目标,为了弥补自身在多模态大模型上的短板,也为了推动 Token 的消耗,阿里加速了视频生成大模型的落地,HappyHorse 就是这一策略下的产物。

在 Seedance2.0 一家独大、定价颇高,且排队不断的情况下,行业也十分期待能有一个新的、能力与 Seedance2.0 相当的视频模型出现。只是当测试开放之后,不少从业者表示了失望。此前在马年春节期间,即梦 App 的图标将原本的陀螺形象改成了一匹小马,如今也被媒体颇有意味地解读为 " 拿捏小马 "。

图片来源:官方页面截图

没有技术上的飞跃,就只剩追赶

HappyHorse 的技术能力究竟如何?

内容科技公司三生清影自研的工具 Glowave 已经接入了 HappyHorse,在深入体验了该大模型之后,创始人姜奕祺对该模型的评价是,表现不错,但略逊于 Seedance2.0。

姜奕祺毕业于清华大学计算机视觉专业,曾在阿里达摩院任职,对视频大模型了解颇深。他向 36 氪表示,相较于 Seedance2.0,HappyHorse 的影视感与提示词还原上有所不足。具体来讲,前者指的是更接近传统专业影视表现的效果,包括画面的精细度、背景的丰富度等。后者可以简单粗暴的理解为,听懂人话的能力。 

36 氪也测评了 Seedance2.0、可灵 3.0 和 HappyHorse 三款产品,用同样的提示词、清晰度生成了同样时长的视频。在观看了可灵 3.0 和 HappyHorse 生成的两段视频后,姜奕祺认为后者审美有些逊色,但在关键词的还原,以及物理真实性上更胜一筹," 如果给这两个视频打分的话,我会给可灵 3.0 的打 8 分,给 HappyHorse 打 9 分 "  

他进一步说明,"HappyHorse1.0 毕竟是 1.0,这个起步已经很好了,可灵 3.0 近期表现下降,可能是将算力用在憋大招上了。"

Seedance2.0 的测评视频未能成功生成,截至发稿,36 氪仍需排队十小时。

总的来说,HappyHorse 更多是在市面上已有的视频模型能力的基础上缝缝补补,未能有质的突破。 

事实上,HappyHorse 的硬实力并不差—— 150 亿的参数,几乎是 Seedance 的三倍,支持 15 秒多镜头叙事、多画幅适配及 1080P 超分输出。换言之,HappyHorse 同样可以做到一键生成有分镜、音画同步的 15s 视频。

这些能力如果放在 3 个月前,或许也会让影视行业重审已有的生产流程和组织架构,但如今已经是市面上视频生成大模型的标配,与 Seedance2.0、可灵 3.0 的重合度很高。 

至于为什么在训练参数数倍于 Seedance 的情况下,其表现力却未能跟上,姜奕祺分析或许与数据质量有关—— HappyHorse 在短视频数据和影视级视频数据上,与字节、快手都存在一定差距。 

如今,国内视频生成大模型已经陷入到了焦灼且同质化的竞争中,做到差强人意远远不够。

一位头部视频模型厂商的员工如此向 36 氪表示,他们老板说过,衡量大模型能力的核心标准是 " 智能 ",可以将其理解为,大模型的迭代更新是否有改变一个产业的生产结构。例如 Seedance2.0 的出现,分镜师就不被需要了。 

除了质的突破,速度也要跟上。如今行业默认每 1-2 个月就需要更新一版大模型出来,否则就有可能掉队。在这样的背景下,平庸是不可能突围的。 

前不久,可灵 3.0 更新了功能,可以直出 4K 的视频,这与 AI 视频行业努力迈向大荧幕的方向一致,新的竞争再次拉开序幕,而 HappyHorse 才刚刚登场。

  便宜成不了护城河

技术上不够出彩的 HappyHorse,在价格和商业化上又是否有竞争力?

赵禹成是得云 AIGC 的商务负责人,其所在的公司代理销售 Seedance2.0、可灵 3.0 等大模型的 API,如今他们也与 HappyHorse 达成了合作。

赵禹成向 36 氪表示,HappyHorse 主要对标 Seedance2.0,希望一些与后者签订了年框的大客户可以切换到自家模型上。但因为尚处于早期阶段,HappyHorse 对商业化没有太高的期望,也没有具体目标。

在 Seedance2.0 开放 API 之前,想要不在即梦里排队,需要和火山引擎签订 1000 万的年框。可以先预付 20% 的定金,剩下的钱需要在一年的时间里通过调用大模型消耗 Token 的形式用完。一位签订了年框的从业者告知 36 氪,至于消耗不完怎么办,合同里没写。

" 这给一些用户从 Seedance2.0 迁移到 HappyHorse 上留下了空间 ",赵禹成如此表示。

早在阿里认领了 HappyHorse 之后,就有很多人找上赵禹成询问相关情况,以至于那时候他不得不在公司介绍中补上一句 "HappyHorse 还要等一等。" 那时候火山引擎的人也比较敏感,始终关注着 HappyHorse 的动态。

但在前天开放测试之后,尚未有客户表示出要从 Seedance2.0 迁移到 HappyHorse 上的意愿。

Token 的价格不断攀升,对于一些 AI 影视公司来讲,除了人力成本以外,最大的支出就是采购算力。另一位大模型服务商向 36 氪表示,许多中小客户,几乎只在意价格,甚至还有公司将 Token 使用量纳入绩效考核,试图以此节省算力。

因此,更便宜的定价确实可以为大模型的商业化带来竞争优势,只是价格优势不能独立存在。

在开放测试的前一天,HappyHorse 已经公布了定价。

具体来讲,该模型 720P 和 1080P 的视频生成每秒分别是 0.9 元和 1.6 元,专业会员包月价格叠加限时折扣后为每秒 0.44 元和 0.78 元。这个定价和可灵相差不多,但比即梦便宜。

服务商可以从 HappyHorse 拿到一定的阶梯折扣,在刊例价的基础上——日均调用量在 10 亿 Token 左右,对应市场价近 10 万元时,可以打 8 折;日均调用量达到 100 亿,则可以拿到 6-7 折。

而即便是年框用户,使用 Seedance2.0 也需要每秒一块。相较之下,HappyHorse 有一定的价格优势,但并不多。

"(产品能力上)没有亮点的话,大家的态度是可有可无,折扣能影响到的比较少。"" 大家不会因为便宜而去选择一个不够好的产品。" 这是赵禹成的一线感受。

因为大模型能力与 Token 的消耗量是强相关的,并不是定价越低越省钱。以漫剧行业为例,能力更强的产品可以让人员成本和抽卡次数降下来,实现降本增效。

事实上,在能力上保持领先的 Seedance2.0 和可灵 3.0,始终处于一个卖方市场之中,后者甚至到现在为止只有一个不过十人的直销团队。

换言之,那些真正能在智能上实现跃迁、重新定义行业规则视频模型,永远不会缺少使用者。就像自推出以来,Seedance2.0 的价格不降反升,但依旧成为了拉动火山引擎收入增长的主力。 

(彭倩对本文亦有贡献)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 阿里 阿里巴巴 字节跳动 春节
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论