全天候科技 10小时前
阿里腾讯同日出牌,AI开始争夺“世界入口”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

阿里 ATH 的 " 快乐家族 " 又添了一位新成员。

就在 HappyHorse 靠着视频生成能力冲上全球榜单、把阿里重新拉回多模态舞台中央之后,阿里很快又放出另一张牌。

2025 年 4 月 16 日,阿里发布 " 开放式世界模型产品 HappyOyster"。看上去名字延续了 HappyHorse 的体系,但方向已经明显不同。

如果说 HappyHorse 解决的是 " 怎么生成更好的视频 ",HappyOyster 则试图回答的是 " 怎么生成一个可以持续存在、可以实时交互的世界 "。

巧合的是,同一天,腾讯也正式发布并开源混元 3D" 世界模型 "HY-World2.0,主打可导入游戏引擎的 3D 场景生成与交互式世界搭建。

两家中国互联网巨头几乎同时押注 " 世界模型 " 的叙事,某种程度上意味着 AI 竞争已经进入下一阶段:从回答问题、生成文本,走向构建空间、模拟现实、创造可互动的数字世界。

出牌

过去一年,AI 视频生成行业已经形成一套大众熟悉的流程:输入一句提示词,等待几十秒或几分钟,得到一段几秒到几十秒的视频成片。用户像导演,也像甲方,给出需求后等待机器交付结果。这种模式解决的是内容生产效率问题,本质仍然是单向生成。

HappyOyster 试图打破这套逻辑。

阿里把它定义为 " 世界模型 ",在于它允许用户在生成过程中持续下达指令,画面实时响应、世界持续演化。你可以在一个已经生成的空间里移动视角、改变环境、调度角色、重写剧情,模型不是一次性交付结果,而是在持续运行。用户也不再只是提示词输入者,而开始成为这个世界的参与者、操控者,甚至共同创作者。

但严格意义上说,HappyOyster 仍然建立在生成模型框架之上,还不是外界想象中那种完整、自洽、具备高度物理规律与因果逻辑的通用世界模型。

它更像是一种过渡形态:在视频生成的基础上,向实时模拟与持续交互迈进一步。画面精细度仍有限,移动存在延迟,角色一致性和指令理解也有待提高,这些都说明它仍处于早期阶段。

但重要的从来不是它今天是否完美,而是它把方向明确了。

过去行业讨论 AI,大多数注意力放在大语言模型上。谁参数更多,谁推理更强,谁写代码更准,谁能替代办公软件。进入 2026 年后,这套叙事开始出现边际递减。

文本能力仍在提升,但用户的新鲜感下降,资本市场也越来越清楚:单纯的 chatbot 很难支撑高估值,真正能打开新市场的,是多模态,是视频,是交互,是数字世界。

阿里显然判断到了这一点。

HappyHorse 与 HappyOyster 前后脚推出,看似是两款产品,实际上是同一战略路径上的两步棋。第一步先证明自己在视频生成领域具备全球竞争力,重新获得市场注意力;第二步再把竞争维度抬高,从视频生成进入世界生成,把阿里的 AI 叙事从 " 能做模型 " 升级为 " 能定义下一代交互形式 "。

这背后,是阿里近期在 AI 领域明显提速的缩影。

不久前,阿里刚刚完成内部 AI 架构重组,成立 ATH(AlibabaTokenHub)事业群,将通义实验室、MaaS 业务线、千问事业部、悟空事业部以及 AI 创新事业部纳入统一体系。

外界当时更多关注组织动作,但真正的意义在于,阿里把过去分散在云、模型、应用、创新团队中的资源重新聚拢,目标只有一个:让 AI 产品研发与商业化进入快车道。

HappyOyster 正是在这样的背景下诞生的。

它来自 ATH 旗下创新事业部,与 HappyHorse 同属一个团队。这一点很值得玩味。过去几年,阿里在 AI 上最被熟知的资产是通义千问和阿里云,创新业务往往被视为边缘试验田。

但现在,阿里最激进、最具话题性的产品,恰恰出自创新事业部。这说明阿里内部正在形成一种新的机制:成熟业务负责稳态增长,创新团队负责押注未来入口。

这种分工,和阿里过去做电商时的打法很像。淘宝成熟后,天猫承接品牌化,闲鱼承接长尾,盒马探索线下零售。

今天阿里把这套逻辑搬到了 AI 时代:通义负责基础模型,阿里云负责商业化承接,千问负责大众入口,而 HappyHorse、HappyOyster 这类产品,则承担探索未来交互范式的任务。

巨震

从行业视角看,HappyOyster 的出现还有另一层意义:它让国内大厂在交互式生成赛道真正开始短兵相接。

腾讯这次推出的 HY-World2.0 更强调产业落地。它能够生成 Mesh、点云、3DGS 等多种格式资产,并与现有游戏引擎工作流衔接,方便开发者快速搭建地图、关卡与原型场景。

腾讯路线很清晰:让模型先服务于最擅长的游戏业务,解决开放世界开发周期长、美术成本高、内容产能不足的问题。

这背后有腾讯非常现实的算盘。

作为全球游戏收入最高的公司,腾讯拥有海量 3D 数据、成熟引擎经验和持续的内容需求。模型如果成熟,最先受益的就是游戏研发体系。过去需要数月才能完成的地图草模,未来也许一句话就能生成;过去几十人的美术团队做原型,未来几个人加 AI 就能完成。

阿里的路径则略有不同。HappyOyster 更强调实时交互、世界演化和开放创作体验,它不像腾讯那样先切产业工具链,而是更接近下一代用户交互入口。腾讯想先解决生产问题,阿里则在试探消费级体验的未来形态。

两条路线没有高下之分,只是起点不同。腾讯从游戏工业切入,阿里从内容交互切入,但终点可能是同一个地方:AI 成为数字世界的实时生成引擎。

这也说明,中国大厂在 AI 竞争中的逻辑已经发生变化。上一阶段比的是谁的通用模型参数更大、跑分更高;这一阶段比的是谁能找到与自身业务协同最深的落地方向。腾讯押 3D 世界,因为游戏是现金牛;阿里押多模态交互,因为电商、内容、云计算都需要更丰富的数字空间入口。

从这个角度看,HappyOyster 即便还不成熟,依然值得被认真看待。它透露出的不是产品完成度,而是公司方向感。一家巨头愿意投入资源做这种高不确定性的前沿产品,本身就说明其内部已经判断:AI 的下一阶段,不只是生成内容,而是生成环境;不只是回答问题,而是承载行为。

对于阿里来说,这一步尤为关键。

过去几年,外界谈论阿里,常常聚焦电商竞争、云增长放缓、组织调整频繁,AI 叙事反而被字节、腾讯、百度甚至创业公司分走了风头。

但最近几个月,阿里显然在试图重新拿回主动权。吴泳铭明确提出未来五年云与 AI 年收入突破 1000 亿美元的目标,组织上将 AI 提升到集团核心位置,产品上则密集释放新模型和新形态。

HappyHorse 是证明技术实力的一枪,HappyOyster 则是证明战略野心的一枪。

因为视频生成仍然是存量赛道里的竞争,而交互式生成代表的是增量市场。它连接的不只是内容创作,还可能是游戏、教育、文旅、虚拟社交、机器人训练,甚至未来空间计算设备的交互系统。谁在这个阶段率先卡位,谁就有机会参与定义下一代计算平台。

阿里显然不想只做别人生态里的模型供应商。

今天的 HappyOyster 也许还只是一个略显粗糙的 " 快乐牡蛎 ",腾讯的 HY-World2.0 也仍在早期打磨阶段,但两家巨头同日出牌,已经说明一个现实:交互式生成不再只是实验室概念,而开始成为中国科技公司的角逐场域。

真正的竞争,才刚刚开始。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 ai 腾讯 chatbot 导演
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论