刚刚！阿里开放世界模型“快乐生蚝”来了，从视频到一个新世界

智东西

作者｜王涵

编辑｜李水青

智东西 4 月 16 日报道，刚刚，阿里 ATH 创新事业部也发布了其首款开放式世界模型 HappyOyster（快乐生蚝）。

基于原生多模态架构，该模型支持多模态理解、音视频联合生成以及实时世界构建与交互。

一个自由行走的伐木棕熊，角色与场景在转向后都可以保持一致性

在 HappyOyster 中，仅凭一行文本或一张图片，用户就可以生成一个完整的物理世界。并且，其生成的并非仅仅是视频片段，而是一个持续运行的物理世界。在这个世界里，光照、重力、角色动作以及场景间的因果关系都保持时间和逻辑上的连续一致。

真实还原梵高画作风格和细节，元素依照物理规律放置，随着视角转换无畸变现象

与传统的「写提示词—等待渲染—收到成片」一次性工作流的 AI 视频工具不同，在整个生成过程中 HappyOyster 可以实时接收指令，场景会实时作出反应，并随着用户的持续指令不断演化。同时，用户生成的数字世界，不仅能被完整保存，还能开放给其他用户进行二次创作。

用户可以创造出一个实时滑雪的场景，角色转向自如，雪地上的滑板印清晰明显

智东西第一时间获取了邀请码，体验后发现 HappyOyster 在 " 世界一致性 " 上确实带来了惊喜，主角形象、场景风格和物体位置都可以保持稳定，没有出现常见的畸变或错乱。同时，实时修改指令后，世界画面能够立刻响应。不过目前，模型的流畅度还有待提升，控制人物移动与镜头旋转，都能感知到卡顿。

自 3 月阿里巴巴 CEO 吴泳铭带队组建 ATH 以来，团队动作不断。此前在开发者圈引发热潮的 HappyHorse 尚未登场，HappyOyster 就已试图将布局拓展至更远：从 " 生成视频 "，正式迈向 AI 领域专家李飞飞所提出的 " 生成世界 " 全新高地。

该模型于今日开启内测，内测名额还在持续释放中。

体验地址：

https://www.happyoyster.cn/

一、亲测生成世界：人物不畸变、场景丝滑切换，但视角切换有卡顿

据 HappyOyster 官网介绍，目前该模型具备导演模式与漫游模式。其中，导演模式生成的世界最多可以有 3 分钟，分辨率可以选择 480p 或 720p；漫游模式则至多生成 1 分钟的世界，且清晰度只有 480p。两种模式下，世界都是声画同时生成的。

导演模式与漫游模式参数

在导演模式中，用户可以随时介入所生成的世界，通过文本、语音或图像来切换镜头角度、指导角色行动，或改变故事的走向，世界会立即响应，并按照这些指令继续展开。

潜水员在海底接近沉船

我们在导演模式下，选择 480p 的清晰度和 "Regular" 和 "Steady" 模式，输入提示词如下：

[ 开场 ] 你是一名火星基地的宇航员，结束舱外作业，进入气闸舱。关闭厚重舱门，气压读数上升。摘下头盔，汗水顺着脸颊滑落，深吸一口循环空气中的金属味。

[ 走进生活舱 ] 绿色植物在 LED 灯下生长，跑步机靠墙，舷窗外红色荒漠延伸至地平线。坐到电脑前，敲下：" 第 287 天，一切正常。"

[ 推开植物舱门 ] 湿润的热浪扑面而来。番茄藤爬满支架，LED 灯光闪烁，自动灌溉系统发出轻微的嘶嘶声。

[ 爬上观测台 ] 进入穹顶观测台。360 度全景玻璃外，火星星空璀璨夺目，火卫一正快速划过天际。

[ 进入休息舱 ] 穿过走廊进入休息舱。窄小的床铺，墙上贴着家人的照片。躺下时，飞船金属骨架发出熟悉的吱呀声。

HappyOyster 生成世界的效果如下：

从视频清晰度来看，HappyOyster 生成的画面整体清晰，场景切换时画质稳定无断层；在真实感上，主角身材、衣着、样貌均未出现畸变，宇宙飞船风格也保持统一，不过在场景切换时仍带有一定 AI 生成痕迹。视频所配的背景音乐也符合画面调性。

指令遵循方面，输入修改指令后世界能够立即响应并实时更改画面，执行效率较高；物理规律层面，整体符合基础物理逻辑，但也存在少量 bug，比如角色从窗户进入时，窗框出现了像橡皮一样被扯开的变形问题。

在漫游模式中，用户能以第一人称漫游，自由改变方向和镜头运动，突破原有画面边界，而世界则会持续生成并保持连贯。在这个世界里，物体的位置保持稳定，环境随时间持续存在，用户移动时视角与光照也会连续响应。

一个男人在废土世界中行走

我们在漫游模式下选择第三人称视角，输入提示词如下：

一位穿着冰蓝色长裙的银发女子站在冰封的湖面上。雪花围绕她飞舞，她的长发和裙摆随风飘动。背景是极光和雪山，冰面反射出她的身影和极光。镜头围绕她旋转，捕捉冰晶在阳光下折射的七彩光芒。

从视频清晰度来看，HappyOyster 生成的世界画面清晰，漫游过程中视角转动、场景切换都十分流畅，光影效果会跟随视角自然变化，镜头旋转一周后，场景内物体位置依旧保持固定，没有出现漂移错乱。

在真实感与 AI 痕迹上，生成的环境与主角形象高度贴合提示词描述，人物无畸变、无穿模，整体自然真实，AI 生成痕迹较弱。在指令遵循程度上，模型能准确响应操控指令，可顺畅控制角色行进方向，以及镜头的朝向与角度。

在物理规律层面，场景物体空间位置稳定，视角与光影的联动变化符合现实逻辑，整体物理表现连贯合理。

美中不足的是，无论是在导演模式还是漫游模式下，控制人物和镜头还会出现卡顿的情况。

在 X 上，也有用户分享出了自己的作品。她制作了一一个颜色鲜艳、光怪陆离的世界，在世界中有一个小男孩背着背包在行走。这位网友说（她）使用的是导演模式，分辨率 480p，选择「常规」与「稳定」设定，然后输入提示词即可。

网友实例（来源：X）

除了现实风格，用户在 HappyOyster 中还可以生成漫画、水墨画、素描等不同画风的世界。

漫画风格的世界，汽车川流不息

此外，世界中的主角也不仅仅局限于人类，在 HappyOyster 里，用户还可以创造以物品或动物、昆虫等为第一视角的世界。

足球视角在足球场上滚动

蚂蚁视角在衣服上爬行

二、对标谷歌 Genie3，阿里押注 " 世界模拟器 " 路线

相比大语言模型相对成熟的模型架构和技术范式，世界模型仍属于前沿探索领域。

据 HappyOyster 团队介绍，阿里的 HappyOyster 与谷歌的 Genie3 同属于世界模拟器流派。区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程，这一流派采用长时间跨度上的世界演化建模方式。

通过学习海量长视频数据，以及文本、动作指令、图像参考等多样控制信号，模型能够主动理解空间、物理与因果规律，预测情节和画面的演变，从而把 " 被动生成内容 " 转变为 " 主动模拟世界演化 "。

此次阿里发布的 HappyOyster 采用了时间跨度更长的世界演化建模方式，使得模型能够保持高保真、长时序的动态场景生成。

同时，该模型在建模初始就设计了多样的控制信号，使模型能够在统一的时序框架下同时实现生成质量、长时序与实时可控性的协同优化。

结语：阿里入局，给世界模型再添一把火

阿里 ATH 创新事业部在 2026 年 3 月正式成立，到今天是整一个月。

在这一个月的时间里，ATH 创新事业部发布了企业级 AI 原生工作平台 " 悟空 "、AI 开发工具秒悟 Meoo、视频大模型 HappyHorse，进度不可谓不惊人。

今天阿里 ATH 正式入局世界模型，给世界模型赛道再添一把猛火。

在阿里发布世界模型的同一天，腾讯也推出了混元 3D 世界模型 2.0。前一天李飞飞的渲染引擎 Spark 2.0 开源，1 月爱诗科技发布了世界模型 PixVerse R1。

这 4 个月以来，世界模型更新的节奏快得让人喘不过气，也能从侧面反映出：世界模型已经开始真刀真枪地抢地盘了。

这场关于 " 谁能造出更真、更活、更好玩的数字世界 " 的较量，才刚刚热起来。

宙世代

一起剪

相关标签