"AI 教母 " 李飞飞的创业公司在 " 世界模型 " 赛道上迈出了关键的商业化一步。其公司 World Labs 正式发布首款商业产品 Marble,标志着人工智能从抽象的语言文本理解,向模拟和交互物理世界的空间智能领域拓展,意图在下一代 AI 技术竞争中抢占先机。
11 月 12 日,由斯坦福大学教授李飞飞联合创办的 World Labs 宣布,其首款由多模态世界模型驱动的产品 Marble 正式向公众开放。该模型能够利用文本、照片、视频或 3D 布局等多种输入形式,生成可编辑和下载的 3D 交互环境,使 World Labs 在与谷歌等科技巨头的竞争中取得了先发优势。

与两个月前的限量预览版相比,正式版 Marble 在功能上实现了重要扩展,包括支持更大规模的多模态输入,并推出了一个名为 Marble Labs 的创意中心。商业模式上,该产品采用免费增值与付费订阅结合的模式,旨在快速推向市场并建立用户基础。
Marble 的推出,直接瞄准了游戏开发、影视特效(VFX)和虚拟现实(VR)等对 3D 内容有巨大需求的行业。它为创作者提供了一种全新的资产生成工具,但同时也引发了行业对 AI 将如何重塑创意工作流程、以及其对就业岗位潜在影响的深入讨论。
抢先商业化,在竞争中建立差异
在方兴未艾的世界模型赛道,Marble 的商业化发布使其从众多研究项目和技术演示中脱颖而出。
目前,包括谷歌的 Genie 模型仍处于有限的研究预览阶段,而 Decart 和 Odyssey 等初创公司的产品则停留在免费演示版。据彭 · 博社报道,Marble 是该赛道首个投入商业应用的产品。其核心差异化在于,它能生成持久化、可供下载的 3D 环境,而非像 World Labs 自家的实时模型 RTFM(Real-Time Foundation Model)那样在用户探索时动态生成世界。
公司表示,这种设计能显著减少场景变形和不一致性,并允许用户将成果导出为高斯泼溅(Gaussian splats)、网格(meshes)或视频等专业格式,以便整合进现有工作流。

Marble 的输入输出管道图片来源: World Labs
主打创意控制与多模态输入
为解决 AI 生成内容 " 不可控 " 的痛点,Marble 将 " 创意控制权 " 作为产品核心。World Labs 联合创始人 Justin Johnson 在接受 TechCrunch 采访时表示:" 我们不希望机器完全接管,剥夺创作者的创造力。"
为此,Marble 在输入和编辑两端都提供了高度灵活性。
输入端:正式版支持用户上传多张图片或短视频,从不同角度展示一个空间,从而生成更逼真的数字孪生体。这解决了预览版仅支持单张图片输入时,模型需自行 " 想象 " 大量细节的局限。编辑端:产品推出了名为 "Chisel" 的实验性 3D 编辑器。该功能允许用户先搭建粗略的空间结构(如墙壁、方块),再通过文本提示填充视觉风格,实现了结构与风格的分离。Johnson 解释道:" 我可以进入场景,直接抓取代表沙发的 3D 块并移动它。"
此外,用户还可以对已生成的世界进行 " 扩展 ",或在 " 作曲家模式 " 下将多个独立世界拼接成一个更大的空间,进一步增强了创作的自由度。

使用 Marble 创建的太空飞船环境,并叠加了文字提示(请注意灯光是如何真实地反射在枢纽墙壁上的)。
图片来源: World Labs/TechCrunch
商业模式明确,瞄准三大应用场景
Marble 的商业路径清晰,通过分层订阅满足不同用户需求。其订阅方案共分四档:免费版提供每月 4 次生成;标准版(20 美元 / 月)和专业版(35 美元 / 月)提供更多生成次数与高级功能;而旗舰版(95 美元 / 月)则解锁全部功能,并包含 75 次生成及商业使用权。
短期内,World Labs 将目标市场锁定在三大领域:
游戏开发:Johnson 认为,开发者可使用 Marble 生成背景环境和氛围空间,再将这些资产导入 Unity 或 Unreal 等游戏引擎进行后续开发,作为现有管线的补充而非替代。影视特效:相较于 AI 视频生成器,Marble 生成的 3D 资产为艺术家提供了精确的场景控制和运镜能力,避免了画面不一致的问题。虚拟现实(VR):尽管 VR 并非当前首要重点,但 Johnson 指出,该行业对高质量内容 " 极度渴求 "。Marble 生成的所有世界均已兼容 Vision Pro 和 Quest 3 等主流头显设备。
然而,市场对该技术的接受度并非全然乐观。根据游戏开发者大会(GDC)最近的一项调查,三分之一的受访者认为生成式 AI 对游戏行业有负面影响,担忧主要集中在知识产权、内容质量下降等方面。
李飞飞的终极愿景:迈向 " 空间智能 "
在 Marble 发布的背后,是李飞飞对 AI 未来发展的宏大构想——实现 " 空间智能 "(Spatial Intelligence)。
李飞飞在近期发表的一篇文章中阐述,当前的大语言模型虽擅长处理抽象知识,但缺乏对物理世界的真实理解,如同 " 在黑暗中行走 "。她认为,赋予机器理解、导航并与三维世界交互的能力,即空间智能,将是实现真正通用人工智能的关键。而世界模型,正是通往这一目标的核心技术。
根据她的设想,具备空间智能的世界模型将分阶段变革多个行业:
短期:赋能创意产业,为电影、游戏和建筑领域的创作者提供强大工具。中期:推动具身智能机器人发展,通过在模拟环境中进行大规模训练,使其成为人类的协作伙伴。长期:在科学、医疗和教育等领域引发革命,通过模拟实验、辅助诊断等方式增强人类专家的能力。
" 若没有空间智能,我们对真正智能机器的梦想将是不完整的," 李飞飞写道。这一愿景获得了资本市场的有力支持。World Labs 自 2024 年创立以来,已迅速完成约 2.3 亿美元融资,估值突破 10 亿美元,跻身 " 独角兽 " 行列。其投资方包括 a16z、英伟达 NVentures、AMD Ventures 和 Intel Capital 等行业巨头与顶级风投机构。


