世界模型教父教母创业，公司估值加起来近百亿美元

AI 时代，独角兽已经不稀奇了，但世界模型这块还是有所空缺的。

从估值的变化上来看，李飞飞的 World Labs，最有可能成为全球首个世界模型独角兽公司。

根据报道，World Labs 的估值已经突破了 50 亿美元，并且拟融资 5 亿美元。

而 2024 年 9 月的时候，这家公司才以 10 亿美元估值完成 2.3 亿美元融资，正式在公众面前亮相。

从结果上来看，从登场到 50 亿美元估值，李飞飞仅用了 16 个月的时间。

这个速度有多快 ?

OpenAI 从 2015 年成立，到 2019 年微软首次投资，此时他们的估值也只有 10 亿美元。

最接近 World Labs 速度的可能是 Anthropic，但也花了 25 个月。

如果说李飞飞是世界模型教母，那么杨立昆可以说是世界模型教父。

2025 年 12 月，杨立昆在 LinkedIn 上确认离开 Meta，结束了他在这家公司长达 12 年的职业生涯。

杨立昆创立的新公司名为 Advanced Machine Intelligence Labs，总部设在巴黎。AMI Labs 正在寻求以 30 至 35 亿欧元估值融资 5 亿欧元。

不过，这两家企业高估值背后，并非对世界模型这一技术的吹捧，而是实打实的技术落地和商业化。

何为 World Labs？

World Labs 的投资方阵容包括 Andreessen Horowitz、NEA、Radical Ventures（李飞飞本人是 Radical Ventures 的科学合伙人）、英伟达风投部门、沙特 Sanabil Investments 和新加坡淡马锡。

天使投资人包括谷歌 DeepMind 首席科学家杰夫 · 迪恩（Jeff Dean），以及图灵奖得主杰弗里 · 辛顿（Geoffrey Hinton）。

World Labs 的核心技术理念叫做空间智能，这是一种 " 升维 " 的概念。

目前的顶尖 AI 虽然看起来很聪明，但它们本质上是 " 二维 " 的。它们只是处理文字序列或者像素排列，它们并不理解体积、有重量、受重力影响的实体。

World Labs 的空间智能技术，就是要赋予 AI" 对三维世界的认知能力 "。

以生成视频为例，空间智能是直接生成一个具有三维结构、且符合物理规律的虚拟环境，然后再在这个环境里去模拟要生成的实体。实体不仅有长宽高，还有材质和物理反馈。

在传统的 AI 训练中，模型学习的是像素之间的概率关联，比如蓝天下面通常是绿地，绿地旁边通常是小溪。

但 World Labs 的世界模型则是基于三维几何与物理模拟的原理进行训练的。

它在学习数据的过程中，得到的不仅仅是图像的纹理，还有图像背后的空间几何信息（比如深度、遮挡关系、透视角度）以及物理动力学规则（比如刚体如何碰撞、流体如何流动、光线如何反射）。

2025 年 11 月，World Labs 推出首款商业产品 Marble，这是一个能够从文本、图像、视频或粗略 3D 布局生成持久化 3D 世界的模型。

Marble 的技术底层采用神经辐射场（NeRF）和高斯点云（3D Gaussian Splatting）技术，而非传统的多边形网格。

神经辐射场是一种利用神经网络表示三维场景的技术，它将场景表示为连续的体积函数，输入三维空间坐标和观察方向，输出该点的颜色和体积密度。这种方法通过多层感知机学习场景的几何和光照信息，然后通过体积渲染生成逼真的新视角图像。

相当于在相同场景内，从每一个角度对实体进行拍摄，这样生成实体以后，用户从哪个角度看都符合物理规律。

高斯点云则是另一种三维表示方法，它用数百万个带有位置、大小、形状、颜色和透明度属性的高斯椭球体来表示场景，渲染速度比神经辐射场快得多，同时保持了高质量的视觉效果。

类似于乐高，通过小积木块最终搭建成完整的实体。

这使其能够生成连续的辐射场，包含空间理解、光照和深度信息的完整环境，而不是简单地组装多边形。

在 2026 年 CES 大会上，李飞飞在 AMD CEO 苏姿丰的主题演讲中展示了 Marble 的能力。

李飞飞说：" 将少数图片变成连贯、实时的世界，不再是对遥远未来的一瞥，而是下一章的开始。AI 正在给人们的生活带来一些改变，将少数图片或照片转化为一个实时可探索的世界。空间智能需要极致算力支持，才能实现可交互级帧率和无限持久的世界交互。"

World Labs 采用免费增值模式，免费版提供 4 次生成，20 美元每月可获得更多生成次数，最高 95 美元每月提供 75 次生成和商业使用权。

目标客户包括游戏开发者、影视特效制作、虚拟现实应用。而且 Marble 还支持苹果 Vision Pro 和 Quest 3 VR 头显，每个生成的世界都可以在 VR 中查看。

更重要的是，Marble 可以导出与 Unreal Engine 和 Unity 兼容的格式，这意味着它可以无缝集成到现有的游戏开发流程中。

李飞飞曾在访谈中表示，这项技术可能颠覆 Unity 和 Epic Games 的 Unreal Engine 等传统游戏引擎。

除了 AIGC 产业，World Labs 还瞄准机器人训练市场，通过模拟环境训练机器人的自主导航软件。世界模型可以为机器人提供一个安全的虚拟训练场，让它们在数字空间中学习物理交互、因果关系和长期规划，然后再应用到真实世界。

AMI Labs 的技术优势是什么？

但 AMI Labs 不像李飞飞的 World Labs 那样拥有实际的产品，目前还只停留在技术概念阶段。

潜在投资方包括 Cathay Innovation、Greycroft、Hiro Capital（杨立昆是 Hiro Capital 的顾问）、20VC、法国公共投资银行 Bpifrance、Daphni 和 HV Capital。

要注意，杨立昆在 AMI Labs 里担任的是执行主席而非 CEO。

该公司 CEO 职位由亚历克斯 · 勒布朗（Alex LeBrun）担任，他是医疗 AI 初创公司 Nabla 的联合创始人兼前 CEO。LeBrun 的前一家公司 Wit.ai 被 Meta 收购后，他曾在 FAIR 直接向杨立昆汇报。

团队还包括 Meta 欧洲副总裁劳伦特 · 索利（Laurent Solly），他于 2025 年 12 月离职加入 AMI。

不仅如此，AMI Labs 有法国总统亲自背书。法国总统马克龙对杨立昆选择巴黎表示自豪，承诺将尽一切努力确保他从法国取得成功。

AMI Labs 的核心技术是杨立昆多年倡导的联合嵌入预测架构（JEPA，Joint Embedding Predictive Architecture）。

以往的 AI，都是逐 token 生成输出的，然而联合嵌入预测架构能一口气直接以抽象表示的形式来创建世界，能够更好地预测未来状态。

联合嵌入预测架构的工作原理是，它不预测原始像素或 token，而是预测高层次的嵌入表示。

系统有两个编码器，一个处理上下文信息，另一个处理目标信息，还有一个预测器在嵌入空间中进行预测。这种方法避免了生成模型的一个关键问题，生成模型必须预测每一个像素或 token，包括那些不可预测的随机细节，而联合嵌入预测架构只关注可预测的高层次特征，忽略无关紧要的细节。

杨立昆在哈佛演讲中解释，这类系统通过在嵌入空间中进行优化来实现规划和推理。

AMI Labs 公司将推进 AI 研究并开发可靠性、可控性和安全性真正重要的应用，特别是工业过程控制、自动化、可穿戴设备、机器人、医疗保健等领域。

AMI Labs 的第一个应用将是医疗保健。

具体来讲，AMI Labs 通过与 Nabla 合作，开发临床护理 AI 助手。截止发稿，这个 AI 助手已获得了 1.2 亿美元融资，预计两年内达到 1 亿美元年度订阅收入。

作为交易的一部分，Nabla 获得 AMI 世界模型的特权访问权，而亚历克斯从 CEO 转为首席 AI 科学家兼董事长。

亚历克斯表示，他加入 AMI 的一个重要原因是将世界模型应用于医疗保健的前景，因为医疗保健的复杂性和高风险性使其成为测试世界模型的理想场景。

FDA 认证要求确定性、可解释的推理，这正是 LLM 无法提供而世界模型承诺实现的。大语言模型存在幻觉问题，在医疗场景中可能导致严重后果，而世界模型通过建立对患者生理状态的内部模拟，可以预测疾病进展，提供更可靠的决策支持。

2026 年 1 月，杨立昆还加入了另一家初创公司 Logical Intelligence，担任技术研究委员会创始主席。这家公司推出了名为 Kona 1.0 的能量基础推理模型，通过对约束条件评分来验证和优化解决方案，寻找最低能量也就是最一致的结果。

这种非自回归模型也和 AMI Labs 的联合嵌入预测架构相似，能够一口气生成完整的推理轨迹。

能量基础模型是一类通过能量函数来定义概率分布的模型。在这个框架中，每个可能的输出都被赋予一个能量值，能量越低表示该输出越符合约束条件。

模型通过优化过程寻找能量最小的解决方案。这种方法的优势在于可以同时考虑多个约束条件，并且可以进行全局优化，而不是像自回归模型那样只能做局部决策。

杨立昆表示，AGI 的最终状态不会来自单一模型类别，而需要能量基础模型、LLM、世界模型等组成的相互依存的生态系统。

都是世界模型，两家又有什么不同？

虽然李飞飞和杨立昆都在构建世界模型，但技术路线存在根本差异。

由于技术还处于早期，World Labs 的 Marble 本质上还是传统的生成式 AI 方法。它确实能生成 3D 世界，但这些世界本身还不具备物理知识。

World Labs 联合创始人在采访中表示，Marble 生成的罗马拱门并不知道如果移除一块砖，其他砖可能会掉落。它只是学会了罗马拱门在视觉上应该是什么样子，而不是理解支撑它的物理原理。

这种方法在创意内容生成方面表现出色，可以快速产出视觉上令人信服的场景，但缺乏对因果关系的深层理解。

相比之下，因为杨立昆的联合嵌入预测架构能够直接生成完整的结果，它就能够表示出来这里面的因果关系。

但是在市场方面，World Labs 已经获得了早期客户。World Labs 透露已有多家组织采用了 Marble API。这种先发优势使其在融资谈判中占据有利位置。

World Labs 明确瞄准创意产业，这些市场已经存在，客户有明确的痛点，3D 内容制作成本高、周期长，Marble 提供了立竿见影的价值。

游戏开发者可以用 Marble 快速生成背景环境，然后在 Unity 或 Unreal Engine 中添加交互逻辑。影视制作团队可以用它进行虚拟场景预览，大幅缩短前期制作时间。

从商业角度看，World Labs 的策略更加务实。它选择了一个已经存在的市场，提供了一个可以立即使用的产品，并且建立了清晰的商业模式。

AMI Labs 有点超前，它押注于一个尚未成熟的市场，追求技术突破，给这片全新的市场带来需求。这种方法风险更高，但如果成功，回报也会更大。

李飞飞的 World Labs 扎根硅谷，投资方以美国 VC 为主，虽然也包括沙特和新加坡主权基金。这使其能够充分利用硅谷的人才、资本和客户网络。

反观杨立昆，他选择巴黎作为总部，这不仅是个人偏好，更是战略选择。

欧盟正在建立 AI 主权，减少对美国科技巨头的依赖。AMI Labs 获得法国政府的高调支持，可能在欧洲监管环境中获得优势，特别是在医疗保健等高度监管的领域。

两家公司的人才策略也有所不同。

World Labs 主要招募的是大量计算机视觉和图形学背景的研究者，这些人擅长处理视觉数据和渲染问题。AMI Labs 方面则更倾向于招募有机器学习理论和物理建模背景的研究者，这些人更关注模型的数学基础和泛化能力。

李飞飞相信通过大规模数据和计算，可以让模型学会对空间的隐式理解，即使它不明确建模物理规律。这种方法在计算机视觉领域已经被证明有效，ImageNet 项目就是最好的例证。

杨立昆则坚持认为，真正的智能需要显式的世界模型，需要理解因果关系而不仅仅是相关性。他多年来一直批评纯粹的生成式方法，认为它们无法达到人类水平的推理能力。

所以看下来，虽然两个人的技术完全不同，然而实际上，这两条路之间好像也没有那么水火不相容。

事实上，它们可能最终会融合。World Labs 的生成能力可以为杨立昆的因果模型提供丰富的训练数据，而联合嵌入预测架构的推理能力可以增强 Marble 的物理一致性。

AI 的未来可能不是选择其中一条路，而是找到两者的最佳结合点。

无论哪条路径最终胜出，世界模型都代表了 AI 从理解语言到理解物理世界的重要转变。

它意味着我们不再满足于让 AI 模仿人类的语言能力，而是要让它理解什么才叫客观规律。

欢迎在评论区留言 ~

如需开白请加小编微信：dongfangmark

宙世代

一起剪

相关标签