速度提升百倍！XR空间计算正迎来“UGC大基建”时代

AI 3D 生成的范式革命

文 /VR 陀螺冉启行

2026 年，AI 眼镜正在快速迭代，VR/MR 头显的形态也在持续向更轻、更薄演进。

随着硬件门槛的逐步降低，开发者和内容创作者对高质量 3D 资产的需求正在同步提速——无论是 VR/MR 游戏场景、AR 应用还是工业数字孪生，3D 内容的生产效率与质量正在被重新抬上核心议程。然而，传统三维建模的周期长、门槛高、成本难以摊薄，即便是专业团队，也很难用人力跟上内容需求增长的节奏。

visionOS（图源：网络）

在 GDC 2026 前夕，通用人工智能公司 VAST 正式发布了 Tripo P1.0（Smart Mesh），与旗舰模型 Tripo H3.1 相比，它在内容生成上交出了一份完全不同范式的答案。Tripo P1.0 实现了第一次在原生三维空间里做概率生成，不再依赖序列化「拼接」几何，而是在高维噪声场中直接演化出结构完备、拓扑规整的三维网格，最快约 2 秒即可产出可直接进 Unity、UE 等引擎的专业级 3D 资产。

Tripo P1.0 可以看作 AI 3D 大模型算法范式的全新分水岭，它让速度、质量与工程可用性不再是互相牺牲的三难选择，开始同时成立。对 XR 等重 3D 资产的行业来说，这意味着 AI 3D 进一步迈入了商用级规模化的新阶段。

图源：网络

从维度诅咒到原生三维，Smart Mesh 做的是底层算法重构

传统 AI 3D 生成模型，在真正碰到可落地这件事时，往往会被维度诅咒卡住。三维空间数据过于庞大、结构过于复杂，模型不得不通过体素网格、体渲染场或点云序列等形式先降维、再线性化处理，再通过一连串后处理把结果勉强还原成可用网格。这类路径在学术论文和 Demo 中看上去可行，但一旦落到游戏、工业或 XR 生产线，问题就会集中爆发——生成速度慢、拓扑脏乱、细节不稳定、引擎兼容性差。

VAST 首席科学家曹炎培对此表示：" 过去大家习惯了在 2D 矩阵或 1D 序列上做理解和生成，将处理文字、图像、视频的方法迁移到 3D 上，本质上还是在用不适合三维的表示去逼近三维，所以模型在表征层面会非常吃力。因为三维空间本身有它自己的结构特征，比如各向同性、连续性和拓扑约束。严格来说，问题并不在于维度高本身，而在于没有找到三维数据真正合适的底层表征。经典机器学习里也一样，所谓‘维度诅咒’很多时候并不是维度本身不可解，而是你还没有找到它背后的低维流形和本征结构。一旦表征对了，很多原来看起来像诅咒的问题，其实都会被重新改写。比如像我们现在做 Tripo P1.0 模型这样找到正确的底层表征，这就不再是大问题。"

图生 3D 模型演示（图源：VR 陀螺）

Tripo P1.0（Smart Mesh）的技术路径是绕开了原来的一整套补丁式工程。官方将其定义为一套原生三维生成框架，不是在 2D 投影或隐式体上间接优化，而是让概率生成引擎首次在纯三维坐标空间中直接运行，从一片高维噪声场出发，在空间中逐层「生长」出几何结构。模型不再是按序号逐点预测顶点，而是在统一的三维特征场上，先确定宏观结构，再向局部细节收敛，让复杂空间坐标同步收束成型。

在这个过程中，Smart Mesh 把原本显式编码在规则里的大量几何先验，全部收进了高维潜在空间。每一个顶点不仅仅是一个坐标，而是带着丰富上下文关系的潜在向量，彼此之间的连接关系通过潜在拓扑映射被持续更新与收敛。当概率空间收敛完成，模型直接涌现出一个几何稳定、拓扑严谨、可编辑性良好的网格。

3D 模型演示

这种重构带来的直接结果，是模型不再被迫走 " 慢而精 " 或 " 快而糙 " 的老路，而是在统一的原生三维概率框架下，同时兼顾宏观结构、局部拓扑与细节纹理，为后续所有下游工程环节（减面、骨骼、动画、渲染）预留出最大空间。

百倍推理效率提升，秒级 3D 模型生成技术

底层重构到底能给前端带来多大改变？我们在 Tripo Studio 中直接上手跑了跑。

输入文本或参考图后，几乎不需要漫长的等待。根据官方披露的数据，Smart Mesh 可以在约 2 秒内生成面数从数百到两万不等、拓扑规整的网格模型。受面数、当前网络环境及云端服务器拥挤程度影响，实际测试体感用时在 10 秒左右。但相比于行业普遍水平，这已经实现了量级的跨越。

曹炎培表示：" 我们用比较优雅的数学推导绕过了之前离散组合的暴力算力消耗，这也是为什么之前的方法可能要三五百秒，而我们五六秒就能生成一个网格。背后所需算力被大大减少，不是强行压缩计算量，而是免除了之前方法中因强加因果和排序所带来的不必要计算。"

文生 3D 模型演示（图源：VR 陀螺）

最让我们在意的其实不是速度，而是网格的质量。以往 AI 生成的模型往往伴随着破面和杂乱的边线，但 Smart Mesh 跑出来的低多边形网格，边线清爽、结构合理。

曹炎培对此表示：" 我们相当于把拥有多年经验的艺术家才能做出的拓扑布线逻辑，变成了算法上的直觉。普通人通过一张图或一个想法就能瞬间获得一个外观正确、结构符合工业标准的资产，不管是创意设计还是生产力用户，都能回归到意图本身。"

文生 3D 模型演示，局部重绘调整（图源：VR 陀螺）

这种 " 工业级直觉 " 早已在实际业务中显现价值。其原有的 H 系列模型在技术与商业化上已稳居行业头部，并深度服务于网易《燕云十六声》、拓竹科技等标杆客户，实现了 3D 打印与游戏 UGC 的大规模产业落地。在原有路线已领跑行业、商业价值全面兑现的背景下，团队依然坚持从底层算法范式进行颠覆式创新。 Smart Mesh 的出现，从某种程度上看，也代表着 VAST 的这家公司底色——极客精神。

从视觉拟真向功能性演进，AI 3D 开启 UGC 互动内容新时代

今年 3 月，VAST 刚宣布完成 5000 万美元的 A 轮融资。据介绍，这笔资金将主要用于 VAST 继续迭代核心算法、积累数据，以及建设 UGC 互动内容平台。

如果说 AI 3D 的 1.0 时代是在追求 " 看起来真 "，那么以 P1.0 为代表的 2.0 时代则是在追求 " 功能性 "。曹炎培表示：" 未来很快，大家就会模糊‘ 3D 建模’的概念。用户会回归到创造 3D 模型的原始意图，而不是纠结于怎么用工具得到它。在当今 AI 时代，VAST 提供的 AI 3D 生成能力是像输入法、摄像头一样的基础能力。"

AR 应用演示（图源：AI 生成）

在 VAST 的技术版图中，高质量的 3D 资产构成了交互世界中持久性的 " 状态 "，而 " 世界模型 " 则负责建模状态之间的 " 转换 " ——比如角色怎么和环境交互、交互过程应该怎样自然地呈现和生成。

当下的 XR 产业，高质量内容生产的瓶颈日益凸显。未来的空间计算设备，用户需要的绝不仅仅是几个预先做好的 Demo，而是海量的、个性化的、甚至实时生成的 3D 世界。

曹炎培指出：" 当生成一个标准的 3D 交互资产只需要几秒，想象力就会被无限放大，用户不会觉得利用三维资产做想做的事情还有任何障碍。这种 2.0 时代的技术，把之前 1.0 时代速度、质量和可用性的‘不可能三角’变为可能并同时成立。"

通过降低门槛，让不具备专业技能的普通人也能通过自然语言构建交互式内容，VAST 正在尝试定义下一代 UGC 互动平台的基石。在这一轮内容生产逻辑的重构中，行业亟需一个既快、又稳、还能直接接入工业管线的 AI 3D 底座，而 VAST 正试图通过 Smart Mesh 证明，他们就是那个 XR 时代 " 大基建 " 的提供方。

第一时间了解 XR 资讯

关注 VR 陀螺官网（vrtuoluo.cn）

VR 陀螺的联系方式：

商务合作 | 投稿：

六六（微信号 13138755620）

寻求免费曝光：

六六（微信号 13138755620）

投稿邮箱：tougao@youxituoluo.com