快科技 9 月 2 日消息,今日,腾讯混元官方宣布,HunyuanWorld-Voyager(简称混元 Voyager)正式发布,这是业界首个支持原生 3D 重建的超长漫游世界模型。
该模型在斯坦福大学李飞飞团队发布的世界模型基准测试 WorldScore 上位居综合能力首位,超越现有开源方法,在视频生成和 3D 重建任务中均表现出色。
在视频生成和视频 3D 重建两个任务上,Voyager 也均取得更好的结果。
据介绍,混元 Voyager 聚焦于 AI 在空间智能领域的应用扩展,将为虚拟现实、物理仿真、游戏开发等领域提供高保真的 3D 场景漫游能力。
模型突破传统视频生成在空间一致性和探索范围上的局限,能够生成长距离、世界一致的漫游场景,支持将视频直接导出为 3D 格式。
据了解,混元 Voyager 3D 输入 -3D 输出的特性,与此前已开源的混元世界模型 1.0 高度适配,可进一步扩展 1.0 模型漫游范围,提升复杂场景的生成质量,并可对生成的场景做风格化控制和编辑。
此外,该模型可支持视频场景重建、3D 物体纹理生成、视频风格定制化生成、视频深度估计等多种 3D 理解与生成应用。
官方表示,混元 Voyager 首次通过空间与特征结合的方式,支持原生的 3D 记忆和场景重建,避免了传统后处理带来的延迟和精度损失。
同时,在输入端加入 3D 条件保证画面视角精准,输出端直接生成 3D 点云,适配多种应用场景。
额外的深度信息还能支持视频场景重建、3D 物体纹理生成、风格化编辑和深度估计等功能。
登录后才可以发布评论哦
打开小程序可以发布评论哦