量子位 前天
国产世界模型登顶全球第一!断层领先谷歌英伟达,3D准确度逼近满分
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

还得是咱国产世界模型牛!

极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一

而且还是唯一一个综合得分突破60 分大关的具身世界模型。

什么概念呢?就以三大核心维度为例,几乎是断层式领先:

Physics Adherence(物理遵循):相比第二名提升了整整 16%。

3D Accuracy(3D 准确度):近乎逼近满分。

Visual Quality(视觉质量):同样遥遥领先。

也就是说,GigaWorld-1 是真正的全能型具身世界模型,不仅视觉真实,而且几何精准、物理准确。

这意味着,极佳视界这家由清华系领衔,汇聚了阿里、百度、地平线等一众顶尖大厂核心骨干的中国团队,已经率先完成了一次教科书式的技术超车。

从最严苛的 " 试金石 " 脱颖而出

众所周知,WorldArena是世界模型领域公认的 " 试金石 "。

它由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学以及中国科学技术大学等 8 所国内外顶尖高校及科研机构共同打造。

其摒弃了单一维度的片面测试,转而构建包含 16 项细分核心指标和 3 大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的压力测试。

也正因如此,WorldArena 吸引了全球几乎所有头部世界模型团队同台竞技,首批参评名单包括谷歌、英伟达等。

最终的结果也出乎所有人意料,不是科技巨头,而是这家低调耕耘的技术扫地僧——极佳视界

其旗下最新的 GigaWorld-1 凭借硬核实力,成功摘得桂冠!

显式动作建模与可微分物理引擎的完美融合

那么为何 GigaWorld-1 能取得如此傲人的成绩呢?

首先从技术路线看,GigaWorld-1 是一款专为具身场景打造的AC-WM(Action-Conditioned World Model,动作控制世界模型) 。

相较于传统的世界模型,GigaWorld-1 深度继承并发展了极佳视界在去年 7 月发布的EmbodieDreamer核心架构。

该方案不仅引入了显式的动作建模机制,从根本上保证了视频生成过程中的几何一致性;更创新性地融入了可微分物理引擎,从而获取精准的机械臂物理参数,以实现对复杂物理交互过程的真实模拟与严格遵循。

在此前沿架构的基础上,极佳视界进一步引入了团队长期积累的上万小时高质量真实机器人操作视频数据进行训练,极大地增强了模型在开放场景下的泛化能力与高精度的动作遵循表现。

目前,GigaWorld-1 的核心代码与部分数据集已开源

仅开源后的短短半个月内,GigaWorld-1 在 HuggingFace 平台的下载量便火速突破 16000 次,足见学术界与工业界对其技术实力的高度认可,以及在开发者社区中的巨大影响力。

同时 GigaWorld-1 还将作为官方 Baseline,强力支持即将于 3 个月后在美国举办的 GigaBrain Challenge@CVPR 2026 国际挑战赛,为全球开发者积极赋能,共同推动具身智能生态的繁荣发展。

( 比赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/ )

于是这就引出了一个关键问题——

极佳视界是谁?

国内首家专攻世界模型的公司

在业内,极佳视界是少有的产投双栖玩家,一边闷头做技术,一边又能拿下巨额融资。

在本月初,极佳视界刚刚宣布完成近 10 亿元 Pre-B 轮融资,投资方阵容堪称豪华——

中芯聚源、上海半导体产投基金、临芯资本、星源资本、万林国际等顶尖芯片和汽车产业资本领投,中金资本、苏创投、华强资本等重磅国资平台和知名财务机构跟投。

而这,也并非极佳视界首次获得资本追捧。

早在 2025 年 11 月,华为旗下的哈勃投资就已联合华控基金,完成了对极佳视界的亿元级 A1 轮战略投资。

其实华为对世界模型关注已久,此前就将世界模型列为未来智能世界 2035 年十大技术趋势之首。

但它没有像谷歌、英伟达、特斯拉这些全球科技巨头那样直接布局世界模型,而是通过哈勃投资,先在中国市场找到了最具潜力的标的——极佳视界。

极佳视界是国内第一家布局世界模型的公司,在世界模型的模型架构和数据引擎两方面都拥有行业领先的深入积累。

公司定位相当清晰,就是聚焦物理 AI,致力于世界模型驱动的物理世界通用智能。其技术护城河建立在" 世界模型 × 具身大脑 "的双轮驱动战略上,并在世界级权威测评榜单中,成功拿下具身大脑和世界模型的双料冠军。

产品矩阵包括世界模型平台 GigaWorld、具身基础模型 GigaBrain、通用具身本体 Maker 等物理 AI 全栈软硬件产品。

GigaWorld:物理世界的 " 数字沙盒 "

GigaWorld是极佳视界自研的世界模型平台,能模拟物理世界运行规律,生成高保真合成数据。

与传统仿真器相比,GigaWorld 能通过几何一致、物理准确的世界模型建模,生成高保真、可控、多样化的具身交互数据,实现数据放大。

这使得所训练的 VLA 模型在新纹理、新视角、新物体位置三大泛化维度上均实现近 300% 的性能提升。

更关键的是,GigaWorld 能带来10-100 倍的效率提升

在具身方向,GigaWorld-0 是全球首次让具身世界模型在高水平具身基模上发挥核心价值,其 GitHub 开源代码斩获 1.5k+ Star,奠定了技术验证的基础。

本次登顶 WorldArena 的 GigaWorld-1,也是当前全球最领先的 AC-WM。

在驾驶方向,DriveDreamer 系列是全球范围内最早将世界模型用在物理世界的系列开创工作。

此外,GigaWorld-Policy 也是全球首次实现世界 - 动作模型 WA实时性、成功率、训练效率全面突破,实现了对主流 WAM 推理效率和性能的全面碾压,让世界 - 动作模型真正开始进入大规模 Scaling 阶段。

实测数据显示,GigaWorld-Policy 实现了 10 倍推理速度与 10 倍训练效率的跨越式提升,同时任务成功率大幅上涨 30%,标志着具身智能正式迈入由世界模型驱动的新纪元。

GigaBrain:机器人的 " 通用大脑 "

GigaBrain是极佳视界开发的端到端视觉 - 语言 - 动作基础模型,在全球目前规模最大的真机评测比赛中,极佳视界的开源模型 GigaBrain-0.1 超越 Pi0.5 等众多模型,获得全球第一。

后续发布的 GigaBrain-0.5M* 则是全球首个基于世界模型的强化学习实现高效学习和自我进化的具身基模。

它提出基于世界模型的强化学习范式,并采用迭代式四阶段闭环训练流程。

在高难度长时程任务中,面对折纸盒、咖啡制备、衣物折叠等包含多阶段操作、精细感知与持续决策的复杂场景,GigaBrain ‑ 0.5M* 均实现接近 100% 的任务成功率,并可稳定复现,充分彰显出卓越的策略鲁棒性。

物理 AI" 梦之队 " 集结

除了技术和融资,极佳视界更亮眼的莫过于其核心团队:

创始人兼 CEO 黄冠,清华大学自动化系创新领军工程博士。

曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人 & 算法副总裁,并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。

他完整经历了过去十年物理 AI 的技术和产业发展历程,多次带领团队获得全球权威 AI 比赛世界冠军,并发布多个全球知名 AI 成果。

联合创始人兼首席科学家朱政,智源青年学者,发表顶级论文 70 余篇,引用近 2 万次。

多篇著作影响力巨大,连续 4 年入选全球前 2% 顶尖科学家榜单,多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF 杰出论文奖等荣誉,也是多个顶会领域主席、多项竞赛冠军。

联合创始人孙韶言,曾担任阿里云总监,地平线数据闭环产品线总经理,在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。

他主导了业内首个智能驾驶数据闭环系统的落地,有效提升了数据的处理效率,为智能驾驶技术的发展提供了重要的基础设施支持。

合伙人兼工程副总裁毛继明,拥有超过 16 年的仿真 / 工程 / 数据 / 分布式架构方向的经验。

曾担任百度 Apollo 仿真和工程负责人,以及曾担任百度、赢彻等 T10 级别架构师,主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。

另外,极佳视界模型核心团队还包括博士期间超 10 篇顶会一作的世界模型顶尖科学家、超过 10 年物理 AI 全栈量产经验的产业专家、华为天才少年获得者、万卡集群线性加速的顶尖算法和 infra 专家等,是行业少有的同时拥有顶尖的新一代物理 AI 全面技术前沿创新能力和传统物理 AI 全栈系统量产经验的全栈团队。

可以说,这支团队完整经历了 CV、自动驾驶、具身基模、世界模型等物理 AI 过去十年的发展历程,并在每个阶段都做出了行业领先的世界级成果。

当他们聚集在一起,就共同造就了这支始终引领具身世界模型技术演进的 " 梦之队 "。

从数据引擎(Data Engine),到闭环仿真器(AC-WM),再到世界动作模型(WAM),极佳视界一直走在前列。

无论是当前世界模型和具身智能基础设施的迭代,还是未来的 AGI,极佳视界都将持续打造最坚实的技术基石。

比赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/

开源代码:https://github.com/open-gigaai/CVPR-2026-Workshop-WM-Track

开源模型和数据:https://huggingface.co/collections/open-gigaai/cvpr-2026-worldmodel-track

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 英伟达 北京大学 物理 准确
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论