钛媒体 08-12
王兴兴、银河通用王鹤与英伟达高管罕见同框:未来十年人形机器人产值将超千亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

从左至右:宇树科技创始人、CEO 兼 CTO 王兴兴;NVIDIA Omniverse 和仿真技术副总裁 Rev Lebaredian;北京大学助理教授、银河通用创始人兼 CTO 王鹤

" 下一波浪潮是物理 AI。" 如同押注 OpenAI 一样,英伟达 CEO 黄仁勋正在中国押注未来的具身智能巨头。

8 月 12 日消息,英伟达 NVIDIA Jetson AGX Thor 开发套件近期开启发售,专为人形机器人设计,提供业界领先的 AI 性能,拥有 2070 FP4 TFLOPS、128GB LPDDR5 内存。与 AGX Orin 相比,Jetson Thor AI 计算能力提升 7.5 倍,能效提升 3.5 倍,售价 3499 美元。

事实上,OpenAI 成立之时,英伟达向奥尔特曼(Sam Altman)交付了超级计算机。而在具身智能领域,英伟达首批 Jetson Thor 芯片交到了中国的银河通用手里,银河通用的具身大模型机器人 Galbot 成为了全球首台体内部署 Thor 芯片的机器人产品。

2025 年世界机器人大会期间,银河通用首发了搭载英伟达 Jetson AGX Thor 芯片的 Galbot 机器人应用,工业物流搬运场景机器人展现了丝滑漂移,规划能力也明显提升,而且机器人搬运时完全基于视觉引导,面对现场工作人员的干扰,机器人可以稳定精准地抓取,成为全场焦点。

与王兴兴的宇树科技一样,成立于 2023 年的银河通用,是国内具身机器人头部公司之一,在 2025 年 6 月创下具身大模型机器人领域的单笔最大融资纪录,公司累计融资额已经超过 24 亿元,投资方接近 40 家。

今年 1 月,王兴兴在朋友圈转发并点赞银河通用发布的全球首个端到端具身抓取基础大模型 GraspVLA。

8 月 7 日,全球首个城市级商用人形机器人示范区落地北京海淀,同时,全球首个机器人全自主服务快闪店 " 银河太空舱 " 在海淀营业,以 " 银河太空舱 " 为代表的具身智能终端,开始走近居民日常。

" 银河通用走出今天的第一步意义很重大。" 北京大学助理教授,银河通用创始人及 CTO 王鹤对笔者表示,银河太空舱是在商业场景下全球唯一面向消费者常态化经营的具身智能零售解决方案。银河通用将以北京为起点,在更多城市打造百个银河太空舱,对银河通用而言,未来几年最关键的任务是完成千台至万台机器人的自主批量交付。

2025 年世界机器人大会期间,NVIDIA Omniverse 和仿真技术副总裁 Rev Lebaredian;与宇树科技创始人、CEO 兼 CTO 王兴兴;北大助理教授、银河通用创始人及首席技术官、智源学者王鹤一起进行小范围媒体交流,深聊未来 10 年机器人如何改变世界。

王鹤在会上给出了一个大胆的预测,人形机器人每三年产值乘 10,六年后人形机器人规模超过 10 万台级,市场至少有千亿级规模,并且在五年内可见成效。

" 所以说我觉得在未来十年里,人形机器人的整个占比不会小,但得看跟谁比。工业大机械臂全球的总产值也就 1000 亿人民币,而人形机器人按 10 万一台的话,实际上达到一个并不是大家觉得那么高的量级,但超过了整个工业机械臂的总产值。我预计未来每三年人形机器人的产值会乘 10,那么我们现在头部是卖 1000 台,三年后就是 1 万台,再三年后就是 10 万台。那么 10 万台级的量,如果卖几十万一台的话,干活的就达到了 1000 亿,超过了一家公司,也超过了整个工业机械臂的总产值。所以说在未来 10 年,我们将看到的是一个能够超越当前所有工业机器人量的机器人市场。再往后 10 年,可能是超越汽车手机这个市场量的万亿市场,所以不能低估它,但也没有大家想的那么快。" 王鹤称。

以下是笔者对此次交流进行的一些信息整理:

银河通用王鹤:我们共同的目标是打造通用机器人

王鹤表示,银河通用通过与 NVIDIA 的一系列合作,从仿真到可落地的产品,利用合成大数据赋能的 VLA 驱动工业级机器人。

首先,他认为今天在场的所有机器人公司,包括 NVIDIA 和银河通用在内,共同目标都是打造通用机器人。这样的通用机器人将成为下一个价值数万亿美元、数万亿人民币市场的关键性、革命性产品。这种革命性产品背后包含多个核心要素:机器人的本体;驱动它运转的具身智能模型;模型背后则是数据支撑——什么样的数据能训练出这样的能力。

与其他公司的不同之处在于,银河通用机器人并非完全人形,而是轮式双臂双手的形态,采用轮式底盘,主打高续航、工业级安全性,以及可实现大规模、高可靠交付的能力。银河通用 G1 机器人于 2024 年 5 月首次亮相,经过一年多迭代,目前在自动充电、运行流畅度与稳定性方面均已达到大规模自主商用的标准。

" 特别感谢 NVIDIA,我们率先在中国将 NVIDIA Jetson Thor 芯片部署于人形机器人之中,也是全球最早收到该芯片的公司之一,并在本次 WRC 大会上实现了现场部署。在演示中,配备该芯片的机器人展现出丝滑的运动性能以及实时的货箱视觉处理与运动规划能力,速度显著提升,赢得现场观众一致评价为 " 最快的人形机器人 "。这背后离不开强大芯片的支撑。" 王鹤称。

具身智能大模型方面,银河通用机器人之所以能够在复杂环境中高效导航,源于银河通用长期研发的大规模具身大模型 VLA。其中,导航大模型只需一句话指令即可在场景中自主运动。 " 六一 " 儿童节前夕,银河通用全球首发了无需建图、可在任何复杂场景中跟随人的 TrackVLA,能够自然语言交互、穿梭障碍物,全程自主运行,即使在人流干扰下也能稳定跟随。

上半身操作方面,银河通用全球首发了抓取基础大模型 GraspVLA,实现了抓取动作的实时闭环生成。在各种光照条件和挑战性背景下,均能实现指定物体的零样本抓取,且无需事先训练该物体。这为未来 " 自然语言 + 即时执行 " 奠定了基础,基于 GraspVLA 打造了零售场景应用。

银河通用能在全球率先推出多款基础大模型,并能在真实商店场景稳定应用,得益于 NVIDIA 提供的全套仿真引擎。公司与 NVIDIA 一致认为,合成数据是推动具身智能快速落地的关键。"目前,真实世界数据仅占我们训练数据的 1%,其余 99% 均为合成数据。"

王鹤表示,银河通用将自研机器人模型、大量物体与材质资产输入合成管线,经 NVIDIA 引擎完成仿真验证与物理渲染,生成全球首个百亿级抓取操作大数据集,以及全球首个百亿级柔性物体操作大数据集。这些数据使银河通用的模型在真实环境中具备极高的鲁棒性与泛化能力。

" 我们还与 NVIDIA 联合官宣了基于 Isaac 平台的下一代人形机器人项目。目前银河通用为轮式形态,团队正在进行双足的相关研究,基于 OpenWBT_Isaac 进行数据采集与遥控控制。无论在仿真环境还是现实环境,该平台可训练并部署多种任务能力,例如推车、拾取地面物体等。" 王鹤称。

商业化层面,银河通用的多项技能已实现完全商用,推出了全球首个常态化运营的智慧药房解决方案,签约超过 100 家药店。用户通过 APP 下单后,由机器人在店内完成取药并交付外卖员,该方案已吸引多位政府领导与外国元首参观。2024 年,银河通用还官宣了智慧零售店项目,将在 10 余个城市的百处核心商圈和旅游景点部署银河通用 " 太空舱 " 零售终端,销售饮品等商品。目前已率先在北京海淀区大融城落地投入运营。

媒体交流中,王鹤表示,目前机器人干活的能力还不够强,能完成的任务类型比较有限。但如果未来,能在这些有限的技能范围内实现非常通用的水平,就能一下子赋能很多场景。

那么,随着人形机器人在汽车工厂进行训练,机器人真正能在工厂车间投入工作还需要多长时间?还有哪些关键挑战需要解决?

王鹤表示,今年,许多人形机器人已经开始在汽车工厂进行训练,他们看到绝大多数公司在工厂推广人形机器人时,主要集中在两个方面:搬运、分拣。

其中,搬运方面,银河通用最近展示的机器人视频里,其搬运速度已经接近人类水平,计算下来每小时搬运的数量与人类相当。这个阶段已经非常接近实际工厂的部署,我预计今年年底可能会有几十台银河通用的机器人进入工厂车间实际应用;而分拣则是更大的挑战。不论是从传送带上拿,还是从货架上取货,目前最大的难点是速度。熟练工人拿取物品的速度非常快,机器人目前在模型和硬件层面还难以达到这种效率。

王鹤认为,搬运只是第一步。除了搬运,还需要实现码垛的闭环能力,只有搬运和码垛都完成闭环,机器人才能真正胜任整套工作流程,否则做一半的任务,效果并不理想。

" 我们做零售机器人时,拿货架上或桌面上的物品,技术本质上与工业分拣类似,只是零售对节拍要求较低,拿错货的后果也较轻。但在工业场景,比如汽车制造厂,一条产线停机一分钟可能就意味着损失上万元,因此分拣的精度和速度要求极高。" 王鹤称,分拣技术虽然已有较大进展,但目前还未达到人类工人的水平,仍需要一定时间的技术迭代和突破。

王鹤指出,银河通用现在最主要的突破是 " 抓取 " 和 " 移动 "。只要机器人能抓住任何物体,能够在场景中实现下肢移动和上肢伸展,最后还能准确放置物体,很多应用场景就能实现,背后需要有一个真正精准的目标识别和定位系统,目前公司通过合成数据在推动这项技术。

" 当然,即使解决了这个关键问题,仍有很多任务,机器人暂时无法完成。但只要目标识别和定位的问题能被攻克,人形机器人市场至少有千亿级规模,并且在五年内可见成效。解决了这个关键技术瓶颈后,基于如此巨大的市场投入,机器人必然能解锁更多技能,迈向万亿市场的步伐。" 王鹤称。

宇树王兴兴:未来组装机器人像组装电脑

王兴兴表示,宇树在过去几年中一直非常重视人形机器人这一方向。

"某种意义上,我将人形机器人视为通用机器人的重要载体。众所周知,通用人工智能(AGI)是目前全球最主流的发展方向,而真正的 AGI 在执行任务时必然离不开机器人,尤其是通用型机器人。对比来看,目前人形机器人反而是最理想的专业机器人形态。虽然看上去较为复杂,但实际结构并不如想象中那么复杂,本质上是由若干关节电机串联而成。因此结构相对简单,不像履带式小车或其他形式的机器人反而更复杂。由于主要是电机和连杆的组合,所以整体设计简洁。我一直相信,当通用 AI 大规模成熟后,每个人都可以轻松制造一台人形机器人,就像今天人们可以购买电脑零部件组装一台电脑一样。未来若 AI 足够强大,对硬件的要求会越来越低。" 王兴兴表示。

王兴兴称,公司在去年 5 月发布了一款机器人,当时售价约 9.9 万元人民币,至今依然具备很强的市场竞争力。它的关节数量和灵活性表现优秀,且在发布后,其架构已成为全球较为主流的设计构型。去年下半年及今年,不少新兴机器人公司的新产品在架构上与这款相似,仅在外观上存在差异。" 我们设计的造型流畅且结构简单,而其他造型可能更复杂且不够美观,因此该产品在市场上竞争力较强。"

近期宇树又发布了新的版本,售价约 3.9 万元人民币,全球竞争力强,且性能表现出色。目前现货可供,预计量产在年底前完成。此外,宇树近期发布了 A2 机器狗、R1 机器人等。

动作学习方面,宇树通过采集人体动作数据并结合深度强化学习进行训练,不同于语言模型训练,动作训练只需少量真实数据,其余由强化学习完成。

他指出,宇树主要使用 NVIDIA 的 Isaac Sim 平台进行训练,已掌握舞蹈、跳跃、空翻等多种动作。当前限制机器人执行更复杂动作的最大因素并非算法,而是硬件物理极限。例如,要将奔跑速度从每秒 3~4 米提升到 10 米,对硬件的改进需求极高。

会后交流时,王兴兴进一步表示,对于人形机器人的商业化来说,成本和硬件其实并不是关键性的问题,无论是 10 万还是 100 万,还是有很多场景能用起来的。而最大的问题目前其实还是整个具身智能模型不够泛用性,实用性还是有更大的提升,这是当下最棘手的问题了。

" 某种程度上,不单单是今年,我觉得过去的一两年硬件就已经足够好了,当然要做得更好,你要比如说可靠性成本各方面做的更好,但是它并不是个限制性因素。" 王兴兴称,目前模型架构不统一,大家进展没有那么快,宇树曾用视频生成模型作为 " 世界模型 ",来驱动并对齐机械臂的项目,这个尝试取得了一定效果,但视频生成模型训练规模极大,考虑到公司算力和投入,难以进行大规模训练。而且这类模型的泛用性还不能完全满足预期,因此后来基本没有继续使用。

王兴兴指出,最近谷歌 DeepMind 发布视频生成 / 世界模型 Genie3,,其物理对齐效果非常好,并且他们公开尝试把视频生成模型作为世界模型,直接用于机械臂和通用智能。这让他认为这个方向非常值得重新探索。" 目前对齐工作仍然非常复杂且具有挑战性。这个方向无论是对机器人应用,还是纯视频生成技术本身,都是非常主流且值得投入的。即便不用于机器人,视频生成技术也会持续被大公司加大投入、不断优化。"

王兴兴还赞扬王鹤团队,称王鹤老师团队展示的一些基于基础模型的机器人控制效果就非常不错。

他指出,宇树的策略很简单,不断尝试各种新模型和新想法。今天可能有一种想法,明天可能会调整,这很正常。对于新兴技术,我认为大家都应该大胆尝试。AI 领域充满了可能性,往往一个灵光一闪的创意就能带来突破。我希望鼓励更多人去探索,或许下一个创新就出自你之手。

王兴兴透露,宇树的目标是在未来实现 " 任意动作的任意实时生成 "。

" 回顾过去,AI 与机器人技术的发展始终是全球协作的成果。包括 NVIDIA 在内的多方力量一直推动机器人与 AI 领域的全球合作。在通用智能大模型和真正能执行任务的机器人普及之前,我们仍需共同努力,推动人类进入下一个科技时代。我相信,AI 与机器人技术将像电力与蒸汽机的发明一样,使人类文明迈向新的高度。" 王兴兴表示。

英伟达致力于为具身智能提供三台计算机

英伟达 Omniverse 和仿真技术副总裁 Rev Lebaredian 表示,在机器人领域,英伟达必须打造三台计算机:机器人本体计算机,AI 工厂计算机,仿真计算机。

" 从一开始,我们的使命就不是解决所有问题,而是打造专门针对‘最难问题’的计算机。我们打造的特殊计算机,能够解决几乎不可能完成的难题——而机器人就是其中最难的问题之一。我们早已梦想参与解决这一问题,并为此努力了很长时间。"Rev 称。

具体来说,机器人本体计算机是指算力,嵌入在机器人内部,例如自动驾驶汽车或人形机器人中的计算机。专门为人形机器人打造的 Jetson Thor 就属于这一类;AI 工厂计算机是系统,开发它的 " 大脑 ",需要依赖 DGX 和 HGX 系统,处理海量原始数据,生成物理 AI 算法、物理 AI 模型和神经网络,再部署到机器人上;仿真计算机是指 Omniverse,物理世界的数据无法直接从互联网获取,而是真实世界传感器采集,以及基于物理定律和世界规则进行计算机仿真生成。仿真不仅能生成数据,还能在部署前测试机器人,确保它们在真实环境中安全运行,且测试速度可快于现实时间。

英伟达在机器人领域拥有完整的 Isaac 平台,它结合了硬件与三台计算机所需的软件栈,包括运行时和计算环境、仿真工具、训练框架,如 Isaac Sim、Isaac Lab、NVIDIA Cosmos 等,以及 NVIDIA Jetson Thor ——一款专为物理世界中的智能推理 Agentic AI(特别是机器人)打造的超级计算机,黄仁勋称它为 " 实时推理机器 "。

会后群访中,Rev 表示,每当社会人口增长时,GDP 和生产力都会增长。一个社会的产出能力与其人口规模直接相关。目前,大多数国家面临的人口缩减趋势将导致经济不增长,甚至可能萎缩。如果不采取措施,经济将走向衰退。因此,打造机器人以创造 " 人工人口 ",辅助完成各类工作、提升生产力,是刻不容缓的任务。不仅要维持现有生产力水平,还要推动社会进一步发展。

对于中国市场,Rev 指出,中国既是一个重要的市场,也是 AI 技术和产品的生产基地。中国拥有大量聪明、受过良好教育且充满热情的 AI 研究人员和开发者,全球近一半顶尖 AI 人才都集中在这里,且中国拥有顶尖的 AI 高校。

Rev 强调,在物理 AI 和机器人领域,中国拥有独特的规模优势,结合人才优势,形成了独一无二的生态系统。中国在制造电子硬件和机器人所需关键部件方面具备深厚的专业能力,这样的生态体系和制造规模是其他国家难以匹敌的。这使得像银河通用、宇树科技这样的企业,能够大规模制造机器人,快速学习和迭代。

" 中国独特的综合条件为物理 AI 和机器人产业的快速发展提供了坚实基础。"Rev 称。

(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 英伟达 王兴 王鹤 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论