全天候科技 12小时前
高盛人形机器人中国行:VLA+世界模型加速融合,数据仍是最大瓶颈
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

中国具身智能与人形机器人产业正在经历关键的技术架构演进,视觉 - 语言 - 动作(VLA)模型与世界模型的加速融合正推动行业向商业化现实迈进,但高质量、真实世界数据的稀缺依然是制约大规模部署的核心瓶颈。

据追风交易台消息,据高盛分析师 Jacqueline Du 等人在走访 14 家中国机器人企业后发布的报告指出,行业讨论已超越单一的 VLA 框架,转向以执行为导向的多模态 AI 堆栈。模型参数规模正迅速扩大至 400 亿至 800 亿区间,业界愈发认同,建立可扩展且以人类为中心的数据获取架构,是实现技术突破的决定性因素。

对投资者而言,这一技术演进直接重塑了市场的商业化预期。报告指出,尽管应用场景正在向工业和物流领域拓展,但目前绝大部分项目仍停留在概念验证(POC)阶段。市场普遍预计,只有在基于可部署模型并积累数千万小时高质量数据后,行业的大规模商业化部署才会在 2027 年至 2029 年间真正落地。

尽管面临短期挑战,高盛对该领域的长期投资前景依然保持高度乐观。多模态 AI 堆栈的进步与精密数据采集体系的建立,表明行业距离广泛应用已近在咫尺。但高盛也提醒投资者需保持耐心,企业在从概念验证向大规模商业化过渡的复杂过程中,保持质量稳定与持续降本将是核心里程碑。

VLA 与世界模型融合:技术路线加速收敛

据高盛报告,行业在具身智能模型架构上的共识正在发生显著转变。企业已不再局限于传统的单一 VLA 模型,而是迅速转向 VLA 或视觉 - 触觉 - 语言 - 动作(VTLA)与世界模型的结合。在这一新架构中,世界模型不再作为一个独立的类别存在,而是作为动作模型旁的功能层,通过预测下一状态、在执行前验证动作来增强真实世界中的规划能力和鲁棒性。

以 Galaxea,Galbot,Spirit AI 和 One Robotics 为代表的企业,均已明确将 VLA/VTLA 与世界模型的结合作为下一步发展方向。在此背景下,模型训练规模正从以往的个位数级十亿参数,向 400 亿至 800 亿参数的庞大区间攀升。多位业内人士向高盛强调,在这些多模态堆栈达到可部署且质量一致的标准前,仍需经历多轮迭代。

此外,PaXini 等企业则强调了触觉(VTLA)在物理交互中的重要性,计划推出以触觉为主导的模型,以弥补纯视觉路线在力控任务中的不足。

数据瓶颈:从 " 配方之争 " 到采集架构建设

高质量、多维度的真实世界数据仍是当前阻碍实际部署的最大瓶颈。高盛观察到,行业的焦点已从泛泛的 " 数据配方 " 争论,转移到如何构建能够可靠产出高质量数据的可扩展架构上。

在数据采集中,以人类为中心和以自我为中心的采集方式(如通用操作接口 UMI 及第一人称视角可穿戴设备)日益成为首选,尤其是当企业需要保留自然运动、丰富接触交互以及实现跨机体迁移时。在具体投资上,行业呈现出两条不同的路径:一部分企业倾向于在政府支持下建设集中式的数据工厂,例如 PaXini 目前在全国运营着 5 座数据工厂;另一部分如 Galaxea,Spirit AI 和 One Robotics,则更倾向于通过已部署系统、VR 和客户端采集来构建分布式的部署循环。

数据本身正在成为一项重要的盈利来源。报告指出,多家企业预计到 2026 年,数据相关收入在总营收中的占比将显著提升,其中 UBTech 预计政府对数据工厂的需求将保持强劲,从而支撑其收入和数据积累。

商业化进程:聚焦工业与物流,务实推进规模化

目前,人形机器人的商业化正逐步覆盖工业搬运、物流工作流以及部分结构化的商业场景。据高盛报告,近期的核心机遇主要集中在分拣、物料搬运、取放、检测等标准化或半结构化流程中。

工业领域的采用严格遵循分阶段路径。企业通常需要经历 3 至 6 个月的概念验证(平均 2 至 3 轮),随后进行每批次少于 50 台的小批量测试,并经过约 12 个月的验证期后,才能进入每位客户约 50 至 100 台规模的试点部署阶段。在物流领域,Geek+ 等企业强调了 " 场景优先 " 的理念,将复杂任务分解为具有明确边界的子任务,在当前阶段将可靠性置于通用性之上。

在硬件形态与降本路径上,市场展现出强烈的务实倾向。高盛指出,出于模型能力限制和成本考量,众多厂商当前更倾向于采用 " 轮式底盘 + 两到三指夹爪 " 的组合,该形态目前足以覆盖 70% 至 90% 的工业应用场景,而双足加五指灵巧手的终极形态仍需时日。

降本路径:规模效应主导,硬件形态趋于务实

在激烈的市场竞争中,降本主要依赖于规模效应以及企业对架构、零部件和部署形态的定制化选择。对于全尺寸人形机器人玩家而言,全栈研发控制依然是最普遍的成本控制手段。

在产业链各环节,企业正在确立各自的竞争优势。Linkerbot 表示其在全球高自由度灵巧手市场已占据领先份额,并通过自研关节模块实现了显著低于海外竞品的定价。Mech-Mind 则聚焦于工业场景下的 3D 视觉系统,其核心客户集中在汽车及电池制造领域。而在传统工业机器人领域,Estun Automation 的管理层强调,公司战略已从单纯追求市场份额与出货量,大幅转向优先提升产品组合、盈利能力与增长质量,以应对国内日益激烈的价格竞争。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

高盛 ai 中国机器人 机器人产业 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论