前沿科技,数智经济
" 新老 " 机器人之间的悲欢并不相通。
当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。
8 月 9 日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有 200 多家国内外机器人企业出席,人形机器人整机企业有 50 多家。本次展会上共计展出 1500 多件展品、100 多款首发新品,多的一面墙都 " 简介 " 不完。
"大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。"
对于机器人这一年间的进化,智澄 AI 创始人、CEO 胡鲁辉向光锥智能如此总结说。
冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。
首先,今年人形机器人是大会的绝对主角。之前大会的 A 馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来 " 吸引流量 "。用于演示新技术的 B 馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的 " 稀疏 "。
其次,今年的人形机器人演示主打 " 可交互 "。去年机器人展会上,不少机器人周围还 " 拉着隔离带 ",今年机器人厂商希望消费者上手 " 摸一摸 "。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。
最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。
最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。
在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的 " 能干活 " 标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。
实际的落地应用,让机器人开始进入到量产阶段。当光锥智能询问量产情况时,不少机器人厂商都自豪表示今年有上百台的出货量。机器人已经开始渗透到我们的日常生活。
" 今年会跟线上门店的商家合作落地 100 家。消费者线上下单之后,机器人负责分拣商品再交给骑手配送 "。银河通用机器人合伙人傅强向光锥智能介绍称。
在大会现场,光锥智能还注意到三星的高管和几家日企的高管在现场到处 " 观察 "。这意味着,中国的人形机器人将和其他机器人一样有出海的机遇。
机器人行业的变化,是一个明显的信号。
在一个技术创新驱动的行业,越是临近大规模应用,技术和产品的迭代速度就会越快。这是基于前期的积累,也是消费者共识驱动巴斯模型(创新扩散理论)收束的结果。
本次探展,光锥智能也联系到了银河通用、优必选、智澄 AI、众擎机器人、魔法原子等多家重点公司的高管,一起全面探讨了机器人行业的当下和未来。
2025 年的机器人
主打一个能干活
" 去年很多机器人都动不了,今年动起来了,可以做一些具体任务。"
在今年世界机器人大会现场,傅强向光锥智能总结着一年间的变化。走过一家家公司展位,光锥智能注意到今年机器人的 " 花架子 " 演示少了,与实际商业场景结合的演示多了。
现场机器人演示场景,大概能分为四类,每一类都紧紧围绕着商业化的主题。
最吸引观众眼球的,是演示机器人的动作能力。
对比往年 " 小规模 + 定时定点 " 的机器人演示,今年各家厂商的机器人基本上都不带停的。动作技术高一些的玩家都在 " 整活 ",宇树表演机器人格斗,加速进化表演机器人踢球,众擎和魔法原子搞机器人走秀。围观人群里三层外三层,根本挤不进去。还有的厂商把机器人干脆 " 架 " 到了跑步机上。
大会上也有一些运动相对能力较弱的玩家。这些机器人的展示模式跟去年差不多,都是简单展示一下外观和对话能力。更弱一点的,则是给机器人穿了身衣服。内部身体做成什么样子,这就不得而知了。
有机器人动作演示的展台,就有观众的围观。而围观本身,就能产生商业价值。" 一台机器人售价在小几十万,目前客户有红旗汽车,他们做展示接待用。" 在乐聚机器人展台,工作人员向光锥智能解释着机器人演示所能带来的商业价值。
而机器人现阶段落地最好的,是随处可见的零售机器人。
出现频次最多的是卖咖啡和货架场景机器人,两种机器人已经能完全实现自动化经营能力。在卖咖啡的演示中,客户扫码下单,机器人自动完成出餐。这跟在线下咖啡店购买咖啡没有任何区别。货架零售场景,机器人根据观众的选择,现场分拣拿货。
此外,现场还有做煎饼果子、自动调酒等的零售场景,这些基本可以认为是 " 卖咖啡 " 的变种,都能提供客户从扫码到出餐的全流程任务。
值得注意的是,今年零售场景的机器人开始注重实际商业落地的细节。
例如煎饼果子机器人会显示煎饼的所有状态,让消费者买得放心。另外,零售货架机器人没有盲目采用双足运动方案,这样设计主要是保证工作稳定并兼顾续航。
傅强告诉光锥智能," 轮式的好处是技术相对成熟。一台机器人搭载 1.5 度电的电池,就能支持连续工作 8 个小时。"
与零售场景相对的是,人形机器人在工业场景的应用。
相比去年的单一机器人执行固定任务的演示,今年机器人开始强调 " 集群协作 " 概念。今年大会现场上,虽然机器人工作内容还是之前的分拣、搬运、质检 " 三件套 ",但工作流程有了相互配合的概念。
" 工业场景一定要走向集群作业的,单一场景落地一两台机器人没什么意义。"
优必选副总裁、研究院院长焦继超告诉光锥智能,机器人集群协作代表人形机器人开始融入到现代工业生产体系。在这个过程中,机器人公司也能将应用中遇到的难题,转化成技术壁垒。" 实现集群协作,需要机器人公司花时间深入客户生产流程,跟客户沟通,与客户工业后台管理系统进行对接。没有实际落地前,这些配合是很难想象的。" 焦继超说。
最后一类,则是行业再次上演的拼价格环节。
去年有些展商还对价格 " 讳莫如深 ",今年都自信了许多。虽然买一个零售或工业用途的人形机器人依然成本高昂。但大多数展台的工作人员都会明确告诉我们,售价具体是几十万还是接近百万。整体来看,今年机器人的售价合理了不少。以导览和演出类型的机器人为例,7-8 万的成本,跟一个人一年工资差不多。
另一边,人形机器人又开始了价格战。去年众擎就扮演着 " 价格屠夫 " 的角色,今年推出的新品选择 " 加量不加价 "。去年 3.85 万能买到一款只有 " 下半身 " 的产品,今年的新品是一个完整的人形姿态。
" 价格再砍一刀 " 的秘诀,众擎机器人联合创始人任国稳告诉光锥智能, " 公司具备全栈自研能力,才能兼顾性能和售价 "。
2025 年,机器人真正 " 能干活、能挣钱 " 了。从今年浓厚的商业化氛围中,我们能够清晰地感受到,机器人行业在一年之间 " 变天了 "。
为何人形机器人能在一年之间,从演示进阶到实用?
"主要是大模型能力的提升。这一代机器人技术跟上一代最大的区别,就是‘脑子进化’了。" 傅强称。
这也是众多机器人厂商的共识。
其中关键的 VLA 模型,可以理解成是用 L(语言)对之前传统的 VA 模型加了一层对现实世界可泛化、可预测的解释。
"VLA 的泛化能力可以通过视觉输入直接输出一个模型实时生成的动作,这就是与之前编程技术最大的区别"。傅强总结说。
例如智元的 GO-1 大模型可以看作是添加了一层 CoT(思维链),这跟 Figure、星海图等主打 " 快慢双系统 " 的公司核心设计架构差不多。也有公司认为 VLA 之上还有世界大模型,胡鲁辉告诉光锥智能,"VLA 的 scaling law 已遇到瓶颈,世界模型是未来 "。
我们能通过星海图的家务机器人看到:屏幕左边,是人类下达的 " 整理床铺 " 指令。在屏幕右边,是语言大模型实时拆解并生成的当前命令 " 回到初始位置 "。
核心技术路线基本一致,使得各家厂商都选择将机器人尽量都做成人形的样子,哪怕这些演示和落地场景跟人形外观 " 八竿子打不着 "。
人形外观具有两个明确的 AI 训练优势。
其一是机器人训练的数据能随着硬件升级,实现最大限度的复用。" 一些公司现在还做不到双足,给机器人设计人形的身体,是为了支持后续的泛化训练 ",魔法原子销售总监田罡向光锥智能解释称。
另一层优势,是统一的大模型能显著降低机器人厂商的技术开发周期。在众擎展台,一位工作人员向光锥智能透露称,美的近期演示的美罗机器人下半身是基于众擎 SA01 研发。不到一年时间,传统制造业出身的美的,就完全掌握了人形机器人的所有运动能力。大模型大脑加上可组合的身体配件,简直是把机器人变成了 " 变形金刚 "。
在大模型的训练下,今年机器人动作也变得更加丝滑。今年机器人虽然也有偶尔摔跤或者手没拿稳的失误,但光锥智能注意到,这些机器人的动作已经非常接近人类。以星辰智能为例,在分拣场景中,机器人手、眼、躯干的协同,简直跟人类 " 用筷子夹花生 " 一模一样。
而借助大模型的泛化能力,VLA 技术领先的厂商的机器人更能理解真实世界。
以货架零售场景为例,机器人能抓的商品种类越多,代表着机器人 " 大脑 " 的泛化性更好。京东的场景全都是饮料,机器人抓取的物品类型非常单一。灵境启元的货架多了筒装薯片、瓜子和纸盒包装的商品,这些商品外包都属于比较硬的一类。银河通用的货架就复杂多了,多了充气包装的薯片、小面包、方便面、花生、饼干、辣条、啤酒,整体商品复杂度跟大型超市的零食区相当。
" 我们用仿真的方法造了百亿级的训练数据。不管放什么样的东西,都可以识别出来。"
诚如傅强的解释,基于大量数据积累叠加 VLA 大模型训练,银河通用机器人才实现了更强的泛化理解能力。
不过,也有机器人厂商认为应该客观理解 VLA 技术的上限。
焦继超告诉光锥智能,训练机器人智能应该更重视真实场景的数据。"VLA 可能更适合验证探索阶段。很多厂商用仿真生成数据来训练 VLA,这些数据缺少真实情境的随机性。"
但无论如何,在大模型对机器人落地的催化下,今年所有机器人厂商都达成了重视软件的共识。
任国稳向光锥智能坦言道," 刚开始的时候,我们(众擎)相对更重视硬件和运动控制上。但现在我们已经投入更多精力在具身能力上。目前在研发投入上,软件算法是显著超过了硬件的。"
" 关键还是技术突破,这样才能做出真正有商业化能力的机器人 "。正如胡鲁辉所说,机器人行业已经走到了大规模商业化的前夜。
" 资本现在很冷静了,很快就迎来洗牌阶段。不能快速落地的厂商,很可能要出问题。"
谈到人形机器人的商业化竞争,焦继超向行业劈头盖脸泼了一盆冷水。
另一边,傅强认为领先商业化的机器人公司会率先建立足够高的壁垒,进而达成 " 赢者通吃 " 的局面。" 肯定是恒强者恒强,后发的玩家可能会失去机会。" 傅强说。
优必选和银河通用,已经将商业化看作机器人公司生死存亡的关键,而不是唯技术论。
在本次会展上,光锥智能感受到不同商业化阶段的公司之间存在比较明显的差异。
例如在工业场景,有些机器人厂商会强调机器人连续工作时长、充电还是换电、与真人员工的效益差距等指标。而另一些公司讲的还是负重、自由度、动作协同等比较基础的指标。后者的指标,或许并不是对于工业用户最关心的。
焦继超告诉光锥智能,工业场景客户的诉求都很直接,"客户上来先问能不能干活,第二个问题就是续航多少。"
对于机器人公司来说,落地应用也能带来真正意义上的产品迭代,很多硬件设计缺陷只有在工厂里面实际工作才能发现。例如优必选 Walker S2 的迭代,有一条是让机器人的手能直接摸到地面。这样改动,是因为上一代机器人只能在固定高度搬箱子,而不能直接从地上搬。
在零售场景,商业化进展领先的机器人公司已经 " 杀疯了 "。
" 机器人已经成标品了。一个机器人一天就能在线上门店里干活,甚至都不需要提前扫描商品。" 诚如傅强所言,得益于超高的部署效率,银河通用的零售机器人正在快速攻城略地。
零售场景机器人的落地如此顺利,是因为这笔账很好算。傅强说,O2O 的商业逻辑要求必须 24 小时接单营业,维持这样一个店铺就需要 2-3 个人换班,机器人可以减少管理成本。以北京为例,一个员工到手七八千,对应人员开支在 1 万元左右。三个人一年 30 万,两年 60 万。批量采购机器人,价格也就是在这个区间。
"最重要的是让机器人解决问题,真正提高生产力。" 胡鲁辉总结说。
在大会最后,光锥智能还问了各家公司一个尖锐的问题——人形机器人大量应用,是否会影响到普通打工人的就业机会?
焦继超坦言称," 其实是解决招工难的问题。"
事实上,传统工业、服装、3C 电子这些行业都需要大量的人来完成组装。但这些行业,普遍存在招工难和人员动不动就 " 提桶跑路 " 的问题。用工困难的现象,其实反映出人类并不喜欢这些枯燥且重复的工作。
为人类分忧,是机器人自诞生之初就被寄予的厚望。人形机器人的时代,已经到了。
光锥智能"AI 交流群 "已建立,
感兴趣的朋友可以添加小助手微信(GZZN2019)沟通进群。
联系我们
王一粟
创始人 / 主编
ID:cishicike000
※添加时请备注公司 + 姓名 + 来意
登录后才可以发布评论哦
打开小程序可以发布评论哦