
同样的机器人,在苏州的现代化工厂里,1.6 到 2 年就能摊平成本;但在成都、重庆的产业带,这个价格会让老板直接摇头。这不是技术问题,是地理经济学问题——长三角一个普工年薪 18 到 20 万,而西南地区的人力成本可能只有三分之一。具身智能产业,正被这道无形的墙切割成两个世界。
更残酷的现实是:就算在愿意买单的长三角," 好用 " 的标准也远未达成。工业场景要求 99% 以上的良率、千分之几的误差容忍,而实验室里流畅的 Demo,在真实的产线上频频碰壁。年轻人不再进工厂,产线上干活的几乎都是 40 到 50 岁的老师傅——人口结构的倒逼,才是工厂老板们不得不算账的真正原因。
3 月 31 日,在第 27 届 ITES 深圳工业展现场,钛媒体联合 ITES 深圳工业展、工创联,邀请到领智机器人总经理汤尔英、珞石机器人具身智能创新中心总经理蔡德胜、乐聚机器人助理副总裁张大鹏,与主持人李非凡展开了一场关于工业具身智能落地的深度对话。
他们的回答里没有星辰大海,只有一本算不清的账、一群招不到的工人,以及一个残酷但清晰的共识:大部分场景目前仍算不平账,但随着核心硬件降本、人力成本升高、真实工业数据的积累,一升一降之间,商业化空间正在逐步打开。
以下是本次对话内容实录,略经编辑:
主持人:
第一个问题您的公司是垂直于什么赛道提供什么样的解决方案,包括对于产业,你们扮演一个什么样的角色和什么样的看法。
张大鹏:
人形机器人过去一年多时间非常火,火的主要是表演展示。我们公司走了一条跟别人不一样的路,我们从前年 9 月份开始正式推出了对实际场景产生价值的展厅导览机器人。从那时候开始,公司就明确我们要做对产业有价值的人形机器人。之后随着本体能力的提升、成本的下降,我们把重点移到了工业制造和商业服务场景。
汤尔英:
我们在自己的产线用我们自己的具身机器人做 CNC 上下料。原来用 AMR,现在用双臂具身智能方案,节奏比原来还节省,从 5 秒缩短到 3 点几秒。因为我们有 18 个生产基地,有很多场景可以去落地。我们的逻辑是:说的再多,还不如去做去落。我们除了上下料,还在质检上面做实验,1 月份可以铺一条代替人工的手工线。
蔡德胜:
珞石机器人成立 11 年了,最早从工业机器人做起,现在也在做具身智能产品,产品主要还是机械手臂。我们的目标比较聚焦,聚焦在工业现场的产线落地,这和公司的基因和行业应用有关联。目前做的最大的几个产业是汽车零部件和 3C 电子,主要聚焦在上下料,随后会探索柔性装配场景。
主持人:
张总,乐聚在服务、教育、工业上都有应用案例,能否跟我们分享一个实际的工业场景案例?究竟从实验室到工厂,人形机器人在真实产线上遇到的最大水土不服是什么?你们如何解决这样的问题?
张大鹏:
这是一个特别好的问题。市场上很多做人形的厂家前期都是从教育过来的,我们面临的一个很大问题是产品成本跟客户预期差距较大。但现在看来很快就会达到一个平衡点,因为人力成本的提升是不可逆的。现在年轻人、尤其是 00 后很少进工厂,长三角尤其明显。我们机器人的成本在持续下降,技术在持续迭代,硬件稳定性也在持续提升,所以这个交叉点会来得非常快。现在市场上有一些好的模型已经发出来了,这是我们能够进入工厂被客户接受的重要原因。
主持人:
人形机器人在工业场景中,您觉得有所为有所不为的边界在什么地方?
张大鹏:
短期之内受制于模型跟本体能力、小脑能力的界限。一些跟物流领域相关的行为是比较好做的,比如仓库工厂总装车间里物品的流通、抓拿放这些动作,因为机器人操作时对精度要求不是很高。当然我们的目标是要把所有高危、高压、高热的岗位尽量做到无人化,证明这个产业形态存在的价值,这可能是我们这一代机器人企业存在的意义。
主持人:
客户在对接时肯定会谈到 ROI 的问题。投入产出比怎么计算?应用机器人有很多普通人看不到的隐性成本和衍生成本,您如何跟客户来 bargain 这个过程?
张大鹏:
分区域来看。假设机器人售价 35 万,在西南区域很难被接受,因为人力成本相对较低,还有大量找不到工作的人。但把目光投入到长三角、上海、苏州、杭州、北京、深圳——一个人的成本在现代化程度较高的工厂,尤其是一些外资工厂,一年大概 18~20 万,这就很可怕了,大概 1.6~2 年就可以被替代掉。
人力成本的提升一定是不可逆的。现在工厂里干活的全是 40 岁、50 岁以上的人,很少见到 30 岁以下的年轻人。机器人成本在下降、稳定性在提升,很快会有一个交叉点,最后工厂老板们都会更倾向于这种方式。可能前期 ROI 算出来 1.6~2 年能够接受,但还要打开边界,因为招不到人——人员招聘成本高、流失率大、稳定性不够,这都是他们面临的风险。
主持人:
汤总,您能否结合一个具体商谈或对接需求的合作场景,说说如何说服客户把 ROI 作为合理判断标准,进而接受你们的方案?
汤尔英:
现在具身机器人有点难。我们更愿意去做一些紧急的、危险的、有技能需求的场景。站在工厂角度,肯定要切痛点——非常现实的第一需求。
国家在倡导,大家都在说,但真实场景下怎样落地,大家并没有想清楚,客户也没有想清楚。真实场景下算 ROI 其实是不太划算的。我为什么会去做,是因为我看到了这个方向,我们要先去试点。谁先踩坑,谁就能先跑。我们先去做成视频,让大家来选,觉得这个场景适合你,就直接复制过去。
主持人:
蔡总,既然 ROI 很难说服客户,你们如何跟客户解释迈向智能化、使用具身智能这一步的重要性?
蔡德胜:
我们面向的企业通常是有一定规模、体量,生产制造已经比较成熟的。解释有两个角度:
第一,这些企业通常有大的终端,比如苹果、特斯拉,终端对他们有科技感的要求,这些项目有可能是从终端直接下来的,是一定要做的。
第二,前期探索肯定是投入期,ROI 肯定算不过来。我们要以终局思维来看:三年、五年之后,技术成熟后能替代多少、创造多少机会、把生产效率提高多少?以这种形式考虑中期长期思路。建议把项目分成三期、四期:第一期叫 POC,做概念验证,看方向正不正确;踏出这一步后,技术逐步成熟,速度提升、续航提高,ROI 慢慢算得过来,会有一个平衡点。第三期发现平衡点到了,第四期、第五期就是收益了。这个思路对大企业比较适用,因为他们本身也是分阶段做的,技术有成长曲线。
最早期的工业机械臂一开始 ROI 也算不过来,一台 20 多万,那时候中国的人力成本更低。逐渐通过 10 年走下来,中国工业机器人现在占全世界 50% 多的销量,成本降下来了,人工上去了。确实需要时间、需要耐心来完成这些工作。
主持人:
汤总,领智制造有 80 个制造基地作为试验田,在 3C 产线的某个工序上,你们是怎么用自己的机器人替代传统自动化的?
汤尔英:
我们吃的是长线,聚焦某些点。第一站解决上下料,第二站做质检,打通之后连成线,希望达到柔性化,切换产品可以快速进行。具身智能给我们最大的好处是灵活多变。
目前已经把上下料以及自己的产线摸得七七八八,大概 1 月份左右一条线都跑顺了。用自动化能做到的节拍,初步来看可以做到 4 秒。柔性化的东西一旦做上去,再通过技术进步,比如大脑进入、质检进入,节拍会不断缩短,就可以把这个线进行不同产品的切换。我们基本上目前已经往这个方向在推进。
主持人:
蔡总,珞石在协作机械臂和力控技术上有很深积累。面对小批量、多品种、频繁换线的 3C 产线,传统刚性自动化做不到的事,你们怎么用协作机械臂和力控技术解决?
蔡德胜:
具身机器人目前只能做一些相对简单的工序,这些工序上它和传统自动化不是竞争关系,而是互补关系。它完成的是传统自动化很不好做的场景:小批量多品种、工件不一致、来料随机、非标。
由它来解决会相对更好,能体现出具身机器人的泛化能力——处理一些可能没见过或需要联想的事。珞石结合自身积累的力觉技术、力控技术,能够适应工件不一致的情况。在传统位置基础上结合力感知,来料有偏差也能适应——如果没接触到,还能继续接触;往设备里放时如果放偏了,传统自动化只能硬压下去,但有力觉技术可以结合力做位置调整,让它自适应地放进去。
AI 技术结合力控技术,能够比较好地匹配小批量多品种、来料不一致的特性。能够做一些现在自动化还没做到的、来替代人的工序,提高成功率、产品效率。而且机器人不会疲劳犯错,品质上也会相应提升。
主持人:
力控跟传统诠释的 ' 手感 ' 很像。刚才提到 ' 泛化 ',是往通用化发展方向。如何往下一阶段做得更好、更有泛化的手感、触觉精准定位,在通用化方向上有什么计划?
蔡德胜:
目前在积极探索面向不一致来料的场景。思路主要有三种:第一,持续深耕臂、手这条路线;第二,结合小脑的进展;第三,灵巧手——一方面是夹爪,另一方面是末端触觉技术,一定会不断升级迭代,由原型机到工程化。随着这方面进步,真正达到多模态输入去适应场景,不光是一个方向适应,而是多个方向、几个角度一起来做,更精准地完成柔性制造。
主持人:
大家对 ' 好用 ' 的定义和标准在哪里?从能用到好用,还有哪些问题没被解决?
张大鹏:
笼统地讲,到处都是机会,也同时到处都是困难。恰恰是这些难做的事,给了我们创业团队更多可能性与空间,因为我们走在无人区,干的是别人没干过的事、历史上没有发生过的事,灵活性会好一点。
具体地讲,现在进入场景时面临的最大问题可能是模型还不够成熟。论本体,算力、机械臂、一体化关节成熟得非常快。去年还在探讨单臂做到 2~3kg 负载,今年下半年方向定下来要做到 15kg 负载,就可以在绝大部分工业场景满足客户使用要求。我们先满足一部分客户的现实需求,先生存下来。重点还是模型,还是脑子,这很重要。
汤尔英:
好用,至少回到最基本:ROI 算得明白。
蔡德胜:
评价好用就两个点:第一,能不能跟人做的一样,甚至做得更好;第二,经济效益能不能比人更低。一旦达到平衡点——具身智能说起来神秘,其实也没那么神秘,跟传统自动化一样:比人干得快、一致性比人好、能不断干活,花多少钱多长时间能收回成本?工厂都是这么考虑的。
具身智能最后的评价因素一定也会回到这两点:效果和经济效益。需要过程来逐渐达成平衡。具身智能跟传统自动化不是竞争而是互补,有很多任务是工业自动化长久以来解决不了的,因为技术限制。具身智能就是在这个技术上做突破、不断降本提效来达成。
小脑技术、大脑技术还有一定时间,我理解至少还需要两年。其实我还是比较乐观的。但回过头看,比如自动驾驶,从无到有逐步发展起来历经了长达 10 年甚至更长。苹果一开始也在做,预估 5 年内能达成什么水平,最后没达成,10 年之后由中国逐渐达成。
所以还是乐观派,但还得让时间来检验。最多 2~3 年就会有一大步。就像波士顿动力液压机器人两年之前是什么状态,现在又是什么状态;中国的人形机器人从踉跄到今年各种流畅的动作表演——迭代进步往往是我们很难想象的快。


