WAIC 现场当你拿起放大镜,你会发现一个奇怪的现象:
一边是高自由度,甚至兼具触觉和力控,能毫秒级指令响应的五指灵巧手,它能捏起豆腐、玩魔方,和人手能力相差无几,但另一边搭载在本体上或机械臂上的末端执行器却为二指夹抓,现场演示精细化操作,如做蛋雕、打麻将。
现场演示所折射出的二指与五指灵巧手的冲突,在厂商试图展示模型能力的 demo 中也有迹可循。在一些柔性长程任务中,厂商更偏爱用二指夹爪,就算使用五指灵巧手,但大部分抓捏、折叠、递放等动作,也只是通过两根手指完成。有本体厂商跟具身研习社透露原因 " 展示求稳,二指确实更稳 "。
当然这一现象并不只存在于国内,国外本体厂商曾做过长时间干活直播,但全场直播下来,大多手指工作参与度并不高,也只是在用两根手指完成。
这现象的背后,究竟是灵巧手本身不好用,还是场景根本不需要灵巧手,抑或测试和实际应用存在明显 GAP?
具体来看,有观点认为机器人灵巧操作的核心所依仗的就是高灵巧度的灵巧手,同时人类社会的工具也都是为人手设计的,灵巧手自然拥有场景优势。但也有观点认为五指存在冗余,在工业场景中绝大多数都可以用夹抓完成。
二是,本体厂商需不需要第三方灵巧手?不可否认的是灵巧手厂商有自身专精优势,但会涉及到和本体的适配性问题。本体厂商是选择自研进行成本控制还是追求高性能,这可能进一步演化为长线利润最大化与短期商业可行性之间的对垒。
三是,什么样的灵巧手才有产品化可行性?目前看灵巧手的评判维度,不在于单一性能指标的突出,而是寻求一个平衡,在保持性能维持基准线之上也要具有价格优势,六边形产品或许更受喜爱。
可见,灵巧手当下正面临技术、产品路线、商业路线均未收敛的发展现状。作为人形机器人的核心零部件,或许灵巧手的发展比本体更急,野蛮生长期下暴露的问题,也正是未来的突破机遇。
单从灵巧手产品本身来看,市面上五花八门的灵巧手已经卷出新高度。
灵巧智能的 DexHand021 Pro 凭借 " 手腕协同 " 能够复现出翻腕倒水的操作;强脑科技推出的超轻巧灵巧手 Revo2,自重仅 383g 却能提起 20kg 的重物;傲意科技的 ROH-AP001 能够实时感知 0.1N 至 25N 细微压力变化,捏起薯片或是握持重型工具都不在话下 ……
图片来源:因时机器人
总的来看,第三方的灵巧手优势在于垂直专业度。一方面,厂商大多是零部件背景出身,如电机、传感器,在零件可靠性、规模化量产上占据优势,另一方面,又因其较早布局并深耕这一领域,在多项核心技术指标上有明显身位领先。
前者如因时机器人,凭借微型伺服电缸技术,通过自研空心杯电机、行星滚柱丝杠及闭环控制系统,将驱动、传动、传感高度集成,实现灵巧手结构简化与可靠性跃升,目前累计出货数千台,并已迭代出第五代产品。
后者像灵心巧手则打破自由度上限,其科研版灵巧手能拥有 42 个自由度,远超英国 Shadow Hand 和特斯拉 Optimus 第三代灵巧手,甚至在自由度这一指标上某种程度已经超越人手。
图片来源:灵心巧手
尽管如此,但是能看到真正体现模型能力或做精细化操作的时候还是二指用得更多。WAIC 大会中银河通用的机器人在商超值守、零配件分拣和料箱搬运中都是使用二指夹抓。其他厂商在取送饮品、制作冰激凌等场景也是如此。
放着灵巧手不用,首当其冲的问题在于,灵巧手似乎没那么灵巧,具身研习社在调研时,收到很多本体厂商的反馈,有厂商表示," 很多灵巧手买回来测试,不到几小时就崩溃了。" 还有厂商曾做过横向对比," 市面上的很多家都采购过,现阶段来看还是二指性价比更高 "。
由此可见,或许灵巧手本身的展示不存在明显问题,但跟本体适配中会面临如延迟响应、力控误差、手眼协同与多模态数据融合等不适配或难适配的问题。
因此有人选择亲自下场做手,以期达到不受限于人的目的。本体厂商星动纪元、智元机器人、宇树科技等,相继推出了自研五指灵巧手。
毕竟,自研灵巧手能够很好地适配自身的运控算法,解决手眼协同以及通信延迟问题。机器人本体厂商凭借对自身机器人的整体架构、运动特性、传感器布局等的深入理解,在自研灵巧手时,可以将灵巧手的设计与机器人的运控算法进行深度协同,使灵巧手的运动与机器人的整体运动更加协调一致,提高操作的流畅性和准确性。
而且,自研灵巧手可以与机器人的其他传感器进行无缝连接,实现数据的实时共享。比如,在视觉传感器检测到物体的位置和姿态变化时,运控算法可以迅速调整灵巧手的抓取动作,确保抓取的稳定性和准确性。而目前行业内 VLA 模型有向 VTLA 多模态操作模型演变趋势,其中灵巧手的触觉数据正是模型迭代的关键。
选择自研除了适配外,最重要的原因在于成本控制。
灵巧手在整机成本中约占四分之一到五分之一,是整机中成本的大头。在机器人普遍降本进入市场过程中,如何将末端执行器的成本下拉,决定了整机能否真正降到位。
此外,一些厂商推出末端执行器甚至有沿途下蛋,通过卖 " 手 " 进行商业化的可能。比如帕西尼在 " 触觉传感器-灵巧手-人形机器人 " 这条发展路径中,灵巧手正扮演着为人形机器人积累技术资产与资金回报的角色。
" 手 " 所面临的现状,其实可以看作 " 硬件制约软件 " 的缩影之一。多位本体企业创始人曾向具身研习社表示,目前硬件的状况并不能完全还原模型能力。
灵巧手暂未大面积应用的背后,不仅仅是自身的发展因素,还有企业间的观点博弈。不管是自研还是第三方灵巧手,现在仍没有 " 一定要做五指 " 的共识,这种无共识的背后是产品逻辑的迥异。
二指夹抓的拥趸,如 Grasplt 软件的创作者 Matei 曾有论断:两指夹钳可以解决人类社会 95% 的问题,剩下的问题即使有灵巧手也难以解决。然而更能让人信服的现实是,二指夹抓能够有效降低末端执行器的成本,优化成本结构。同时,二指因其单一稳定的运动形式可靠性较高,在特定被夹持零件的重复性任务中,便于控制也是行业考虑的重点。
图片来源:戴盟机器人
三指夹爪与二指相似。不过它相较二指而言,三角形的结构更稳定,能够更好地钳住不规则物体。
目前二指技术成熟度较高,较少企业单独作为产品售卖。但三指产品则普遍售卖并应用,如灵巧智能今年 5 月推出的 DexHand021 S、宇树科技此前桌面操作视频所用的 Dex3-1 以及波士顿动力 Atlas 搬运货物时所用的夹爪。
图片来源:宇树科技
而做四指、五指灵巧手的厂商,他们认为灵巧手与二指、三指夹爪不同在于,诸多精细操作中,夹爪无法胜任。从产品逻辑来看,五指灵巧手可视为绝对终局,打造一款绝对通用的手能满足大部分需求。
这类企业他们认为应该追求真正的高灵巧度,低灵巧度的手不如直接做成夹抓。灵巧智能 CTO 朱豪华说 " 绑住无名指与小指后,70% 的日常操作会受限 "。也有投资人认为整个人类社会的环境、工具、场景都是针对人手结构优化的,因此仿生的灵巧手是最适合人类社会的。
值得注意的是,五指灵巧手是当下最受争议的存在,一部分人认为其是整个行业的 " 类人产品形态 " 的执着,猎豹 CEO 傅盛曾表示,这源于 " 人类对自身形态的迷恋 ",达芬奇手术机器人仅用两根手指即可完成精细操作。甚至有些企业采用五指灵巧手并非是为了场景作业,而是单纯地将其视作构成 " 人形 " 的一部分,这也是灵巧智能 CEO 周晨所说的两种市场之一," 配在人形和本体上,以样子出现 "。
因此,回到本体企业来看,是 " 够用就好 " 选择夹爪,还是 " 复杂场景少不了 " 五指灵巧手?
总的来说,这些路径的选择背后是产品逻辑的博弈,它需要在不同场景下去考虑成本与性能之间的平衡,尽可能地找到 PMF。
不过这存在 " 阶段性的方案选择 "。阶段不同,PMF 聚焦的痛点也不同,比如工业场景的痛点可能是 "10 万次无故障 ",因此二指结构简单不易出现零部件损坏;家庭场景的痛点则可能是 " 柔性物体精细操作能力 ",因此五指可能在不规则物体的抓取中完成率更高。
由此也能看见一个趋势,目前机器人精细作业的需求越来越清晰,随着场景由结构化向非结构化过渡,标准的工厂作业向商业服务再到走进非标的家庭,机器人末端执行器的灵巧度要求将会越来越高。
最后,灵巧手技术本身尚未收敛,例如是腱绳传动还是刚性直驱?技术路线的分歧导致供应链碎片化,进而供应商难以形成规模化生产,成本也高企不下。这些成本传导到本体厂商也是影响灵巧手选择的重要因素。
基于行业技术演进与产业落地矛盾,灵巧手的竞争本质已从 " 参数竞赛 " 转向 " 多维系统平衡 "。
一个最简单的例子就是,一段时间本体或者灵巧手厂商在推出灵巧手产品时都宣称有着十几、二十自由度,甚至诞生出 " 被动自由度 " 这种说法。然而现在," 自由度 " 渐渐不再作为产品噱头," 不做自由度竞赛 " 已经是行业共识。
事实上,不做参数竞赛,尤其是自由度竞赛的本质其实还是成本控制。
市面上从不缺好用的灵巧手,如特斯拉 22 自由度的灵巧手,但降本后仍占本体的 17%,约为 1 台基础版宇树 G1 整机。而拥有 24 自由度的英国 Shadow Hand 市场售价更是超百万元,抵得上一辆豪华跑车。这显然不是产品化的逻辑。因此价格也是优先考量的指标,有很多厂商深知现有采购的灵巧手与自身本体算法耦合度并不高,但胜在性价比高。
所以,灵巧手追求的就是两方面:一方面是性能,看的是技术能否满足操作需求,另一方面是产能和性价比,比的是工程化落地。
目前行业内正普遍努力克服 " 成本-系统参数-稳定性 " 这一 " 不可能三角 ",追求六边形战士,满足 " 力量、速度、体积、重量、寿命、自由度、结构强度 " 等因素之间的多维平衡,这是灵巧手机器人迈向消费者的一道坎。
在这些要素之间,例如要追求工业场景中的力量、负载足够大,就会因为采用大扭矩电机和刚性材料而牺牲重量。而追求自由度则又可能会加大驱动、传动系统的成本、增加零件坏损风险,降低使用寿命与稳定性。
当然,除了这些指标外,现在行业内还在拓展评价维度。如灵巧智能 CEO 周晨认为,灵巧手的灵巧应该满足物理灵巧度指数、感知指数和智能指数。
物理灵巧度指数,包含了关节自由度构型、操作空间大小等;感知指数,则在传感器种类、量程、覆盖面积、精度与点阵密度等基础参数外,重点关注并测量手-物交互的动态特性信息,如手物接触的摩擦;而智能指数映射了认知与决策的进化层级,展现的是手能够在复杂、动态的环境中自主完成多样化任务,甚至通过经验积累不断优化操作策略。
总的来说,未来灵巧手到底需要什么样?技术的发展路径走向何方?尚无定论。但唯一能感知到的是,机器人厂商选择灵巧手时,看重的一定是多维度的平衡。这与机器人在当前阶段追求尽快落地应用的需求相呼应,能降本、能稳定运行、能规模化落地、能不 " 顾此失彼 " 地保证产品完成度,将最具竞争力。
行业从不缺技术的单点突破,但这些技术能否从实验室走向市场,还需看各家产品能否将产品力的 " 玫瑰图 " 修正。
WAIC 上的灵巧手怪象反映出产业走向成熟的探索," 以场景定义技术 " 的逻辑已然清晰。那些此刻看似 " 粗糙 " 的二指夹抓,与未来可能普及的 " 六边形 " 五指手的博弈,终将在市场的选择中,沉淀出最贴合产业规律的答案。
登录后才可以发布评论哦
打开小程序可以发布评论哦