文|产联社,作者 | 明丽 初一
" 对人类而言困难的任务,对机器反而容易;对人类轻松的事,对机器却异常艰难。" 这是 20 世纪 80 年代由汉斯 · 莫拉维克等人提出的 " 莫拉维克悖论 ",这一点在机器人触觉感知领域得到了尤为鲜明的印证。
具身智能触觉感知及行业解决方案供应商——帕西尼感知科技,其 CTO 张恒第对我们解释,触觉感知技术出现得最早,但被人理解并使用却是最晚,原因是触觉信号复制难度极大,很多机器人企业,原本想做触觉,但却没能实现。
" 没有触觉,机器人能唱歌跳舞,能跑马拉松,但无法进厂打工,无法操作精细工种,真正地为人类所用。" 张恒第说。
触觉传感器广泛应用后,机器人进厂打工将成为现实,尤其是在高危特种环境中,机器人将发挥其独特价值。
但帕西尼的目标不止于此。" 以触觉为始,后续要配套触觉算法、触觉模型,最后生成控制策略,利用触觉感知技术服务千行百业,人类生活方式也将开启一个全新篇章。" 张恒第说,未来他们一定会改变世界。
张恒第从 AI 算法、技术前景展望,数据处理等方面向我们分享了经验。
我们的终极目标是改变人类的生活习惯
产联社:有人把帕西尼称为深圳机器人六小龙之一,你如何看待这个评价?
张恒第:帕西尼在机器人生态中处于一个特殊生态位,通常情况下,大家认为眼睛是获取外界信息最重要的通道,但事实证明,没有触觉,机器人无法像人类一样精细化操作。所以我认为触觉生态位本身得到了大家认可。
产联社:深圳也是公认的创新沃土,为什么一提到机器人,大家会先想到杭州六小龙,而不是深圳六小龙?
张恒第:问题很犀利,我愿意回答一下。
技术在早期会给大家带来希望,但也会在遇到卡点时让大家失望。我想说的是:技术既不疯狂,也不一无是处。实际上,技术会逐步提升,在无声无息中,便已无处不在。
我们现在所处的正是技术发展的早期阶段,这个阶段会在不经意间带给大家很多遐想——我们看到机器人跑步、跳舞、拳击等,都是由杭州六小龙呈现的。
但是,机器人的价值只有跳舞吗?一旦上升到灵巧操作层面,需要的算法是截然不同的。如果机器人一直停留在前期阶段,大家也会失望。
所以我认为:杭州与深圳,一表一里,都在为机器人的广泛存在做准备。
" 表 " 在于,机器人要给大家希望。我举个例子,儒勒 · 凡尔纳在《海底两万里》中写到," 我有一艘船,叫鹦鹉螺号,可以在海底行驶得非常远。" 那时还没有潜水艇,但是 100 年后,潜水艇出现了。杭州让大家知道,机器人能跑能跳,终究会为大家所用,这一次,我们或许不需要等 100 年,快的话只要一到两年,科幻就能照进现实。
科幻在照进现实的过程中,总要落地。在这个阶段,深圳有最全的产业链与商业场景,很多企业还在厚积薄发的过程中,深圳与杭州都在为机器人落地而努力。
产联社:创始人与你都是从国外留学回来的,并且是不同的国家,你们当时凑在一起,想把这个企业落户在深圳,背后的故事和考量是什么?
张恒第:帕西尼 CEO 许晋诚博士毕业于日本早稻田大学,该校实验室做出了世界上第一个现代意义上的人形机器人。日本做机器人历史很悠久,也为之后的机器人技术奠定了极为重要的基础。而我们最终决定来中国,一是因为中国是机器人硬件发展最好的地方,这主要是因为中国产业链非常完整,这是别的国家所不具备的。美国、日本和欧洲的想法如果需要落地,都要送到珠三角来打样,打完样后送回去还需要一个月,而在中国,整个时间只需数天。所以中国是最佳的创业地。
二是深圳开拓创新的精神,对初创企业包容度高,可以媲美硅谷。在日本,如果没有日本的大型落地项目,基金会就不会长期扶持初创企业,他们认为创新是一种风险。但在深圳,创新不是风险,而是义不容辞的使命。我们的股东很多是来自产业方的超级头部企业,他们对我们新技术的引入非常期待,持开放包容态度。
我们看到,很多伟大案例正在深圳发生着,即使有一些现在不被人看好,但在未来,一定能改变世界。
产联社:说一说你们企业成立的初衷,和目的。
张恒第:从现在开始,以触觉为基点,后续要配套触觉算法、触觉模型,最后生成控制策略:利用触觉信号服务千行百业,人类生活方式也将开启一个全新篇章。
为什么是 " 帕西尼 "
产联社:帕西尼听起来有点像西药的名字,这个名字怎么来的?
张恒第:帕西尼是一位意大利生理学家,他发现了人类触觉感受器,能够让人类获得触觉感知的能力,为纪念他的伟大发现,人们将这种感受器命名为帕西尼小体。当然,还有其他细胞名字供选择:默克尔盘、鲁非尼小体等,我们考虑过 " 默克尔 ",但是 " 默克尔 " 被德国前总理用了。
总之,帕西尼很 universal,又很具象,同时代表了我们的愿景,人类通过帕西尼有了触觉,机器人通过我们帕西尼获得触觉信号,这是一个非常美妙的事情。
产联社:触觉对机器人有多重要?
张恒第:人手上的触觉信号非常重要,我们经常提到的物理直觉,机械刺激引起的疼痛,自我知觉,这些都是触觉,婴儿最先开始就是靠触觉来学习外部感知,并建立自我知觉的。
在具身智能应用方面,光靠视频生成的模型不够准确,比如球掉地上,反弹力度多大?没有触觉模型就生成不了。触觉可以让机器人知轻重,进行复杂的感知和掌内灵巧操作,人们每天的日常动作,如使用筷子、写字等,没有一个能离开触觉而完成。
产联社:我说一个观点,在机器人领域里,触觉相对于视觉听觉来说,走得更慢。
张恒第:走得很慢,触觉出现得最早,为人所用最晚。早在单细胞时期,生物为了确保生存安全和辅食就发展出了触觉,然而直到 2021 年,第一个触觉领域的诺贝尔奖才诞生,人类才明白,怎么把触觉机械力刺激变成神经信号。视觉领域的突破则在 400 年前——欧洲做出了玻璃,对光学和人类视觉的研究和应用催生了透视法和近代绘画艺术,甚至也助力了文艺复兴运动。
很多做机器人的企业也想过做触觉,但都感受到了严峻的技术挑战。因为触觉是一种多模态信号,集合了分布力测量、震动测量、温度测量,研发难度极大。但是触觉又很重要,没有触觉,机器人就只能跑步跳舞,无法进厂打工、真正地为人类服务。在被国外 " 卡脖子 " 名单中,触觉排在第四位,我们希望改变这一格局。而通过 " 十四五 " 期间的努力,如今,这一局面已然改变。
产联社:我知道触觉难,但是难在哪?
张恒第:人如何产生触觉?人类的细胞膜上有分子级别的膜蛋白 " 传感器 "(Piezo2 Protein),当细胞膜被拉伸的时候,膜蛋白 " 传感器 " 会像门一样拉开,阳离子涌入,触发了神经信号,膜蛋白 " 传感器 " 会劣化、会坏掉,但没关系,人体可以快速合成新蛋白。但机器人没有再生功能,所以机器人的触觉传感器需要非常强的耐久度和可靠性。
还有一个难点。触觉产生于测量分布力大小。以前有秤测力,但秤是静态的,且反应非常慢,大概三秒钟才能显示结果。但触觉是即时反馈的。如何实时获得力觉信号、温度信号,是触觉的另一难点。
最后,人类生产的东西,包括现在机器人本体,绝大部分是硬质物,关节也由电机连接。但触觉不一样,它需要根据物体的形状进行变形,它必须是柔软的,且要在柔软的情况下,还能精确测量力信号。
产联社:你们准备怎么解决它?
张恒第:从原理的选择上,我们选择了霍尔原理,特点是可以从原理上将弹性体和测量电路分开,将测量电路充分保护,从而做到具备极佳的灵敏性的同时,拥有千万次按压寿命和极端环境可靠性,可以耐烈焰灼烧、耐超低温、耐潮湿、耐 20 倍量程极限工况重力按压……
我们从材料选择、磁路设计、弹性体设计、逆向有限元算法设计等方面进行极端优化,最后将此前仅能在大型仿真软件中运行的复杂算法压缩至微型计算单元(MCU),嵌入到触觉传感器。通过这一技术路径,传感器可快速输出具备高一致性和重复性的最终力触觉信号。该方案既可以保证传感器的柔软性,又可以保证其测力的精确性。
最后,我们要让它的体积足够小,能够形成模组化的形态,不能像以前一样——敏感单元、数采卡、信号处理在不同设备上。这种分离式布局与机器人的发展相悖。机器人零件不比新能源车少,但机器人的体积比车小多了。所以模块化、集成化很重要。
基于这样的设计理念,以及在算法和材料上的技术积累,最终让信号的采集、分析、输出全部集成在紧凑的模组上,使其可以被方便可靠地使用。
产联社:这对于成本管控有什么好处?
张恒第:我们将触觉传感器这一个品类价格从开始的 1 万美元降为现在的 199 元人民币起。
机器人:差异要小,要快,要能复制
产联社:能举例说明一下现在帕西尼传感器的敏锐达到了什么程度?
张恒第:即便是一片羽毛落到我们的触觉传感器上,传感器也会瞬间感受到,执行器能根据传感信号做出相应的抓握动作。
产联社:是不是比人的触觉还要更灵敏?
张恒第:人和机器的不同点在于:
· 人的个体差异大。比如,男女对于触觉的敏感度不同,男生力气大,但触感相对比较钝;女生力气小,但触感相对更灵敏。
· 人类习得速度慢。比如,我们普遍接受这一事实——人需要花费数十年时间去学习舞蹈、游泳、武术才能达到较高水平。
· 人类技能无法复制。比如,即便是一个人的灵魂 " 穿越 " 到另一个人的身体,也会有很长一段时间无法适应。人的身体变了,大脑也要花很长时间进行适配。
而机器人是反过来的——机器人个体间的差异要小,要快,要能复制。我们训练一台机器人端茶倒水,它学会后,要能快速复制到别的机器人身上,这就要确保传感器的响应速度一致。为满足这一需求,需要统一标准,从应用端倒推回来的标准,而非一味追求超越人类的灵敏性。
产联社:你刚才举例提到了人体穿越,可不可以理解为,现在很多机器人厂家生产的是外壳,传感器则相当于人的神经元、人的内核?
张恒第:可以这么认为,传感器连接到从大脑引出的最末梢的神经。比如人的眼睛、皮肤,都可以视为传感器,大脑实时接收并处理来自海量传感器的真实世界动态数据,这是具身智能与传统互联网 AI 的最大区别。具身智能可以通过传感器从外部收集实时动态的信号,通过执行器主动改变外部环境,而传统互联网 AI 主要是处理静态数据。
产联社:标准化普及后,我们是不是能看到机器人进厂打工的场景?
张恒第:我们期待的场景已经成为现实,机器人服务人类不再是电影里的科幻景象。已经有客户向我们提出了类似的业务诉求,让我们的机器人学习人类的工作,进行数据采集。现在机器人的动作有些慢,但机器人学习能力很强,很快就能跟上。
产联社:我看你们的宣传,说帕西尼的机器人,能在一天之内观察人类手工作业的行为模式,随后生成数据训练,就能复制下来对方的行为。这样产生的数据量级有多大?在存储、加工与应用层面,帕西尼是如何做的?
张恒第:人的操作能力非常精细,帕西尼通过采集视觉、触觉、末端动作将触感数字化到数据集里,这样的数据量级是巨大的——平均每笔数据几百兆,我们的数据采集峰值期一天就有 50 万笔,一天的数据就是 100TB。
一年下来,产生数据是 PB 级的,我们借用腾讯云平台,通过终端对数据进行查看、分析,最终将宝贵的数据变成资产。这有一个好处:指令简单,效果好。我们用 COS(对象存储,相当于云上的存储空间)将数据搬迁到云上,用 GooseFS(数据加速器)把对象存储里的冷数据变成热数据,模型可通过工具链从加速存储层快速提取所需训练数据,生成 Cache(缓存)进行模型训练。这里所要用到的工具链集成在腾讯 Robotics X 的 Tairos 平台(别名:钛螺丝,是腾讯 Robotics X 实验室与福田实验室联合发布的具身智能开放平台,定位为国内首个以模块化方式集成大模型、开发工具和数据服务的软件平台,通过即插即用模式向机器人行业开放)。
此外,我们可以在模型训练中使用腾讯的 PipeLine(PipeLine 为自定义管道流水线,可以将任务的处理分解为若干个处理阶段,即前一个处理单元的结果也是第二个模块的输入,实现计算作业流水线化。)只需要几行简短的命令,COS 里的对象会被加载到 GooseFS 里,GooseFS 再分析哪些数据是需要用到的,迅速提取,再通过特制管线迅速加载到训练用的集群里。
例如,设定一个虚拟环境,系统会自动完成 GPU 及配套工具链的配置,面对模型的选择,不管是帕西尼自研的 OmniVTLA(来自帕西尼的首个含触觉灵巧手端到端的具身智能模型。)还是 π 0/ π 0.5(具身智能模型,π 0.5 通过异构数据协同训练,让机器人理解任务语义并在全新环境中执行复杂任务,如清洁厨房等。)RDT-1B(一种基于扩散模型的 VLA 方案,通过去噪扩散概率模型生成动作,适用于高维动作空间和复杂动作分布)等主流的 SOTA(当前最佳技术)模型,只需在腾讯工具链中通过简单选项确定目标模型,再输入命令即可触发后续流程。
产联社:在选数据存储平台时,你比较看重哪些特质?
张恒第:作为业界首份 A 级全模态具身智能数据集生产商,在选数据存储平台时我们最看重安全性与稳定性。
一是存储量大 + 成本低。
二是要能高效地将冷数据变成热数据,进行模型训练。
腾讯的优势在于:
· 可以将数据快速加载到分发系统里并调取数据。
· 工具链完整,调取模型不必借助其他工具。
· 即时反馈精准定位模型待优化项,帮助我们实现高效迭代。
· 提供良好仿真环境,让我们在部署前就能在云上进行大量仿真验证。
· 安全能力高,有效防止外部攻击。
· Tairos 平台帮助同行业者数据共享。
· Tairos 背后的 data platform(数据平台解决方案)算力调度能力强,可以投放大量仿真任务。
我们可以只用几行简单的命令,就能便捷地使用各种服务。非常方便。
" 是的,我们要力争全球领先水平 "
产联社:你和许博士都有国外留学经历,对比过后,中国机器人感知科技在全球大概处于什么位置?
张恒第:具身智能硬件层面,中国已处于世界前列,在中国随处可见的送餐机器人,已然让海外民众感到惊奇。
软件层面,中国一直扮演的是一个追随者角色,但中国是一个好的追随者。比如 Chat GPT 出现不久,DeepSeek 就出现并超越了它。在数据采集上,中国的采集成本、采集质量、采集方式,也是无可比拟的,我们拿到单笔数据的平均价格很低,这样可以极大发挥 AI 的优势。
李开复认为,最好的心态是美国来创新,中国做应用。我不这么认为。日本曾经是机器人发展先锋,但随着数据驱动范式的出现,日本退守材料科学等传统强项,在下游产业不再具备曾经的绝对优势。我们要做的是将硬件优势转化为软件优势,打破中国 " 追随者 " 角色。中国硬件那么强,软件是一定要跟上的," 你不能让一个强壮的外壳配 3 岁小孩的脑子。而数据的质和量,在其中扮演最重要角色,我们要充分利用好这一新优势。"
产联社:触觉传感器研发出来之后,市场应用范围广吗?落地的时候有哪些具体的问题?
张恒第:非常广泛,我们的传感器已迭代至第三代,应用于多个领域,像地铁安检、汽车装配、物流仓储……凡是需要通过触觉实现感知的,都可以用。
我们把具身智能触觉比作 " 登月计划 "。登月的价值不仅仅在于月球上的宝藏,也在于过程积累的技术(温度控制、漂移抑制技术、磁免疫技术、测力算法)。这些技术在获得高性能触觉传感能力的同时,也能将触觉传感成本降低到 199 元,低成本将使得更多的人参与应用领域的探索,进而催生出丰富的应用。
产联社:触觉传感器技术应用能具体解决现在机器人的哪些问题?
张恒第:最早工业机器人用的是基于规则的算法 , 对环境和目标物的改变没有适应能力,传感器的引入最初都是为了增加机器人对环境变化的适应能力,触觉传感也不例外,触觉信号极大的增加了机器人的适应性。
在此先说一下视觉传感,机器人眼与人眼不同,机器人眼视觉捕捉后存在 30-40 毫秒传输到 VTLA 的主干网络,这个时间很长,有时机器人没有抓取到物体,但它以为已经抓到,就开始执行后面的操作,失败率会很高。
从算法来看,加入了触觉模态的 VTLA 会让机器人以更全面的感知能力在泛化的环境下获得更高收益。有研究报告指出,加入触觉感知的灵巧手在测试集上成功率达到了 100%,之前只有 70%,但 70% 的成功率是不能用于实践的。这 30% 的提升会让机器人应用场景多了成百上千倍。从这一角度来看,触觉模态会使模型的成功率、稳定性得到极大提升,这一提升是将 Demo 变成实用模型的最重要因素。
产联社:我们关注到帕西尼吸引了很多投资,未来准备在哪些领域发力?能与我们分享一下,下一步的计划吗?
张恒第:第一,拓展传感器应用边界与场景,将人类技能持续地迁移到机器人上,尤其是特种作业、危险场景,我们计划让机器人去做,这一过程将从易到难持续 10-20 年。同时我们将开放社群生态,让大家参与共创,多开发传感器的应用可能性。
第二,着重开发垂直领域的优质数据,尤其是此前在工厂、物流等产业方关心的高价值场景,构建高效、稳定的闭环。
总之,数据非常重要。从 CNN 到 Transformer,再到 ChatGPT 这类大模型的发展的过程中,他们能突破技术到应用的临界点都是源于数据的积累。所以我们坚信:触觉难关被攻克后,具身智能将迎来爆发点,这正是我们现阶段最期待的。
产联社:哪一类客户对触觉技术的需求更迫切?帕西尼如何针对不同的客户制定不同的触觉感知方案?
张恒第:我们的核心技术不会变,在研究过程中,我们会判断:只要这个原理在某一方面具备优势,我们就会展开研究,前提是它具备耐久性和信息一致性,如果不具备这两个条件,我们就会改用其它方案。
其次,我们针对医疗这种精细行业时,就会优化参数将传感器做得非常细小、纤薄,还要保证其搭载器械的精准拉扯力、咬合力。如果需要大面积平铺,我们增加用量就好。
产联社:如何看待你们在机器人赛道上所处的位置?
张恒第:以触觉为始,延伸形成完整生态,让具身智能深入到现实生活中,最后赋能更多行业。
产联社:能否分享一下你们的短中长期目标?
张恒第:短期目标:持续迭代触觉传感器,提升销量;增加产品多样性。
中期目标:一年内将具身智能领域的数据规模提升至亿级,机器人的物理智能提升到可落地的实质性水平。
长期目标:通过触觉感知以及所有感知技术将 AI 连接到真正的物理世界,以实现第二种智能生物的诞生,并服务于人类,与人类共存。


