
3 月 31 日至 4 月 3 日,第 27 届 ITES 深圳工业展暨高端装备产业集群展将在深圳国际会展中心(宝安)启幕。与此同时,钛媒体也联合 ITES 深圳工业展、工创联,共同打造一场主题为 " 具身觉醒,智造跃迁 " 的高端产业峰会。峰会首日,邀请到了赛博格机器人联合创始人张怀东、非夕科技副总裁陈仙勇,与钛媒体集团联合创始人、联席 CEO 刘湘明展开了一场关于《小脑进化——力控与运控的融合之路》的深度对话。
当下,具身智能正从实验室走向产业化的关键节点,人形机器人作为具身智能的核心载体,其 " 小脑 " ——也就是控制架构的进化,直接决定了机器人能否真正实现类人运动、柔性交互,能否打破实验室与真实场景的壁垒。
而在具身智能 " 小脑 " 进化的路径上,力控与运控代表着两条极具影响力的技术路线。其中,力控派以力觉反馈为核心,模拟人类指尖感知与柔顺交互,追求 " 像人一样精准用力 ";运控派以轨迹规划 + 全身协同为核心,模拟人类肢体联动与平衡控制,追求 " 像人一样灵活移动 "。
张怀东认为,之所以有两条不同的技术路线,本质上是工业机器人对末端任务的要求不同决定的。" 有时候对力的要求很高,有时候希望机械末端到达的位置足够精确,比如做激光切割,定位精度要求毫米级,所以对位置有要求。它们各有不同的应用场景,因此才会分化出两种不同的控制模式。"
陈仙勇也给出了相似的看法,认为更多是以任务为导向,从目标出发看怎么达到目的,技术本身都非常难。" 运动控制,从传统工业机械手和协作机械手领域,真正能把它做得非常好的目前也是凤毛麟角。力控也一样,听起来是一个很泛的概念,但真正要做到非常精细、稳定的控制,做到柔顺的力控,同时又准又快又稳,还要客户用得起,都非常难,各有各的难处。"
不同的场景,不同的需求,力控与运控的差异化融合,是直击具身智能在场景加速落地的关键。只不过,基于当前的技术成熟度以及成本问题,导致规模化应用还需要一定的推进时间。对于赛博格机器人和非夕科技亦是如此,如何去进一步降本,实现更多场景的落地应用,去规模化量产以及进一步盈利,成了下一步的难题。
对此,陈仙勇透露称,目前,已经初步实现了规模落地的态势。从去年开始,在各行业的机器人出货量已经超过千台,今年每年以翻倍的速度在推广。如果说影响规模化商业落地的因素,第一是让更多人看见你的价值,第二是让更多人一起来把全新的形态推广到千行百业。
张怀东则指出,每个客户想要的解决方案有共性的地方,也有各自场景化的地方。从这个角度看,赛博格机器人的规模化盈利就是把每个客户都做好。先用通用的底座(文明社会)保证下限,再用专用的适配(孤岛生存)拉高上限,通过每一个场景的深度定制实现单点盈利,最终累加成规模化盈利。
以下是本次对话内容实录,略经编辑:
刘湘明:各位朋友大家好,欢迎来到物理 AI 现场。今天我们要讨论一个技术硬核的话题,就是 " 小脑的进化——力控与运控的融合之路 "。今天很高兴请到了两位非常专业的嘉宾:赛博格机器人联合创始人张怀东,还有非夕科技的副总裁陈仙勇陈总。
现在具身智能很热,一方面大家讨论大模型,另一方面讨论小脑的问题,但小脑其实有两条技术路线,有点像我们看《笑傲江湖》里的剑宗和气宗,就是力控和运控两条路线。今天很难得的机会,两位专家能跟大家分享一下这些技术路线的利弊,包括未来的发展,先请两位介绍一下自己所在的公司以及现在做的事情。
张怀东:大家好,我是深圳赛博格机器人的联合创始人,我们公司是 2024 年 7 月份成立的,主要做面向工业和特种场景的个人机器人,所以对力控和微控的要求非常高。我们的机器人也有自研的灵巧手,手上带有视觉传感器,有自己的算法,去做定位和力控混合的一些运控算法,在这一块还是有一些积累的。我们希望在一些工业场景里面,去做一些定位更精细的事情,比如精细的切割、打磨,或者旋转阀门、开门这些很复杂的临场操作。我们觉得这些控制算法是不可或缺的。
刘湘明:现在哪些特种场景会用到你们的机器人?
张怀东:所有产品都会用得到,不管是工业还是特种产品。工业上,我们去山西电子厂,或者物流仓库、分拣,很多产品都需要用到。特种场景就更多了,比如煤矿、电力、核能等很多危险的地方,高负荷的地方,都需要机器人去替代人类。因为人类想做轻松的工作,我们想把人类从那些难、苦的工作里剥离出来。
刘湘明:来,陈总您也介绍一下。
陈仙勇:大家好,我是非夕科技的副总裁陈仙勇。很高兴在这里介绍非夕科技——一家专注于以仿人化技术打造具身机器人的公司。目前我们希望构建的是面向全身世界的操作任务、通用智能机器人的基础平台。我们的核心不仅仅是为了做单品,而是持续打磨机器人在持续接触、多场景、复杂环境下的系统能力。今天我们也带来了我们刚刚发布的 " 初心 " 系列新产品,欢迎大家到我们的展位参观,谢谢!
刘湘明:新产品有什么亮点?
陈仙勇:沿着仿人化的路线,我们一直在持续迭代极致的环境交互能力。从几个方面来简要介绍:一方面在自适应的能力上有了全新的突破;同时机器人已经打造了具备全身感知的触控能力,以及围绕自适应的场景有了更安全的架构。基于我们的初心产品,我们也带来了各种丰富形态的解决方案,比如 "Michael",有点像我们人的上半身,双臂协同操作能力的产品平台。
刘湘明:为什么要强调双臂的协调?什么样的场景会用到?
陈仙勇:在自动化场景里,高度结构化以及固定的任务场景,传统的机械式重复定位精度的自动化解决方案已经非常适合。但是仍然有很多场景需要人去做精细的柔性操作,来适应多任务、跨场景的切换。人的双臂协同作业,能够大大降低自动化场景的结构复杂度,提升操作柔性,同时提升作业效率和质量。
刘湘明:为什么在小脑这种场景里会出现力控和运控两种不同的技术路线?两位能不能先做一下科普?
张怀东:是这样,我们想要完成的工作本身有两个主要目的:第一,希望我们的机械末端到达的位置足够精确。比如做激光切割,定位精度要求毫米级,所以对位置有要求。第二,有时候对力的要求很高,比如要去按按钮,不是说到了那个位置停下来就行,而是要把东西按下去,按得太深或太浅都不行,需要根据力的大小决定什么时候停下来。所以本质上是工业机器人对末端任务的要求,决定了有位置控制和力控制两条路线,它们各有不同的应用场景,因此才会分化出两种不同的控制模式。
陈仙勇:从更通俗的角度来理解这两个事情:它们不是为了单纯分运动控制还是力控制,更多是以任务为导向,从目标出发看怎么达到目的。运动控制比较专注在 " 怎么到达你想要的位置 ",力控制则比较关注在动态调整过程中持续高质量地达到目的。这是两个不同的目的产生的两条技术路线。
刘湘明:从开发难度来看,这两条技术路线哪个难度更高?
陈仙勇:技术本身都非常难。比如运动控制,从传统工业机械手和协作机械手领域,我们经常听到运动控制,但真正能把它做得非常好的目前也是凤毛麟角。力控制也一样,听起来是一个很泛的概念,但真正要做到非常精细、稳定的控制,做到柔顺的力控,同时又准又快又稳,还要客户用得起,都非常难,各有各的难处。
刘湘明:不管是力控还是运控,其实都和原来的工业机器人有技术延续性。为什么现在又把难题提出来?而且现在算力已经提升很多,软件工程也和原来很不一样了,现在的技术难点卡在什么地方?
陈仙勇:力控本身已经出现几十年了,不是什么新技术路线。但是怎么样把力控运用到手臂关节里,同时做到又准又稳又快,还能做到足够精细的调整,其实非常难。因为力的控制很容易受外部干扰产生扰动。所以这不仅仅是单一硬件形态的问题——硬件要足够极致稳定优秀,同时底层的算法和软件也必须做到极致的配合。
刘湘明:现在大模型和软件能力的提升,对小脑的开发有没有帮助和促进?
张怀东:像您刚才说的拿瓶子操作,我们自家的机器人已经做得很好。我们现在也是用大模型端到端地去学习,桌子上摆了很多苹果,抓完一瓶又抓下一瓶,因为它自己有感知。但是整个过程如果纯靠力控就不行,因为那个东西是软的,抓大力点也不会捏爆,也不会导致手或物体损坏,它本身不需要力控。
您刚才说的学习问题:基于视频学习确实没有力的信息,因为视频只能学到 " 到了哪个位置 "。实际训练出来的模型会发现,如果是纯位置控制,有时候抓的力会不够,位置到了但抓力不够,物体可能会滑落,模型就会尝试再抓一次,力度可能会更大,这样也能抓起来,但成功率和效率都降低了,要尝试好几次才能抓起来,有点像人闭着眼抓。
为了让效率更高、抓得更准,一个办法是把力的信息加进去。现在常见的做法是:在端到端模型里,把灵巧手上的触觉传感器信号直接接进去,通过学习的方式让模型自主感知该用多大力气抓。我们发现这种做法对抓取效果有提升。原始训练数据里没有任何力的信息,但通过引入触觉信号,模型是可以学习到的,我觉得这是一种很好的思路。
您刚才说的大脑对小脑的帮助,我觉得是有的。因为我们之前说的纯力控或纯位控,本质上你把力加进去之后,它是一个力位混合的工作模式。力位混合就会问:我更关注力还是更关注位?信号在融合时怎么优化?但回想一下人是怎样工作的:人不会去推理 " 我要用多大力 " 或 " 我要控制这个位置 ",所有推理都是经过大量训练后自主完成的。
所以我们希望大脑还是端到端,只是小脑给力位提供输出通道。抓东西时到底该用多大力、多大关注度在力上、多大关注度在位置上,让大模型自己去分配。这样它还是端到端的,简化了很多算法工程师需要做的事,不用再去过多考虑力位的问题。我们可能就不用再去推导规则,给数据让它自己学习就行,这也符合现在人工智能发展的路径——数据驱动。
刘湘明:那刚才说的一桌子瓶子,如果有一种特别容易碎的,容错空间很小,稍微用点力就碎,是不是挑战会更大?
张怀东:对的。如果抓的东西一捏就可能折起来,那风险就高了。像我们现在挑战一个很难的动作,比如转阀门,它是一个圆周运动,手一旦位置不对,就可能对手造成损坏。现在的灵巧手还是比较贵的,这种情况必须把力控加上,否则做不好,很容易造成硬件损坏。
刘湘明:陈总,您有什么补充吗?刚才我们已经进入到技术的深水区了。
陈仙勇:非夕科技一直沿着仿人化路线,专注在通用具身智能机器人这个方向上不断深耕。从智能化水平来说,我们也是通过大小脑相结合的方式构建这条路线。就像刚才张总介绍的,在简单的动作里,通过海量学习可以很快实现。但我们要反过来思考:为什么要智能?智能到底解决什么问题?如果是简单的任务,需不需要智能?
小脑智能其实是在跟物理环境持续高密度接触、高密度反馈、快速反馈的任务过程中,才能发挥它的价值,才需要智能。我认为小脑智能在物理世界的动态调整、机器操作中发挥了很大作用。大模型和小脑的能力是相辅相成的:大模型解决泛化能力,小脑解决物理最后一公里的柔性快速调整、持续接触的问题。
刘湘明:刚才大家都在谈大模型和小模型、大脑和小脑的问题。实验室环境里可以接大模型去算,但真到了具身智能里面,因为受到能耗和物理条件的限制,没有那么强的算力,这个问题怎么解决?
张怀东:目前业界通用的做法有两种:第一,把模型压小,压到足够小就能上边缘端;第二,云边协同,通过通信方式远程连接,所有计算在云端,边端负责执行。两种办法各有利弊。云边协同最大的限制是延时,对实时性要求高的操作可能不行;另外我们做特种机器人,有时要下煤矿,没信号就直接断连了,肯定也不行。边缘端的模式好处是走到哪都能自主感知、自己完成所有事情,不需要跟云端通信。
但问题在于算力确实小,模型压缩后效果肯定不如云端的好。这就需要想办法让小模型进化,让它的能力尽可能匹配云端的大模型。我们会用到蒸馏、量化、剪枝等操作,也在做一些持续学习和联邦学习的事情:多个机器人同时部署到 B 端场景,每个机器人每天都会产生新数据,我们可以把所有机器人的知识汇集到云端大脑去更新模型,更新完再知识蒸馏回到每个边缘端。听起来有点赛博,但这是我们正在做的,因为我们面向 B 端,不是只给客户交一台,而是上百台交给一个客户,更容易实现这个事。
刘湘明:那现在最小的模型能压到多大尺寸?
张怀东:现在常用的边缘端算力基本上两三百 TOPS 才行。我们大概测了一下,如果能将模型压到 1B 以内,运算速度基本就够了。因为我们可以用一些推理加速技术,让模型推理时更快。
刘湘明:那现在一个具身智能机器人的能源储备,也就是续航能力,大概是什么状态?
张怀东:跟本体相关。轮式机器人能扛更重的电池,一般能干到八小时。双足人形机器人因为本身负重有限,我们现在设计的是四小时,都采用换电的方式。
刘湘明:陈总,您对模型云边端的问题有什么看法?你们是怎么解决的?
陈仙勇:基础路线上,大家都差不多,共识越来越多,没有之前那么分化了。现在大家在卷的是:以更高效的学习效率、更低的成本、更小的样本量去学习。我们也在沿着让手和手臂本身的小脑级智能更加强大的方向,来减少模型容量或大小,更高效地部署。同时在机器人本体上,我们不断降低能耗、提升自身能力。比如我们刚发布的 " 初心 " 新品,更小的尺寸、更强的负载能力、更小的功耗,多方面同时发力。
刘湘明:刚才谈到能耗,具体到具身智能机器人,有哪些比较有效的降能耗手段?
陈仙勇:首先从算力本身,像张总说的压缩模型量是一方面。同时我们更关注大模型的通用泛化能力,在训练中如何形成高质量的与物理世界交互的能力迭代,这样可以大幅降低算力要求和模型容量。在机器人本体上,我们一直走轻量化路径,让本体能力更强大,压缩硬件功耗,同时提升学习效率和降低样本量。
张怀东:我从本体角度补充三种办法。第一,锁电机。现在的模型输出控制着所有电机,如果给电机信号,不管力大还是小,电机都会耗电。其实可以让不重要的电机停下来——整个机器人可能有五六十个电机,干活的可能只有五六个,其他电机可以锁住,这样能耗快速降下来,但目前大家还比较少这样做。
第二,从人类视频学习或模型优化的角度,让模型自己去寻找更低能耗的方式。比如拿水杯喝水,走直线和绕大圈能耗不一样,可以把能耗加入到优化目标里,让模型自己找到更低能耗的方式。
第三,训练模型本身的能耗很大,因为需要很大的算力中心。我们能不能让模型在训练时只学习新的、重要的数据?这涉及到数据筛选、自动清洗、持续学习和终身学习。我们自己在探索这方面,因为交付 B 端后每天都有新数据,如果能以低能耗方式处理这些数据,在算力中心那边可以降低差不多十倍甚至一百倍的能耗。
刘湘明:咱们回到灵巧手。刚才说到像拧螺栓需要很大的扭矩,灵巧手需要很高的动态响应。现在的硬件能不能支撑规模化量产?还是有些挑战?
张怀东:业界头部的几个灵巧手公司做出来的产品我觉得是可以用的。我们公司也有自己的灵巧手,上面带有六维力传感器,也支持量产。所以我的回答是:Yes,从业界角度看已经完全可用了。只是成本可能还得再降一下,因为现在的售价有些客户可能不太能接受。我们在做这样的事,但如果说能不能用,我觉得是能用的。
刘湘明:陈总,您怎么看?是这种情况吗?现在可以量产了,但是贵?
陈仙勇:非夕科技一直走仿人化路线,到目前为止我们还没有灵巧手的产品。我们更多在思考人在作业时发挥了什么功能。沿着这条路线,我们开发了两指的仿人手作业功能,目前还没有太多去关注是不是需要五个手指头。两指能够实时适应各种工件的大小,根据不同的材质形成轻柔精细的操作,甚至能在稳定夹持的过程中做指尖调整等功能。
刘湘明:回到张总提到的 BOM 成本问题,未来在这种技术路线下,怎么形成成本优势?价格的曲线会是什么状态?
张怀东:我们的答案是:从软件、硬件到算法,我们暂时是全栈自研。因为灵巧手一方面需要本体设计研发能力,另一方面需要控制算法和调度。很多工业客户之前用传统工业机械臂方案,你给他一只手他也不会用,所以交付时还得把算法也做进去。您说的 BOM 成本不只是硬件,而是整个解决方案部署下去的总成本。我们现在给出的答案是:我们提供的是整体解决方案,在这个方案里把成本做到最低。
陈仙勇:成本方面,这是一个全球范围内颠覆式的创新形态。我们花了大量精力迭代极致的自适应能力,同时也在持续关注降本。一方面,随着自适应能力的建立,我们从新品设计维度就开始关注更优的成本结构;另一方面,不断优化供应链,在保证极致性能的同时优化成本结构。
另外,我想分享另一个维度:应该思考解决一个复杂问题给用户省下了多少成本,而不仅仅是 BOM 成本。从零打造一个全新产品,大家看到的 BOM 成本只是冰山一角,下面还有大量的隐性成本。如果解决了客户的痛点,让整体使用成本更优,可能是更好的思路。客户从购买决策到最终交付、维护、运维、产品切换等整体拥有成本,我们从这个维度去提供极致性能体验,同时以快速高效的运维降低整体拥有成本,让性价比最优。
刘湘明:最后一个问题,也是绕不过去的:规模化盈利。请两位分享一下,你们最大的应用场景是什么?规模化盈利目前最大的障碍是什么?张总先来。
张怀东:我们面向的是 B 端客户,说白了就是工厂,或者特种客户——有应急需求、危险作业需求、高负荷作业需求的场景。在这些场景里,我们的灵巧手和力位混合都非常重要,因为都涉及灵巧操作。关于规模化盈利,我们的做法是一个客户一个客户打下来。每个客户想要的解决方案有共性的地方,也有各自场景化的地方。我们现在把每个客户当成一个 " 孤岛 " ——我们的机器人是从文明社会学会了很多东西的通用机器人,然后把它流放到每个孤岛里,让它重新学习孤岛的生存规则。
从这个角度看,规模化盈利就是把每个客户都做好。正如陈总提到的,核心价值决定了盈利的上限。我们希望在每个孤岛里把自己做到最好,即使在这个过程中可能会放弃一些文明社会学到的通用技能,也无所谓。我们本质上是把通用技能变成专用技能。这就是我们实现规模化盈利的路径——给客户提供最大价值,从而获取最大价值。
陈仙勇:非夕科技从成立之初到现在已经十个年头了。过去十年里,我们不断沉淀和打造极致的自适应能力,这是一个全球范围内全新的技术路线和产品形态。全栈式自研、构建这样的产品本身已经很难,但难不等于有价值。真正规模落地,要从用户角度出发:你解决了什么问题?打造全新产品非常难,而结合用户痛点、真正解决行业难题是另一个维度的难。
过去十年,我们不断让产品性能达到极致,同时结合各行各业的痛点问题,带来真正的价值。目前,我们已经初步实现了规模落地的态势:从去年开始,我们在各行业的机器人出货量已经超过千台,今年每年以翻倍的速度在推广。如果说影响规模化商业落地的因素,第一是让更多人看见你的价值,第二是让更多人一起来把全新的形态推广到千行百业。谢谢!
刘湘明:谢谢两位嘉宾精彩的分享。直播时间也到了,希望以后还有更多机会继续深入交流。也感谢各位观众的观看,我们一会儿再见,谢谢大家,谢谢!


登录后才可以发布评论哦
打开小程序可以发布评论哦