力控与运控的融合，共话具身智能“小脑”进化的破局之道

3 月 31 日至 4 月 3 日，第 27 届 ITES 深圳工业展暨高端装备产业集群展将在深圳国际会展中心（宝安）启幕。与此同时，钛媒体也联合 ITES 深圳工业展、工创联，共同打造一场主题为 " 具身觉醒，智造跃迁 " 的高端产业峰会。峰会首日，邀请到了赛博格机器人联合创始人张怀东、非夕科技副总裁陈仙勇，与钛媒体集团联合创始人、联席 CEO 刘湘明展开了一场关于《小脑进化——力控与运控的融合之路》的深度对话。

当下，具身智能正从实验室走向产业化的关键节点，人形机器人作为具身智能的核心载体，其 " 小脑 " ——也就是控制架构的进化，直接决定了机器人能否真正实现类人运动、柔性交互，能否打破实验室与真实场景的壁垒。

而在具身智能 " 小脑 " 进化的路径上，力控与运控代表着两条极具影响力的技术路线。其中，力控派以力觉反馈为核心，模拟人类指尖感知与柔顺交互，追求 " 像人一样精准用力 "；运控派以轨迹规划 + 全身协同为核心，模拟人类肢体联动与平衡控制，追求 " 像人一样灵活移动 "。

张怀东认为，之所以有两条不同的技术路线，本质上是工业机器人对末端任务的要求不同决定的。" 有时候对力的要求很高，有时候希望机械末端到达的位置足够精确，比如做激光切割，定位精度要求毫米级，所以对位置有要求。它们各有不同的应用场景，因此才会分化出两种不同的控制模式。"

陈仙勇也给出了相似的看法，认为更多是以任务为导向，从目标出发看怎么达到目的，技术本身都非常难。" 运动控制，从传统工业机械手和协作机械手领域，真正能把它做得非常好的目前也是凤毛麟角。力控也一样，听起来是一个很泛的概念，但真正要做到非常精细、稳定的控制，做到柔顺的力控，同时又准又快又稳，还要客户用得起，都非常难，各有各的难处。"

不同的场景，不同的需求，力控与运控的差异化融合，是直击具身智能在场景加速落地的关键。只不过，基于当前的技术成熟度以及成本问题，导致规模化应用还需要一定的推进时间。对于赛博格机器人和非夕科技亦是如此，如何去进一步降本，实现更多场景的落地应用，去规模化量产以及进一步盈利，成了下一步的难题。

对此，陈仙勇透露称，目前，已经初步实现了规模落地的态势。从去年开始，在各行业的机器人出货量已经超过千台，今年每年以翻倍的速度在推广。如果说影响规模化商业落地的因素，第一是让更多人看见你的价值，第二是让更多人一起来把全新的形态推广到千行百业。

张怀东则指出，每个客户想要的解决方案有共性的地方，也有各自场景化的地方。从这个角度看，赛博格机器人的规模化盈利就是把每个客户都做好。先用通用的底座（文明社会）保证下限，再用专用的适配（孤岛生存）拉高上限，通过每一个场景的深度定制实现单点盈利，最终累加成规模化盈利。

以下是本次对话内容实录，略经编辑：

刘湘明：各位朋友大家好，欢迎来到物理 AI 现场。今天我们要讨论一个技术硬核的话题，就是 " 小脑的进化——力控与运控的融合之路 "。今天很高兴请到了两位非常专业的嘉宾：赛博格机器人联合创始人张怀东，还有非夕科技的副总裁陈仙勇陈总。

现在具身智能很热，一方面大家讨论大模型，另一方面讨论小脑的问题，但小脑其实有两条技术路线，有点像我们看《笑傲江湖》里的剑宗和气宗，就是力控和运控两条路线。今天很难得的机会，两位专家能跟大家分享一下这些技术路线的利弊，包括未来的发展，先请两位介绍一下自己所在的公司以及现在做的事情。

张怀东：大家好，我是深圳赛博格机器人的联合创始人，我们公司是 2024 年 7 月份成立的，主要做面向工业和特种场景的个人机器人，所以对力控和微控的要求非常高。我们的机器人也有自研的灵巧手，手上带有视觉传感器，有自己的算法，去做定位和力控混合的一些运控算法，在这一块还是有一些积累的。我们希望在一些工业场景里面，去做一些定位更精细的事情，比如精细的切割、打磨，或者旋转阀门、开门这些很复杂的临场操作。我们觉得这些控制算法是不可或缺的。

刘湘明：现在哪些特种场景会用到你们的机器人？

张怀东：所有产品都会用得到，不管是工业还是特种产品。工业上，我们去山西电子厂，或者物流仓库、分拣，很多产品都需要用到。特种场景就更多了，比如煤矿、电力、核能等很多危险的地方，高负荷的地方，都需要机器人去替代人类。因为人类想做轻松的工作，我们想把人类从那些难、苦的工作里剥离出来。

刘湘明：来，陈总您也介绍一下。

陈仙勇：大家好，我是非夕科技的副总裁陈仙勇。很高兴在这里介绍非夕科技——一家专注于以仿人化技术打造具身机器人的公司。目前我们希望构建的是面向全身世界的操作任务、通用智能机器人的基础平台。我们的核心不仅仅是为了做单品，而是持续打磨机器人在持续接触、多场景、复杂环境下的系统能力。今天我们也带来了我们刚刚发布的 " 初心 " 系列新产品，欢迎大家到我们的展位参观，谢谢！

刘湘明：新产品有什么亮点？

陈仙勇：沿着仿人化的路线，我们一直在持续迭代极致的环境交互能力。从几个方面来简要介绍：一方面在自适应的能力上有了全新的突破；同时机器人已经打造了具备全身感知的触控能力，以及围绕自适应的场景有了更安全的架构。基于我们的初心产品，我们也带来了各种丰富形态的解决方案，比如 "Michael"，有点像我们人的上半身，双臂协同操作能力的产品平台。

刘湘明：为什么要强调双臂的协调？什么样的场景会用到？

陈仙勇：在自动化场景里，高度结构化以及固定的任务场景，传统的机械式重复定位精度的自动化解决方案已经非常适合。但是仍然有很多场景需要人去做精细的柔性操作，来适应多任务、跨场景的切换。人的双臂协同作业，能够大大降低自动化场景的结构复杂度，提升操作柔性，同时提升作业效率和质量。

刘湘明：为什么在小脑这种场景里会出现力控和运控两种不同的技术路线？两位能不能先做一下科普？

张怀东：是这样，我们想要完成的工作本身有两个主要目的：第一，希望我们的机械末端到达的位置足够精确。比如做激光切割，定位精度要求毫米级，所以对位置有要求。第二，有时候对力的要求很高，比如要去按按钮，不是说到了那个位置停下来就行，而是要把东西按下去，按得太深或太浅都不行，需要根据力的大小决定什么时候停下来。所以本质上是工业机器人对末端任务的要求，决定了有位置控制和力控制两条路线，它们各有不同的应用场景，因此才会分化出两种不同的控制模式。

陈仙勇：从更通俗的角度来理解这两个事情：它们不是为了单纯分运动控制还是力控制，更多是以任务为导向，从目标出发看怎么达到目的。运动控制比较专注在 " 怎么到达你想要的位置 "，力控制则比较关注在动态调整过程中持续高质量地达到目的。这是两个不同的目的产生的两条技术路线。

刘湘明：从开发难度来看，这两条技术路线哪个难度更高？

陈仙勇：技术本身都非常难。比如运动控制，从传统工业机械手和协作机械手领域，我们经常听到运动控制，但真正能把它做得非常好的目前也是凤毛麟角。力控制也一样，听起来是一个很泛的概念，但真正要做到非常精细、稳定的控制，做到柔顺的力控，同时又准又快又稳，还要客户用得起，都非常难，各有各的难处。

刘湘明：不管是力控还是运控，其实都和原来的工业机器人有技术延续性。为什么现在又把难题提出来？而且现在算力已经提升很多，软件工程也和原来很不一样了，现在的技术难点卡在什么地方？

陈仙勇：力控本身已经出现几十年了，不是什么新技术路线。但是怎么样把力控运用到手臂关节里，同时做到又准又稳又快，还能做到足够精细的调整，其实非常难。因为力的控制很容易受外部干扰产生扰动。所以这不仅仅是单一硬件形态的问题——硬件要足够极致稳定优秀，同时底层的算法和软件也必须做到极致的配合。

刘湘明：现在大模型和软件能力的提升，对小脑的开发有没有帮助和促进？

张怀东：像您刚才说的拿瓶子操作，我们自家的机器人已经做得很好。我们现在也是用大模型端到端地去学习，桌子上摆了很多苹果，抓完一瓶又抓下一瓶，因为它自己有感知。但是整个过程如果纯靠力控就不行，因为那个东西是软的，抓大力点也不会捏爆，也不会导致手或物体损坏，它本身不需要力控。

您刚才说的学习问题：基于视频学习确实没有力的信息，因为视频只能学到 " 到了哪个位置 "。实际训练出来的模型会发现，如果是纯位置控制，有时候抓的力会不够，位置到了但抓力不够，物体可能会滑落，模型就会尝试再抓一次，力度可能会更大，这样也能抓起来，但成功率和效率都降低了，要尝试好几次才能抓起来，有点像人闭着眼抓。

为了让效率更高、抓得更准，一个办法是把力的信息加进去。现在常见的做法是：在端到端模型里，把灵巧手上的触觉传感器信号直接接进去，通过学习的方式让模型自主感知该用多大力气抓。我们发现这种做法对抓取效果有提升。原始训练数据里没有任何力的信息，但通过引入触觉信号，模型是可以学习到的，我觉得这是一种很好的思路。

您刚才说的大脑对小脑的帮助，我觉得是有的。因为我们之前说的纯力控或纯位控，本质上你把力加进去之后，它是一个力位混合的工作模式。力位混合就会问：我更关注力还是更关注位？信号在融合时怎么优化？但回想一下人是怎样工作的：人不会去推理 " 我要用多大力 " 或 " 我要控制这个位置 "，所有推理都是经过大量训练后自主完成的。

所以我们希望大脑还是端到端，只是小脑给力位提供输出通道。抓东西时到底该用多大力、多大关注度在力上、多大关注度在位置上，让大模型自己去分配。这样它还是端到端的，简化了很多算法工程师需要做的事，不用再去过多考虑力位的问题。我们可能就不用再去推导规则，给数据让它自己学习就行，这也符合现在人工智能发展的路径——数据驱动。

刘湘明：那刚才说的一桌子瓶子，如果有一种特别容易碎的，容错空间很小，稍微用点力就碎，是不是挑战会更大？

张怀东：对的。如果抓的东西一捏就可能折起来，那风险就高了。像我们现在挑战一个很难的动作，比如转阀门，它是一个圆周运动，手一旦位置不对，就可能对手造成损坏。现在的灵巧手还是比较贵的，这种情况必须把力控加上，否则做不好，很容易造成硬件损坏。

刘湘明：陈总，您有什么补充吗？刚才我们已经进入到技术的深水区了。

陈仙勇：非夕科技一直沿着仿人化路线，专注在通用具身智能机器人这个方向上不断深耕。从智能化水平来说，我们也是通过大小脑相结合的方式构建这条路线。就像刚才张总介绍的，在简单的动作里，通过海量学习可以很快实现。但我们要反过来思考：为什么要智能？智能到底解决什么问题？如果是简单的任务，需不需要智能？

小脑智能其实是在跟物理环境持续高密度接触、高密度反馈、快速反馈的任务过程中，才能发挥它的价值，才需要智能。我认为小脑智能在物理世界的动态调整、机器操作中发挥了很大作用。大模型和小脑的能力是相辅相成的：大模型解决泛化能力，小脑解决物理最后一公里的柔性快速调整、持续接触的问题。

刘湘明：刚才大家都在谈大模型和小模型、大脑和小脑的问题。实验室环境里可以接大模型去算，但真到了具身智能里面，因为受到能耗和物理条件的限制，没有那么强的算力，这个问题怎么解决？

张怀东：目前业界通用的做法有两种：第一，把模型压小，压到足够小就能上边缘端；第二，云边协同，通过通信方式远程连接，所有计算在云端，边端负责执行。两种办法各有利弊。云边协同最大的限制是延时，对实时性要求高的操作可能不行；另外我们做特种机器人，有时要下煤矿，没信号就直接断连了，肯定也不行。边缘端的模式好处是走到哪都能自主感知、自己完成所有事情，不需要跟云端通信。

但问题在于算力确实小，模型压缩后效果肯定不如云端的好。这就需要想办法让小模型进化，让它的能力尽可能匹配云端的大模型。我们会用到蒸馏、量化、剪枝等操作，也在做一些持续学习和联邦学习的事情：多个机器人同时部署到 B 端场景，每个机器人每天都会产生新数据，我们可以把所有机器人的知识汇集到云端大脑去更新模型，更新完再知识蒸馏回到每个边缘端。听起来有点赛博，但这是我们正在做的，因为我们面向 B 端，不是只给客户交一台，而是上百台交给一个客户，更容易实现这个事。

刘湘明：那现在最小的模型能压到多大尺寸？

张怀东：现在常用的边缘端算力基本上两三百 TOPS 才行。我们大概测了一下，如果能将模型压到 1B 以内，运算速度基本就够了。因为我们可以用一些推理加速技术，让模型推理时更快。

刘湘明：那现在一个具身智能机器人的能源储备，也就是续航能力，大概是什么状态？

张怀东：跟本体相关。轮式机器人能扛更重的电池，一般能干到八小时。双足人形机器人因为本身负重有限，我们现在设计的是四小时，都采用换电的方式。

刘湘明：陈总，您对模型云边端的问题有什么看法？你们是怎么解决的？

陈仙勇：基础路线上，大家都差不多，共识越来越多，没有之前那么分化了。现在大家在卷的是：以更高效的学习效率、更低的成本、更小的样本量去学习。我们也在沿着让手和手臂本身的小脑级智能更加强大的方向，来减少模型容量或大小，更高效地部署。同时在机器人本体上，我们不断降低能耗、提升自身能力。比如我们刚发布的 " 初心 " 新品，更小的尺寸、更强的负载能力、更小的功耗，多方面同时发力。

刘湘明：刚才谈到能耗，具体到具身智能机器人，有哪些比较有效的降能耗手段？

陈仙勇：首先从算力本身，像张总说的压缩模型量是一方面。同时我们更关注大模型的通用泛化能力，在训练中如何形成高质量的与物理世界交互的能力迭代，这样可以大幅降低算力要求和模型容量。在机器人本体上，我们一直走轻量化路径，让本体能力更强大，压缩硬件功耗，同时提升学习效率和降低样本量。

张怀东：我从本体角度补充三种办法。第一，锁电机。现在的模型输出控制着所有电机，如果给电机信号，不管力大还是小，电机都会耗电。其实可以让不重要的电机停下来——整个机器人可能有五六十个电机，干活的可能只有五六个，其他电机可以锁住，这样能耗快速降下来，但目前大家还比较少这样做。

第二，从人类视频学习或模型优化的角度，让模型自己去寻找更低能耗的方式。比如拿水杯喝水，走直线和绕大圈能耗不一样，可以把能耗加入到优化目标里，让模型自己找到更低能耗的方式。

第三，训练模型本身的能耗很大，因为需要很大的算力中心。我们能不能让模型在训练时只学习新的、重要的数据？这涉及到数据筛选、自动清洗、持续学习和终身学习。我们自己在探索这方面，因为交付 B 端后每天都有新数据，如果能以低能耗方式处理这些数据，在算力中心那边可以降低差不多十倍甚至一百倍的能耗。

刘湘明：咱们回到灵巧手。刚才说到像拧螺栓需要很大的扭矩，灵巧手需要很高的动态响应。现在的硬件能不能支撑规模化量产？还是有些挑战？

张怀东：业界头部的几个灵巧手公司做出来的产品我觉得是可以用的。我们公司也有自己的灵巧手，上面带有六维力传感器，也支持量产。所以我的回答是：Yes，从业界角度看已经完全可用了。只是成本可能还得再降一下，因为现在的售价有些客户可能不太能接受。我们在做这样的事，但如果说能不能用，我觉得是能用的。

刘湘明：陈总，您怎么看？是这种情况吗？现在可以量产了，但是贵？

陈仙勇：非夕科技一直走仿人化路线，到目前为止我们还没有灵巧手的产品。我们更多在思考人在作业时发挥了什么功能。沿着这条路线，我们开发了两指的仿人手作业功能，目前还没有太多去关注是不是需要五个手指头。两指能够实时适应各种工件的大小，根据不同的材质形成轻柔精细的操作，甚至能在稳定夹持的过程中做指尖调整等功能。

刘湘明：回到张总提到的 BOM 成本问题，未来在这种技术路线下，怎么形成成本优势？价格的曲线会是什么状态？

张怀东：我们的答案是：从软件、硬件到算法，我们暂时是全栈自研。因为灵巧手一方面需要本体设计研发能力，另一方面需要控制算法和调度。很多工业客户之前用传统工业机械臂方案，你给他一只手他也不会用，所以交付时还得把算法也做进去。您说的 BOM 成本不只是硬件，而是整个解决方案部署下去的总成本。我们现在给出的答案是：我们提供的是整体解决方案，在这个方案里把成本做到最低。

陈仙勇：成本方面，这是一个全球范围内颠覆式的创新形态。我们花了大量精力迭代极致的自适应能力，同时也在持续关注降本。一方面，随着自适应能力的建立，我们从新品设计维度就开始关注更优的成本结构；另一方面，不断优化供应链，在保证极致性能的同时优化成本结构。

另外，我想分享另一个维度：应该思考解决一个复杂问题给用户省下了多少成本，而不仅仅是 BOM 成本。从零打造一个全新产品，大家看到的 BOM 成本只是冰山一角，下面还有大量的隐性成本。如果解决了客户的痛点，让整体使用成本更优，可能是更好的思路。客户从购买决策到最终交付、维护、运维、产品切换等整体拥有成本，我们从这个维度去提供极致性能体验，同时以快速高效的运维降低整体拥有成本，让性价比最优。

刘湘明：最后一个问题，也是绕不过去的：规模化盈利。请两位分享一下，你们最大的应用场景是什么？规模化盈利目前最大的障碍是什么？张总先来。

张怀东：我们面向的是 B 端客户，说白了就是工厂，或者特种客户——有应急需求、危险作业需求、高负荷作业需求的场景。在这些场景里，我们的灵巧手和力位混合都非常重要，因为都涉及灵巧操作。关于规模化盈利，我们的做法是一个客户一个客户打下来。每个客户想要的解决方案有共性的地方，也有各自场景化的地方。我们现在把每个客户当成一个 " 孤岛 " ——我们的机器人是从文明社会学会了很多东西的通用机器人，然后把它流放到每个孤岛里，让它重新学习孤岛的生存规则。

从这个角度看，规模化盈利就是把每个客户都做好。正如陈总提到的，核心价值决定了盈利的上限。我们希望在每个孤岛里把自己做到最好，即使在这个过程中可能会放弃一些文明社会学到的通用技能，也无所谓。我们本质上是把通用技能变成专用技能。这就是我们实现规模化盈利的路径——给客户提供最大价值，从而获取最大价值。

陈仙勇：非夕科技从成立之初到现在已经十个年头了。过去十年里，我们不断沉淀和打造极致的自适应能力，这是一个全球范围内全新的技术路线和产品形态。全栈式自研、构建这样的产品本身已经很难，但难不等于有价值。真正规模落地，要从用户角度出发：你解决了什么问题？打造全新产品非常难，而结合用户痛点、真正解决行业难题是另一个维度的难。

过去十年，我们不断让产品性能达到极致，同时结合各行各业的痛点问题，带来真正的价值。目前，我们已经初步实现了规模落地的态势：从去年开始，我们在各行业的机器人出货量已经超过千台，今年每年以翻倍的速度在推广。如果说影响规模化商业落地的因素，第一是让更多人看见你的价值，第二是让更多人一起来把全新的形态推广到千行百业。谢谢！

刘湘明：谢谢两位嘉宾精彩的分享。直播时间也到了，希望以后还有更多机会继续深入交流。也感谢各位观众的观看，我们一会儿再见，谢谢大家，谢谢！

宙世代

一起剪

相关标签