铅笔道 6小时前
清华92后,融资数亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

一年五轮融资、金额数亿元,具身智能跑出一只潜力独角兽:鹿明机器人。

去年 12 月,它连拿两轮钱,融了几个亿;去年上半年,它连融了三轮,近 2 亿元。

为啥资本疯抢?核心之一是它研发的 FastUMI Pro 软硬件系统。

简单说就是 " 不用机器人本体,也能采数据 " 的方法,2025 年下半年,海外的两家明星具身智能公司,Generalist 的新模型 Gen 0,以及 Sunday Robotics,都采用了 UMI。

这种技术使得原来人控制机器遥操作采一条数据要 50 秒,现在 10 秒就搞定,成本直接砍了 80%,鹿明还搞 8 道工业级检查,以前行业里 70% 的数据能用,现在 95% 以上都是好数据。

它的核心本事是 " 泛化 ":一套数据,几十种机器人都能用,打破数据孤岛,让所有机器人都能 " 互通有无 "!鹿明机器人的崛起,其实在说一个简单道理:具身智能要落地,先搞定数据。

鹿明机器人由前追觅科技人形机器人业务负责人喻超创立,喻超毕业于清华大学,自 2016 年起便深耕机器人学习算法领域。联席 CTO 丁琰为纽约州立大学人工智能博士、前上海 AI lab 明星研究员。

从 2024 年 9 月成立,到破解行业数据难题,2026 年他们的目标是百万小时具身真机数据产能,建成全球最大的具身真机数据集。据称,全球具身智能圈内,有超过三分之二的顶尖团队,都在使用 FastUMI Pro,这一系统已经成为行业内验证和开发 UMI 能力的标配装备。

也正因如此,鹿明机器人与智元机器人、银河通用、它石智航一起,被并称为 " 具身数据四小龙 "。

最近,铅笔道同多家媒体一起,与喻超、丁琰就机器人数据、商业机会等话题交流,以下是对话精华。

铅笔道:是什么让你下定决心出来创业?

喻超:2024 年,我看到了大模型技术在 NLP 领域的突破,我相信 Scaling Law 在具身智能领域也是成立的,通用智能与机器人相结合的拐点已经到来。

而且我看到了行业存在很多待解的痛点,比如基础设施不够完善,无法支撑具身智能在场景里规模化落地,现在正是构建行业基础设施、建立数据标准的最佳时机。

铅笔道:创业以来都做了哪些事情?

喻超:基于我对于行业的认知,提出了 " 鹿明指数 "。鹿明指数 = 场景价值 / ( 数据成本 × 硬件成本 ) 。

在具身智能领域,真正拉开差距的,是落地成本。数据成本和硬件成本越低,场景价值越大。

基于这个判断,我们也形成了一个更清晰的共识:基础设施是否成熟,决定了场景能不能稳定落地;硬件本体是否可靠、贴合场景,决定了能不能长期使用;数据是否高质量、低成本、可规模复制,决定了模型能不能在不同场景中 " 举一反三 "。

这也是为什么,我们并不只盯着某一个环节做优化。鹿明指数真正想解决的,不是 " 单点领先 ",而是整体效率。它指导我们系统性地搭建从硬件、数据到模型的完整能力。

一个具体的例子是,我们自主研发了 FastUMI Pro 数据采集系统。通过这套系统,真机数据的采集效率提升了 5 倍,成本降低了 80%。构建起从硬件、数据到模型的全栈能力闭环。

铅笔道:怎么看待数据、模型、硬件之间的关系?

丁琰:数据质量首先取决于数据采集硬件。采集硬件好不好,决定了数据质量高低,而数据质量又决定了模型能力的上限。如果数据质量不好,模型不可能训练好。

然后是硬件。当数据与模型完成适配后,最终要部署到硬件本体上,如果本体性能跟不上,模型的效果也很难完全发挥出来。

这三者是相互影响的关系。也正因为这样,我们最近会发布一款 " 为 UMI 量身打造 " 的轻量级机械臂,希望它能最大程度发挥数据和模型的能力,把整体性能推到一个比较极致的状态。

铅笔道:你们既卖设备,也围绕数据。你们真正的核心竞争力是什么?为什么客户会选择你们,而不只是买一个 " 本体硬件 "?

丁琰:在具身智能行业,如果模型训不出来,那一切都没有意义。

硬件不是一个孤立的东西。传感器选型、数据处理方式、数据如何被模型使用,这些是一个有机整体。我们卖的并不是一个 " 夹爪 ",而是一整套如何为模型提供高质量物理训练数据的解决方案。

用 3D 打印也能做出一个外形类似的东西,但关键不在 " 像不像 ",而在于——它采的数据,能不能真正训练出模型。

我们从市场得到的反馈是,用我们的设备采集到的数据,是少有的能真正能把模型训出来的。

铅笔道:你们和同行的差异具体体现在哪?

丁琰:经过长时间的探索,我们反复验证了一件事:数据采集硬件和模型训练经验是分不开的。

如果完全不做模型,对训练没有感知,就直接去做硬件,那这个硬件基本是 " 废的 "。

即便外观、传感器参数看起来一样,但里面的东西完全不一样。

举一个具体的例子:镜头选型。我们用了高性能的运动级鱼眼镜头,是因为在高速运动采集时,普通鱼眼会糊、会失真。

而且还有一个细节——动态恢复能力。比如你把手挡住镜头,再松开,普通镜头可能要 3-4 秒才能恢复,我们的可以瞬间恢复。

对不做算法的人来说,这是小细节;但对做模型的人来说,这决定了任务是 0,还是 100,中间没有 " 差不多 "。

所以我们在硬件上投入了大量成本,因为不这么做,模型就训不出来。我们的目标始终是提供能够用于训练模型的高质量数据,而 FastUMI Pro 是支持具身智能规模化的关键基础设施。

此外,我们提供的不仅是数据采集设备、高质量数据集,更有行业解决方案以及联合模型训练的全栈服务,我们构建了一个完善的 UMI 数据生态体系。我们是一个以数据为纽带,连接硬件、算法、场景和合作伙伴的生态平台。

铅笔道:你们的技术,为什么能做到 " 不挑机器人的身体 "?

丁琰:我举个比较直观的例子。我们在数据采集时,会用到两类设备:一种是手持设备,一种是机载设备。

手持设备本质上是一个夹爪,上面装了摄像头,用来记录夹爪的外观和操作过程。在部署的时候,只要机器人夹爪的外观与摄像头参数和手持设备一致,无论所搭配的机械臂类型如何,采集到的数据都可以相互共用,这就实现了物理层面的本体泛化。

泛化能力本质上是一个 " 见过多少世界 " 的问题。过去的问题在于,数据采集慢、成本高、质量不稳定,一个小时可能只能采三五条数据。但现在这种方式,数据规模可以快速做上去,而且质量是可控的。

铅笔道:机器人在工厂的哪些环节,已经能比较明显地提升效率?

丁琰:整体来看,工厂里的任务大概可以分成三大类,难度是逐级上升的。

第一类是最简单的,比如规则相对明确的 pick&place,不涉及力控。这一类场景是最好落地的。我们之前在合作中,大概有 30% 的场景属于这一类。

第二类是对力控和稳定性要求更高的任务,比如叠纸盒、包装,这类任务需要有力反馈,难度就上升了一档,这一类也大概占 30%。

第三类是既需要力控,又需要精度,比如插线束、做 PCB 相关操作,典型的 3C 场景。这类任务难度最高,对系统要求也最复杂。

这种分层的意义在于,让系统在真实产线中逐级验证可靠性。

铅笔道:你们的 UMI 数据采集方法,资金门槛相对较低,很多中小公司、初创公司都会优先选择它。那对资金充裕的大厂来说,它会不会成为一种 " 操作数据 " 的平替方案?

丁琰:对中小公司来说,UMI 是一个非常好的起点,能够以低成本获得大规模的高质量真机数据;对大公司来说,随着模型规模扩大,对数据量的需求达到海量级别,遥操作数据的成本过高,从产业角度看,它本质上是一个效率更高的数据解决方案,会推动整个产业分工发生变化。

铅笔道:在数据采集过程中,最难的是哪一环?

丁琰:数据质量管理。数据必须做即时评估,才能保证数据质量可控。

这也是为什么我们在数据评估和管理体系上投入了这么多精力。我们将 " 可复现 " 作为数据治理的第一性原理,建立了 8 道工业级数据质量评估体系,只交付 100% 可复现的数据。

不同类型的客户会给我们提出不同的标准,在给客户交付数据的时候,我们的数据质量不仅全都符合这些标准,甚至还远高于客户的标准。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 融资 基础设施 明星 上海
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论