36氪 02-12
这家机器人公司把“具身数据”塞进1万个背包里
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者丨苏建勋

在具身智能领域," 搞数据 " 这个事儿,可能是为数不多的共识。

依靠训练巨量数据,大语言模型诞生了 Chatgpt,"Scaling Law" 也成了 AI 人的信仰,可在具身智能所属的物理世界,没有互联网上海量的数据参照。不论是人,还是机器人,在现实中的数据量,都不足以复现 GPT 时刻。

所以,数据怎么搞,能搞到多少,以及要让数据有质量,就成了具身智能从业者当下最重要的工作之一。

最近,就有一家机器人公司想在数据采集上 " 整点花活儿 "。鹿明机器人发布了全球首款背包版 UMI 数采设备 FastUMI Pro(背包版),并计划在 2026 年投放 1 万台设备,在工业、家庭、酒店、餐馆、商场、办公等六大真实场景开展系统性数据采集。

全球首款背包版 UMI 数采设备:鹿明 FastUMI Pro(背包版)

简单解释一下 "UMI(通用操作接口)":UMI 是斯坦福大学、哥伦比亚大学与丰田研究所联合提出的低成本数据收集与学习框架。区别于市场同行的遥操数采,UMI 可以与机器人本体解耦,这就意味着训练出的数据,可以不仅适用于某一家 / 个机器人形态。

在 2026 年初的一次媒体交流会上,鹿明机器人创始人兼 CEO 喻超也聊到 UMI 和遥操的效率与成本对比:

" 同样是像叠衣服这样的事情,遥操作数据采集,需要花 50 秒,成本是 3-5 元,如果是用 FastUMI Pro 的方式去采集,只要 10 秒,成本

鹿明机器人成立于 2024 年 9 月,创始人喻超是前追觅具身机器人业务负责人,拥有近 10 年具身机器人研发经验,主导了小米 CyberDog 的研发和千台量产。联席 CTO 丁琰是大陆最早做 UMI 的人,首次将 UMI 从实验室带向工业界。

有量,也要有质

2025 年,鹿明通过自建数采中心的方式,已实现 10 万小时的数据产能。喻超判断,2026 年,头部具身模型的数据规模预计 100 万小时起。

而鹿明在 2026 年最重要的目标,就是建立年采集百万小时的 UMI 数据产能。这意味着,鹿明需要用更具规模化的手段,采集更多数据。

" 机器人训练数据本不应该如此昂贵和稀缺。人类在物理世界作业过程中产生的数据无处不在,只是没有被很好地收集。" 喻超表示。

背包版 FastUMI 正是为解决这一问题而生——它是一款便携的标准数采工作站,可将真实场景操作高效转化为高质量训练数据。

此前具身数据采集,大多依靠实验室或单一场景采集,这就会导致一个问题:机器人在采集时往往只在一个场景下重复几个动作,这样得到的数据就会缺乏多样性,也会影响模型的泛化能力。

因此,鹿明机器人希望采用更轻便的数据采集方式,将采集工具直接装进背包,让真实场景的数据采集门槛更低。

在具体场景上,鹿明机器人希望覆盖工业、家庭、酒店、餐馆、商场、办公六大核心场景,细分 30 个小类任务,构建结构化、多维度的操作数据体系。

" 采–训–推 " 一体化闭环能力是鹿明数据基础设施的核心。此次规模化数据采集的启动,正依托于这一已全面打通的基建体系:依托 FastUMI Pro,鹿明双臂具身机器人 MOS 在 5 小时内完成从 " 数据采集 - 策略训练 - 模型推理 " 的工厂质检全流程验证;FastUMI Pro 在合肥实地部署后,仅用 7 小时便跑通真实场景下的采集、训练与部署推理。

FastUMI Pro 在分拣零部件任务中,完成 " 数据采集 - 策略训练 - 模型推理 " 闭环

要训模型,数据先行

有了背包式的采集工具以外,鹿明还做了一件事,他们建了一个 " 数据超市 ",把采集到的数据变成了可以流通的标准产品,让客户可以直接在官网上采购标准化操作数据。可以看出,作为一家具身智能公司,鹿明当下的公司战略重点,都围绕 " 数据 "。

鹿明机器人的一系列动作背后,实际上反映了具身智能当下 " 最痛 " 的业务需求。

在年初的媒体沟通会上,鹿明机器人联席 CTO 丁琰就对《智能涌现》等媒体分享了他对于数据和模型的感悟。

" 我就是做模型出身的,我之前一直在训模型,当时我们在做的时候就发现一个很大的问题。" 丁琰说到," 要想训一个非常好的模型,必须要有一个很好的数据管线,包括数据生产、数据评估、数据筛选,建立的过程本身就需要时间。"

在摸清行业真实发展现状后,丁琰和团队当时就决定,模型和数据二选一的话,肯定先选数据,不能上来就训模型。

" 因为模型架构拼到最后,大家拼的不是模型架构,而是模型数据的质量,这是一个行业的共识。" 丁琰说到。

具身智能的能力上限高度依赖真实操作数据的规模与质量,当通用数据可以像硬件一样在线下单,行业模型训练门槛被显著拉低,具身智能才能从定制化探索走向工程化生产。

从 " 万台设备同步开采 " 到 " 通用数据电商下单 ",鹿明正将 " 无处不在却未被收集 " 的物理世界操作数据,变为可规模供给的标准化基础设施,并以此构建数据驱动的生态系统。当数据不再稀缺,机器人才真正走向通用。

end

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 背包 物理 创始人 斯坦福大学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论