36氪 1小时前
给宇树做“大脑”的具身智能公司,融资数亿元,红杉中国投了
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

文|富充

编辑|苏建勋

在我们访谈具身智能公司 " 中科第五纪 " 期间,两件事情先后发生。

第一件事,是 2026 年 1 月,中科第五纪获得宇树科技 " 核心生态合作伙伴 " 称号。在 To B 及工业场景,中科第五纪目前作为宇树机器人的 " 大脑 " 模型供应商。

第二件事,是中科第五纪在近期接连完成 Pre-A 及 Pre-A+ 轮融资,两笔交易在一个月之内完成,规模达数亿元。其中,Pre-A 轮由红杉中国领投,东方富海跟投;Pre-A+ 轮由芯能创投、优山资本联合领投,清控金信跟投。

中科第五纪创始人兼 CEO 刘年丰认为,两件事之间存在关联,核心逻辑是一级市场对机器人的认知更务实了。

" 去年,投资人更倾向通用的具身智能叙事,比如偏好‘既能搬箱子、又能收拾桌子、还能叠衣服’的机器人。但现在则更看重能不能先扎进垂类场景,并且让客户愿意复购。这关系到商业化能力,也关系到能不能用数据飞轮突破真机数据不足的瓶颈。" 刘年丰对《智能涌现》介绍。

中科第五纪与宇树的合作,正是这种 " 身体 + 大脑 " 分工的落地。自 2025 年起,双方就已逐渐展开在电力巡检、工业等场景的测试验证和落地。

△采用中科第五纪 " 具身大脑 " 的宇树机器人正在展示工业场景的搬运工作,图片:采访人提供

除了以 " 宇树大脑供应商 " 的角色进入场景,中科第五纪也面向行业客户直接提供完整的机器人解决方案。

在位于北京的办公室,我们见到了中科第五纪为一家头部央企客户定制的机器人。这款红色涂装的机器人,即将进入零售门店承担货品销售,未来还将进入加油站给汽车加油。此外,为行业客户的检测、搬运订单也已逐步推进中。

中科第五纪创建于 2024 年 9 月,成立一年出头便拿下宇树等多家知名企业客户。提及接订单的方法论,刘年丰说,现在找客户不难,难的是供给—— " 每次拿大订单都要 PK 众多对手,给客户的场景做 POC,经过数轮可靠性、鲁棒性和稳定性的测试,通过的才能留下。"

刘年丰透露,现在看似很多具身智能公司进了场景,但真能把活干好的不多。" 比如工厂里搬运料箱,光线一变、料箱外观、尺寸有所不同,机器人就认不出来,导致任务失败," 他说。

这种 " 认得出、干得了 " 的能力,来自中科第五纪的技术团队。

算法层面,团队核心成员均来自中科院自动化所。除刘年丰外,联创及算法总监刘京、青年首席科学家黄岩均为谭铁牛院士的博士生,深耕人工智能与多模态智能领域,毕业后曾就职于微软、华为等企业;联创曹恩华为中科院自动化所硕士,曾任阿里达摩院算法专家。

团队自研的超少样本具身操作大模型 "FAM 系列 " 用 " 二次预训练 " 和 " 热力图对齐 ",让模型在执行任务时更聚焦局部关键点。比如,搬运料箱时优先关注把手,而不是依赖堆大量不同颜色、新旧程度的料箱图片去 " 记住外观 "。

刘年丰称,这套方法使机器人只需最少 3 到 5 条真机示范数据即可完成新任务学习,基础任务成功率可达 97%。

中科第五纪的硬件能力则来自清华大学团队。清华大学长聘教授孙富春担任中科第五纪联合创始人兼首席科学家,其师生团队为公司提供硬件和运控能力的支撑。

以下是刘年丰的采访实录,对话经作者整理:

△中科第五纪轮式双臂机器人,图片:采访人提供  

从 " 通用的大脑 " 到 " 在垂类真干活的大脑 "

智能涌现:成为宇树 " 核心生态合作伙伴 " 意味着什么?

刘年丰:成为宇树 " 核心生态合作伙伴 ",意味着我们的具身智能模型能够与宇树的高性能机器人平台深度融合。宇树机器人在运动控制和硬件设计上具备领先优势,出货量持续增长。作为生态伙伴,我们将自研的具身大脑集成至宇树整机,赋予其执行复杂任务的能力。这种模式下,可使机器人更快地进入工业、巡检等实际作业场景,宇树的规模化出货也带动了我们的业务落地。

智能涌现:在具身智能大脑上有优势的公司也有好多家,为什么是中科第五纪成为宇树的模型供应方?

刘年丰:宇树的合作,也是 PK 掉了非常多头部的具身企业的。

宇树之前接触过不少头部大脑公司和高校研究机构,有很多模型能力也不错。我们之所以能胜出,核心原因有两个,一是我们的大脑能力扎实,尤其是通过小数据量样本快速学习的能力;二是我们具备快速交付落地的执行力,同时团队也拥有丰富的产品经验。

智能涌现:你说帮宇树做电力巡检,但行业内一些公司已经进入这个场景了,你们的优势或者差异化在哪里?

刘年丰:传统的巡检只能 " 看 ",发现问题后还得派人去解决。我们的目标是巡检加操作——巡检到点位后,直接完成操作,比如掏钥匙开柜门、按开关、拔插头。

传统的电力巡检用的是四足狗,但这些操作需要类人的构型。在最近的电力智能巡检大赛中,我们的机器人实现了跨站室迁移成功率 90%、新柜型示教少于 10 次、末端定位精度 ± 15mm 的严苛指标,验证了落地可行性。

智能涌现:给狗加个手不能解决这个问题吗?

刘年丰:不太行,主要有两层理由。

第一个就是马斯克讲的就是我们人类的世界是 field for human beings。有很多的设备,它是按照人的身高。电力设备是按人的身高设计的,狗形态的机器人很难够到 2 米高的电柜。

第二个问题在于,狗加双臂是一个非标的构型,我觉得我们做机器人公司,一定要杜绝按照非标的构型思路。因为非标意味着无法放量——今天臂长要 1.5 米,明天要 2 米;今天精度 0.1 毫米,明天要 1 毫米——这样就会量上不去,成本降不下来,算法也无法复用。

行业应该先 " 收敛 " 到标准硬件构型,比如至少上半身双臂可以达到共识。再解决不同负载、节拍的泛化问题,而不是总用新构型解决问题。

智能涌现:无论是面向宇树还是整机客户,其实中科第五纪提供的确定性都围绕着 " 进入场景 " 的能力,投资人现阶段 Buy In 的也是这一点吗?

刘年丰:是的,之前行业可能追求的是一个 " 既能搬箱子、又能收拾桌子、还能叠衣服 " 的通用模型。

但比起一个遥远而终极的通用智能,我们一直坚持做要能够在垂类、具体任务中落地的模型,比如至少能把工厂搬料箱这个问题真正解决。今年一级市场也意识到了这一点的重要性。

技术核心:小数据量样本、高数据使用效率

智能涌现:包括中科第五纪在内,最近采访的多家具身智能公司都说自己的机器人在工业场景搬箱子。但你提到,即使这个看似简单的任务,真能做好的企业也不是很多,所以从模型能力来看,具身机器人搬箱子的难点是什么?

刘年丰:看似搬箱子是一个单调重复的工作,但其实有多个难点。

第一是泛化:料箱颜色、尺寸、新旧程度都不同,能不能用同一个模型稳定完成识别、抓取与搬运。第二是导航:搬起之后从 A 点到 B 点怎么走,路径规划、避障,途中被打断后能不能续做。第三是策略理解:比如 " 从面前 100 个箱子里搬走 50 个 ",机器人能不能理解数量、以及该选择哪 50 个箱子,到目的地怎么码放,以及放下后要不要把物体取出等等,每个环节都存在问题。

这些看起来是搬箱子,背后其实是一整套复杂的任务规划与执行。

智能涌现:刚才你说到料箱的泛化性,感觉箱子已经是外观比较简单的物体了,为什么光照变了,具身智能模型的辨认就变难了?

刘年丰:最本质的原因就是因为,我们现在具身模型主流使用的 VLA,是沿袭的动态模型沿袭了大语言模型——对整张图片做全局信息映射。

举个例子,比如拍一张有三瓶矿泉水的照片,白天和晚上光线不同,整张图片的色温、亮度都变了,模型可能就不认识了。

问题在于,具身智能没有大模型那样的数据体量去覆盖所有光照变化。但换个思路,如果模型能关注局部信息——比如只锁定每瓶水的外观特征,而不关心背景、光线、桌子颜色——就能避免被全局变化干扰。这正是我们做 " 热力图 " 的出发点:让模型聚焦操作对象本身,而不是整个画面。

智能涌现:具体讲讲中科第五纪的模型是如何提高泛化性的?

刘年丰:操作的核心是操作对象,但以前的主流模型太关注全局信息。我们的思路是:通过多个二维热力图,把要操作的对象位置自适应地学习出来,让模型意识到什么是最需要响应的操作对象。

△中科第五纪 FAM 模型图,图片:采访人提供

热力图可以理解为一张 " 重点标记图 " ——图像中颜色越深的区域,代表模型应该越关注。比如指令是让机器人开办公室门,它会重点盯着门把手,而不是整扇门——不管门是木门、玻璃门还是什么颜色,只要把手在那儿,它就知道怎么操作。回到工厂搬料箱的场景也一样,模型关注的是把手,不是整个料箱,更不是整个视野里的工厂。

这是通过 " 二次预训练 " 实现的,第一次预训练,我们让模型知道各个物体是什么;第二次预训练,我们通过 " 热力图 " 让模型重点关注操作对象,让模型学会分辨 " 什么才是当前任务最重要的东西 "。

智能涌现:所以你之前说拿到宇树订单的原因之一在于,FAM 模型能通过小数据量样本,快速实现新任务学习,正是因为你们的技术方法比较节省数据?

刘年丰:是的,当前真机数据不足是行业共识。

我们的解决方法之一是通过 " 二次预训练 " 提高模型对重点操作对象的关注,可以提高数据使用效率,节省大量预训练数据。

此外,我们重视进入场景,也是因为可以通过真干活的数据飞轮,把真机数据转起来。

商业化展望:" 复购 " 很关键

智能涌现:具身智能行业从去年下半年开始,就非常注重 " 商业化落地 ",但你指出今年更考验的是 " 复购 "?

刘年丰:对。2025 年,我们看到很多机器人看似进入干活场景,其实还是在 POC(概念验证)。到了 2026 年,考验的是复购,像搬箱子这样的场景,要在 2026 年被彻底解决。

智能涌现:今年彻底解决搬箱子这个任务之后,那在工业场景里,下一个被具身智能企业集中探索,且可能被解决的工作是什么?

刘年丰:有挺多的,比如移动分拣,这是一种更精细的搬箱子。需要把箱子里面的某些特定的东西,拿到特定的位置去。这一大类任务,无论是横向(跨客户)还是纵向(跨场景)看,都有极强的泛化空间。

智能涌现:你们的商业模式是怎样的?如何收费?

刘年丰:面向本体公司,我们交付大脑,并按照一个机器人对应一个 license 收费,现阶段会根据场景和任务的复杂度判断费用。

而面向终端场景客户,我们交付自研的轮式机器人,按照整台机器人收费。而未来随着供应链愈加成熟,整机的价格会进一步下探,客户也会看到更好的 ROI 数据。

智能涌现:中科第五纪既给客户出 " 软 " 的部分,也自己做软硬一体的机器人。所以最后公司的商业模式究竟会更偏向哪条路?

刘年丰:我们的最终定位是软硬一体的公司,我们也认为具身智能在 " 脑 " 不在 " 型 "。可以参考苹果,最核心的竞争力不是摄像头、不是主板,而是操作系统和生态。这条路虽然难,但也是我们想走的路。

评论
大家都在看