量子位 11小时前
具身Scaling Law押对了!独角兽新品1小时学会新任务,重复1800次成功率99%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

机器人也开始内卷了,一位表现极其离谱的 " 新员工 ",直接拉高了机器人的 " 就业门槛 "。

具身智能独角兽 Generalist,刚刚推出了最新的研究成果——新模型 Gen-1。

在包装手机和折叠纸箱这些精细活儿上,它把机器人的成功率从 64% 硬生生拉到了 99%,几乎告别了手残职业病。

以前折叠一个标准纸箱需要慢悠悠地磨掉 34 秒,现在 GEN-1 仅用 12.1 秒就能完成,效率直接开启了 3 倍速模式。

而且,GEN-1 的表现,也用实际表现验证了机器人领域的 Scaling Law。

机器人模型卷出新高度

GEN-1 上岗后的表现简直像是在倍速播放,而且即便面对维护扫地机器人 200 次这种枯燥任务,它也能稳如泰山。

甚至连续装箱 1800 次,也能从从容容游刃有余。

更离谱的是它处理突发状况的脑回路。

如果零件在流水线上被意外撞歪了,它绝不会傻站在那儿报错,会自己切换抓取角度,甚至动用两只手配合着把活干完。

这种靠直觉解决问题的即兴智能,让它在处理乱七八糟的杂物时表现得像个干了十年的老师傅,那种死读程序的铁疙瘩僵硬感彻底消失了。

用人类活动记录训练机器人

为了让 GEN-1 具备使机器人变身 " 全能打工人 " 的能力,研发团队对数据处理架构进行了重写。

他们没有死磕昂贵且难以扩展的机器人遥操作数据这条老路,转而通过低成本穿戴设备捕捉了数百万项人类活动记录,让 AI 像看电影一样预习物理世界的潜规则。

这种 " 去机器人化 " 的预训练方案巧妙绕过了数据规模的瓶颈,让基础模型在接触机械臂之前,就已经从人类视角洞察了空间、时间与物理因果。

这种基于 50 万小时高保真物理交互数据集练就的底座,让它的学习效率直接起飞,达到了前代模型的 10 倍。

哪怕是面对从未见过的奇怪任务或陌生的机器身体,给 GEN-1 一个小时的实机演示,也能让它火速入职。

另外,为了让机器人的动作不再卡成 PPT,以及实现实时操控,研发团队还在推理端祭出了两项关键技术。

首先是专门为物理世界打造的分页注意力(Paged Attention)机制。

在处理 PB 级别的物理交互数据流时,传统的内存管理方式容易导致计算资源分配不均,进而产生响应延迟。

Paged Attention 通过更高效地调度计算资源,解决了动作指令发射时的调度难题,确保每一个动作指令都能在毫秒级的时间维度内即时发射,让 AI 的反应速度能跟上现实世界的物理节奏。

配合演进的还有一套 Harmonic Reasoning 系统。它作为推理层面的核心组件,改变了以往单一路径预测动作的死板模式。

它允许模型在输出指令时通过多尺度的动态调节来引导权重,使其在执行折叠纸箱或包装手机等复杂动态任务时,能够展现出超越单一模型权重分布的性能上限。

研发团队为此投入数月时间优化训练稳定性,并编写了大量自定义内核来压榨硬件算力的极限。

机器人领域的 Scaling Law

GEN-1 的性能跨越,证明了 Scaling Law 在物理世界依然有效——只要喂够了数据和算力,机器人的脑子也会产生 " 开窍 " 时刻。

通过大规模预训练,机器人不再生硬地模仿动作序列,自己悟出了空间、时间和因果关系的规律,感知到了物体之间的相互影响。

有了直觉之后,机器人干活就开始带点 " 灵性 "。当任务中途出现没见过的阻碍,它会自发尝试一些教学大纲以外的操作,比如发现东西塞不进去时会像人一样晃晃袋子。

这种即兴解题的能力源于它真正理解了 " 动作会导致后果 " 的逻辑。

即使现场零件被意外撞歪,它也能凭直觉找回节奏,不需要人类像保姆一样每一步都盯着纠错。

这种在真实世界摔打出来的经验,让原本悬浮在百科全书里的抽象文字变成了实打实的行动力。

研发团队通过对齐技术,给这种即兴天赋装上了 " 导航仪 ",确保机器人 " 临场发挥 " 的动作依然会严丝合缝地待在用户设定的规范里。

这种进化,让机器人从一个只能按部就班的机器,变成了一个真正懂物理常识、能独立处理复杂局面的 " 职场老手 "。

DeepMind 大牛创业成果

GEN-1 的底层逻辑,源于资深团队在机器人领域的长期积累,创始人 Pete Florence 的技术背景,为这一方案提供了深厚的理论底色。

他曾任 Google DeepMind 高级研究科学家,通过 Dense Object Nets 等工作探索了视觉引导下机器人从感知到动作的端到端学习路径。

在谷歌 PaLM 团队工作期间,他作为核心力量参与并主导了 PaLM-E、RT-2 等多个具备代际跨越意义的机器人项目。

2024 年,Pete Florence 离开谷歌并创立了 Generalist。

即便在他离职后的 2025 年 3 月,DeepMind 在发布的 Gemini Robotics 论文中依然四次引用了他参与合著的研究。

参考链接:

https://generalistai.com/blog/apr-02-2026-GEN-1

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  风云变幻的 Q1,谁是 AI 超级应用?

量子位智库「AI 100」旗舰、创新双产品榜单开启招募!

扫码申报,让你的产品成为季度风向标。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 独角兽 就业 扫地机器人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论