量子位 17小时前
机器人运控训练步入分钟级时代!清华AIR开源UniLab:3分钟训好人形,速度暴涨10倍,Mac上也能跑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在具身智能训练中," 把计算全部塞进 GPU" 似乎成了唯一的提速密码,机器人运控并行训练的框架,IsaacLab、MuJoCoPlayground、mjlab 都默认遵循这一范式,这些系统都牢牢绑定在 NVIDIA 生态中。

清华大学智能产业研究院(AIR)DISCOVER Lab 联合清华、上交、上海创智学院等多所高校和谋先飞技术、求之科技、原力灵机,正式推出了全新的机器人强化学习训练架构——UniLab

团队另辟蹊径,通过大胆重构系统结构,打破了 "GPU 包揽全部 " 的潜规则,为具身智能打造了全新一代 "CPU 高效仿真 +GPU 策略训练 " 的异构高吞吐训练底座,在多项运控任务训练上实现了数倍效率提升。

布局全景:异构并行与多任务泛化架构

UniLab 从底层重新组织了仿真、数据采集与策略学习之间的系统结构。

UniLab 系统架构图核心突破 1:异构流水线重叠,大幅消除计算资源 " 干等空转 "

传统 GPU 管线将物理步进与策略学习同步串行执行,所有的计算都放在 GPU 上,导致显卡和多核 CPU 出现 " 一方计算、一方闲置 " 的资源闲置。

并行解耦:UniLab 采用异步异构架构,CPU 侧利用多核算力并行运行 MuJoCo 或 MotrixSim 高保真物理引擎,GPU 侧则专注于策略网络梯度更新。

数据流高度重叠(Overlapping):利用共享内存建立无锁的运行时缓冲区。当 GPU 在执行当前 Batch 的网络更新时,CPU 阵列已经在异步并发跑完下一步环境仿真,消除了昂贵的数据跨总线搬运延迟,榨干每一份硬件算力。

UniLab 单周期流水线时序核心突破 2:3 至 10 倍端到端加速,异构解耦换来系统级提速

传统 GPU 管线将仿真和学习绑在同一块显卡上,资源互相争抢。

UniLab 用实测数据证明,将仿真解耦到 CPU 侧并通过运行时协调,可以带来显著的端到端墙钟时间(Wall-clock Time)收益:

3-10 倍爆发提速:在相同硬件的基准测试中,UniLab 达到相同目标奖励的端到端训练速度比传统方案快 3 至 10 倍。

真机验证闭环:团队已将 UniLab 训练的策略成功部署到 6 类真机任务上,覆盖四足行走、人形全身运动追踪(含翻跟头、攀爬)以及灵巧手操作,完成了从仿真到真机的完整闭环验证。

端到端训练效率对比曲线核心突破 3:不绑定 CUDA,Mac 也能本地高效调训人形机器人

UniLab 彻底去除了对特定硬件的硬编码依赖,让机器人强化学习训练走向大众化:

跨平台全后端兼容:原生支持 CUDA、Apple、AMD 及 Intel 等多种后端,无缝适配 PPO、APPO、SAC、TD3 等主流强化学习算法。

Mac 训练神器:在 Mac(Apple Silicon)平台上,UniLab 借助统一内存架构(UMA)的低延迟特性,CPU 仿真与 GPU 学习之间的数据传输无需跨越 PCIe 总线,传输开销大幅降低。让 Mac 本地训练人形机器人成为现实。

全品类任务覆盖:基于统一的任务接口,UniLab 不仅支持四足和人形行走,还完美覆盖高动态人形动作跟踪(G1 Flip、G1 WallFlip、Dance 等)、高维接触的灵巧手精细操作(Sharpa hand),以及复杂的全身手脚协同(Loco-Manipulation)。

超高效训练系统:4090+9950 × 3d 的系统上,12 秒训练好四足行走,3 分钟人形 G1 学会走路,让机器人运控训练迈向 " 分钟级 " 时代。

工业级成熟代码架构:工业开发级代码构建成熟度,零成本上手,3 分钟本地配好环境,5 分钟运行好第一个 demo,面向 AI-Native 的开发协作模式让机器人模型和算法迁移 " 零摩擦 "。

多任务应用场景 collage 开源与未来探索

UniLab 现已正式开源

未来项目将围绕接触密集型灵巧操作的物理保真度评测、算法 benchmark、以及多模态触觉策略等方向持续迭代,将 UniLab 从一个高效训练系统进一步扩展为通用的机器人学习研究平台

项目主页:https://unilabsim.github.io

论文链接:https://arxiv.org/abs/2605.30313

代码仓库:https://github.com/unilabsim/UniLab

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

我们正在招聘一名眼疾手快、关注 AI 的学术编辑实习生 

感兴趣的小伙伴欢迎关注  了解详情

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 清华 air gpu 上海
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论