驱动之家 03-04
AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 3 月 4 日消息,今天蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版,主打 Agent 一键接入 RL 训练,不用改代码即可兼容各类 Agent 框架,让智能体强化学习训练开箱即用。

近日以 LangChain、Claude Code、OpenClaw 为代表的智能体框架持续升温,但是还存在两大痛点。

一是接入训练成本高,现有智能体框架接口各异,每接入一个往往需要编写整套适配代码;同时多数 Agent 能力受限于底层模型的固定权重,部署后无法针对特定场景持续优化。

而 AReaL 作为首个全异步训推解耦的大模型强化学习训练系统,让 Agent 能在真实任务交互中获取反馈、持续优化决策。

此次发布的 v1.0 版本,能让任意 Agent 零改造接入 RL 训练成为现实,通过在智能体与训练系统之间加入 Proxy Worker 中转层,开发者只需修改一个请求地址即可接入训练。

以 OpenClaw 为例,开发者仅需在配置文件中将 base_url 和 api_key 指向 AReaL 网关,即可让智能体接入强化学习训练。

用户周期性对任务完成质量打分,AReaL 后台自动完成数据采集与模型更新,使智能体在使用过程中持续进化。

该版本还推出原生训练引擎 Archon,基于 PyTorch 实现完整的 5D 并行(数据并行、流水线并行、张量并行、上下文并行、专家并行),便于在不同环境中灵活部署,能够支持千亿参数级 MoE 模型的分布式训练。

至于未来,将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代,目前 AReaL v1.0 的代码与文档已在 inclusionAI 社区开源。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

清华大学 开源 中将 蚂蚁集团
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论