AReaL v1.0稳定版来了！蚂蚁联合清华大学发布：让任意Agent跑上强化学习

快科技 3 月 4 日消息，今天蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版，主打 Agent 一键接入 RL 训练，不用改代码即可兼容各类 Agent 框架，让智能体强化学习训练开箱即用。

近日以 LangChain、Claude Code、OpenClaw 为代表的智能体框架持续升温，但是还存在两大痛点。

一是接入训练成本高，现有智能体框架接口各异，每接入一个往往需要编写整套适配代码；同时多数 Agent 能力受限于底层模型的固定权重，部署后无法针对特定场景持续优化。

而 AReaL 作为首个全异步训推解耦的大模型强化学习训练系统，让 Agent 能在真实任务交互中获取反馈、持续优化决策。

此次发布的 v1.0 版本，能让任意 Agent 零改造接入 RL 训练成为现实，通过在智能体与训练系统之间加入 Proxy Worker 中转层，开发者只需修改一个请求地址即可接入训练。

以 OpenClaw 为例，开发者仅需在配置文件中将 base_url 和 api_key 指向 AReaL 网关，即可让智能体接入强化学习训练。

用户周期性对任务完成质量打分，AReaL 后台自动完成数据采集与模型更新，使智能体在使用过程中持续进化。

该版本还推出原生训练引擎 Archon，基于 PyTorch 实现完整的 5D 并行（数据并行、流水线并行、张量并行、上下文并行、专家并行），便于在不同环境中灵活部署，能够支持千亿参数级 MoE 模型的分布式训练。

至于未来，将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代，目前 AReaL v1.0 的代码与文档已在 inclusionAI 社区开源。

宙世代