AReaL v1.0稳固版来了,蚂蚁结合清华大学发布:让肆意Agent跑上强化进修
2026-03-04 13:12:58
3月4日消息,今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打Agent一键接入RL训练,不用改代码即可兼容各类Agent框架,让智能体强化学习训练开箱即用。
近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温,但是还存在两大痛点。
一是接入训练成本高,现有智能体框架接口各异,每接入一个往往需要编写整套适配代码;同时多数Agent能力受限于底层模型的固定权重,部署后无法针对特定场景持续优化。
而AReaL作为首个全异步训推解耦的大模型强化学习训练系统,让Agent能在真实任务交互中获取反馈、持续优化决策。

此次发布的v1.0版本,能让任意Agent零改造接入RL训练成为现实,通过在智能体与训练系统之间加入Proxy Worker中转层,开发者只需修改一个请求地址即可接入训练。
以OpenClaw为例,开发者仅需在配置文件中将base_url和api_key指向AReaL网关,即可让智能体接入强化学习训练。
用户周期性对任务完成质量打分,AReaL后台自动完成数据采集与模型更新,使智能体在使用过程中持续进化。

该版本还推出原生训练引擎Archon,基于PyTorch实现完整的5D并行(数据并行、流水线并行、张量并行、上下文并行、专家并行),便于在不同环境中灵活部署,能够支持千亿参数级MoE模型的分布式训练。
至于未来,将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代,目前AReaL v1.0的代码与文档已在inclusionAI社区开源。

相关阅读
-
加密寒冬生存指南:2018 与 2022 熊市五大教训与投资智慧区块链快讯 2026-05-08 10:48:37
-
烂尾楼钢筋长出嫩芽?当事人回应:外部无种子,房屋尚余两层未建金融科技前沿 2026-05-08 10:46:59
-
男子高反晕厥导游掐人中急救反被扇耳光,当事人回应真相深度解读 2026-05-08 10:46:42
-
比特币怎么买?2024 新手入门 BTC 完整指南,手把手教你从 0 到 1 买入比特币区块链快讯 2026-05-08 10:41:32
-
网友玩疯!照片秒变 3 岁儿童画,只需一句 AI 提示词深度解读 2026-05-08 10:40:55
-
6G 技术加速攻关:工信部批复 6GHz 频段实验频率许可金融科技前沿 2026-05-08 10:40:11
-
最后冲刺!白宫力拼 7 月 4 日前通过《CLARITY 法案》:加密监管新里程碑区块链快讯 2026-05-08 10:38:45
-
佳能 EOS R6 V 定档 5 月 13 日发布:支持 7K 视频与自动散热深度解读 2026-05-08 10:35:15
-
百度网盘时光轴在哪里?百度网盘时光轴打开方法资讯百科 2026-05-08 10:35:05
-
190 元榴莲遭仅退款?商家驱车 1600 公里翻垃圾桶取证,结局大快人心金融科技前沿 2026-05-08 10:34:41