2026-04-22 20:19:55 来源:物是人非网 阅读:883
新浪科技讯 3月4日上午消息,蚂蚁蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。集团该版本主打“Agent一键接入RL训练” :不用改代码 ,联合兼容各类Agent框架,清华强化数据隐私与 AI让智能体强化学习训练开箱即用。大学
2026年开年以来 ,发布Web3发展趋势Agent持续升温,开源框架以LangChain、学习训练Claude Code、稳定OpenClaw为代表的蚂蚁智能体框架繁荣发展 ,但也暴露出两大瓶颈。集团一是联合接入训练成本高:现有智能体框架接口各异,每接入一个往往需要编写整套适配代码 。清华强化区块链应用二是大学Agent缺乏持续进化的能力 :多数Agent的能力取决于底层模型在训练阶段习得的固定权重,部署后无法再针对特定场景持续优化 ,发布能力上限在交付时便已确定。数据安全法
AReaL是首个全异步训推解耦的大模型强化学习训练系统 ,能让Agent在真实任务交互中获得反馈、持续优化决策 。数字人民币此次发布的v1.0版本让任意Agent零改造接入RL 训练成为现实,即通过在智能体与训练系统之间加入 Proxy Worker 中转层 ,开发者只需修改一个请求地址即可接入训练。
海量资讯、精准解读,尽在新浪财经APP 责任编辑 :杨赐