AReaL 异步强化学习训练系统

授权协议:None操作系统:None 开发语言:None
AReaL (Ant Reasoning RL) 是开源的异步强化学习训练系统,用于大型推理模型。 AReaL 亮点 异步强化学习:通过算法-系统协同设计,AReaL 支持完全异步的强化学习,实...