AutoRL 开源模型 RL 训练框架

授权协议：None操作系统：None 开发语言：None

AutoRL 开源框架旨在简化使用强化学习（RL）为任何特定任务专门化训练开源模型（如 Qwen）的过程。 AutoRL 的训练流程是，用户首先用一句话定义任务，随后 AutoRL 会自动生成 ...