AutoRL 开源模型 RL 训练框架

授权协议:None操作系统:None 开发语言:None
AutoRL 开源框架旨在简化使用强化学习(RL)为任何特定任务专门化训练开源模型(如 Qwen)的过程。 AutoRL 的训练流程是,用户首先用一句话定义任务,随后 AutoRL 会自动生成 ...