TRL 使用强化学习来训练语言模型

授权协议:None操作系统:None 开发语言:None
TRL (Transformer Reinforcement Learning) 是 Hugging Face 推出的一个具有强化学习功能的全栈 Transformer 语言模型。 TRL 是一...