R-Zero 从零开始进行自我进化推理的 LLM

授权协议:None操作系统:None 开发语言:None
R-Zero 是一个新颖的框架,它使 LLM 能够自主提升其推理能力,而无需任何预先存在的任务或标签。它是一个真正自我进化的系统,可以从零开始学习。 R-Zero 的核心是在同一基础模型的两个实...