Evals OpenAI 模型评估框架

授权协议:None操作系统:None 开发语言:None
Evals 是一个评估 OpenAI 模型的框架和一个开源的基准测试注册表,你可以使用 Evals 来创建和运行评估: 使用数据集来生成提示信息 衡量 OpenAI 模型所提供的完成度的质量 比...