DeepEval 开源 LLM 评估框架

授权协议：None操作系统：None 开发语言：None

DeepEval 是一个简单易用的开源 LLM 评估框架，用于评估和测试大型语言模型系统。它与 Pytest 类似，但专门用于对 LLM 输出进行单元测试。DeepEval 结合了最新研究成果，...