DeepEval 开源 LLM 评估框架

授权协议:None操作系统:None 开发语言:None
DeepEval 是一个简单易用的开源 LLM 评估框架,用于评估和测试大型语言模型系统。它与 Pytest 类似,但专门用于对 LLM 输出进行单元测试。DeepEval 结合了最新研究成果,...