TRUEBench 评估 AI 模型生产力

授权协议:None操作系统:None 开发语言:None
TRUEBench (Trustworthy Real-world Usage Evaluation Benchmark) 旨在评估大型语言模型作为生产力助手的效能。 TRUEBench 是一款...