CMMLU

CMMLU 网站截图

简介

一个综合性的大模型中文评估基准

官网链接

分类

发布于 2024-11-20

相关推荐

FlagEval 网站截图

FlagEval

智源研究院推出的FlagEval（天秤）大模型评测平台

H2O EvalGPT 网站截图

H2O EvalGPT

H2O.ai推出的基于Elo评级方法的大模型评估系统

HELM 网站截图

HELM

斯坦福大学推出的大模型评测体系

MMBench 网站截图

MMBench

全方位的多模态大模型能力评测体系