一个综合性的大模型中文评估基准标签：AI模型评测访问官网

共 1 篇文章

排序

https://github.com,CMMLU是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力，涵盖了从基础学科到高级专业水平的67个主题。它包括：需要计算和推理的自然科...

7个月前

一个综合性的大模型中文评估基准标签：AI模型评测 访问官网