CMMLUhttps://github.com,CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础学科到高级专业水平的67个主题。它包括:需要计算和推理的自然科...AI模型评测# 一个综合性的大模型中文评估基准标签:AI模型评测 访问官网7个月前20