H2O EvalGPThttps://evalgpt.ai,H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自...AI模型评测# H2O.ai推出的基于Elo评级方法的大模型评估系统标签:AI模型评测 访问官网7个月前30
PubMedQAhttps://pubmedqa.github.io,PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录1...AI模型评测# 生物医学研究问答数据集和模型得分排行榜标签:AI模型评测 访问官网 相关链接:PubMedQA论文PubMedQA数据集和代码7个月前20