Yi大模型-零一万物发布的开源大模型

11个月前更新 195 0 0

Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。,Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B...

收录时间:
2024-09-11
Yi大模型-零一万物发布的开源大模型Yi大模型-零一万物发布的开源大模型

Yi大模型是什么?

Yi系列大模型是由李开复博士创办的AI 2.0公司“零一万物”研发的首款开源大模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。

Yi大模型-零一万物发布的开源大模型

Yi大模型评测效果如何?

虽然Yi系列大模型出道时间相对较晚,但从效果上来看,绝对称得上是后发制人

一出手即问鼎多项全球第一

  • Hugging Face英文测试榜单位居第一,以34B的大小碾压Llama-2 70B和Falcon-180B等一众大尺寸大模型;
  • 唯一成功登顶HuggingFace的国产大模型;
  • C-Eval中文能力排行榜位居第一,超越了全球所有开源模型;
  • MMLU、BBH等八大综合能力表现全部胜出;
  • 拿下全球最长上下文窗口宝座,达到200K,可直接处理40万汉字超长文本输入。

其中,Yi-34B模型在各种基准评估中表现出色。它在多个评估任务中取得了最先进的结果,包括MMLU、CMMLU、C-Eval、GAOKAO、BBH、常识推理、阅读理解和数学与编码任务。

Yi大模型-零一万物发布的开源大模型

如何使用Yi大模型?

Yi大模型可以通过Hugging Face模型仓库进行访问和使用。它在Yi许可证下获得许可,可以用于学术研究和免费商业使用(需要通过申请获得许可)。如果您想申请正式的商业许可,可以联系01.AI。

Yi-34B相关资源:

开源社区: Hugging Face ModelScopeGitHub

Yi-6B相关资源:

开源社区: Hugging FaceModelScopeGitHub

数据统计

相关导航

金蝶云·苍穹GPT

金蝶云·苍穹GPT

金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排、知识智能引擎、个性化扩展、安全可信任等特点。,金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排…
SAM 2-Meta推出的图像和视频对象分割模型

SAM 2-Meta推出的图像和视频对象分割模型

SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象进行分割,适用于各种视觉领域。这一模型在原有的Segment Anything Model (SAM)基础上进行了扩展和改进,支持更广泛的应用场景。,SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象…
GPT-4-OpenAI旗下AI大模型

GPT-4-OpenAI旗下AI大模型

GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。,GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。
Claude 3-Anthropic公司最新推出的AI大模型

Claude 3-Anthropic公司最新推出的AI大模型

Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。每个模型都提供了不同的智能水平、速度和成本效益,以适应不同的应用需求。,Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 So…