SmolLM-HuggingFace发布的高性能小型语言模型

2年前发布 206 0 0

SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型，参数分别为 1.35 亿、3.6 亿和 17 亿，训练数据来自高质量数据集 SmolLM-Corpus，其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多种基准测试中表现不错，适合跑在手机这种终端设备...

收录时间：

2024-09-11

手机查看

SmolLM-HuggingFace发布的高性能小型语言模型

打开网站

SmolLM是什么？

SmolLM是由 Huggingface 最新发布的一系列最先进的小型语言模型，有三种规格：1.35亿、3.6亿和17亿个参数。这些模型建立在 Cosmo-Corpus 上，Cosmo-Corpus 是一个精心策划的高质量训练数据集。Cosmo-Corpus 包括 Cosmopedia v2（由 Mixtral 生成的 280 亿个合成教科书和故事词块）、Python-Edu（由 The Stack 提供的 40 亿个 Python 教育样本词块）和 FineWeb-Edu（由 FineWeb 提供的 2200 亿个重复教育网络样本词块）。

SmolLM模型适合需要在本地设备上运行语言模型的开发者和研究人员。它们特别适合那些需要在资源受限的环境中进行高效推理的应用场景，如智能手机、笔记本电脑等。

SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM的测试结果

Hugging Face 团队将开发出的 SmolLM 模型与相同参数量的其他模型进行了基准测试，其中 SmolLM-135M 在多项测试中超越了小于 2 亿参数的其他模型；而 SmolLM-360M 的测试成绩优于所有小于 5 亿参数以下的模型，不过某些项目逊于 Meta 刚刚公布的 MobileLLM-350M；SmolLM-1.7B 模型则超越了所有参数量小于 20 亿参数的模型，包括微软 Phi-1.5、MobileLLM-1.5B 及 Qwen2。

在不同的推理和常识基准上评估 SmolLM 模型

如何使用SmolLM？

SmolLM项目地址：https://huggingface.co/blog/smollm
SmolLM模型合集：https://huggingface.co/collections/HuggingFaceTB/smollm-6695016cad7167254ce15966
数据集地址：https://huggingface.co/datasets/HuggingFaceTB/smollm-corpus

数据统计

SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM是什么？

SmolLM的测试结果

如何使用SmolLM？

数据统计

相关导航

悟道

CodeShell-北京大学开源的代码大模型

OpenBMB

知乎-知海图大模型

Coze

Segment Anything：首个图像分割基础模型

腾讯混元大模型

灵医Bot：百度旗下医疗健康AI大模型

加入收藏夹

设为首页

网址

FeedAIback

讯飞医疗大模型

SiliconCloud – 硅基流动推出的一站式大模型云服务平台

开拍

AI Girlfriend

智谱清言ChatGLM

SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM是什么？

SmolLM的测试结果

如何使用SmolLM？

数据统计

相关导航

悟道

CodeShell-北京大学开源的代码大模型

OpenBMB

知乎-知海图大模型

Coze

Segment Anything：首个图像分割基础模型

腾讯混元大模型

灵医Bot：百度旗下医疗健康AI大模型

加入收藏夹

设为首页

网址

FeedAIback

讯飞医疗大模型

SiliconCloud – 硅基流动推出的一站式大模型云服务平台

开拍

AI Girlfriend

智谱清言ChatGLM

标签云