Llama 3.1:Meta最新推出的开源大语言模型

AI训练模型7个月前发布 admin
2 00

Llama 3.1是什么?

Llama 3.1是Meta最新推出的开源大语言模型,有三种规格:8B(80亿)、70B(700亿)和405B(4050)亿参数,支持八种语言,具备128K扩展上下文长度。它提供卓越的通用知识、数学计算、多语言翻译和工具使用能力,开放下载并允许开发者定制和微调。Llama 3.1还包括增强的安全工具和广泛的合作伙伴支持,适用于多种AI应用开发。

Llama 3.1:Meta最新推出的开源大语言模型

Llama 3.1的主要特性

  • 参数规模:Llama 3.1包含三种规格:80亿、700亿和4050亿参数,4050亿参数是Llama系列中最强大的模型,具备顶尖的通用知识、数学计算、多语言翻译和工具使用能力,提升了模型的细致性和复杂任务处理能力。
  • 上下文长度128K上下文长度,能够处理更长的文本输入,适用于长文本摘要、复杂对话和多步骤问题解决,提升了模型在长文本处理中的表现。
  • 多语言支持:支持包括英语、中文、西班牙语、法语、德语、日语、韩语和阿拉伯语在内的八种语言,增强了模型的全球适用性,适用于多语言翻译和跨语言处理。
  • 模型下载和定制:Llama 3.1模型可以从Meta官方网站和Hugging Face平台公开下载,允许开发者进行自定义训练和微调,适应各种应用场景,推动AI技术的普及和创新。
  • 高性能和高效训练:在超过15万亿个标记上进行训练,并使用超过16,000个H100 GPU进行优化,确保模型的高性能和高效能。预训练数据日期截止到2023年12月。
  • 量化技术:为了应对405B模型的运行需求,Meta把模型数据从16位(BF16)量化减少到8位(FP8),大幅降低了计算资源的需求,令模型能够在单一服务器节点上运行。
  • 增强的安全和防护措施:提供了 Llama Guard 3 和 Prompt Guard 等安全工具,以及 Llama Stack API 的评论请求,旨在促进第三方项目更容易地利用 Llama 模型。
  • 广泛的生态系统支持:Meta 改进了模型的训练和微调流程,以及模型的推理和部署方式,以便更广泛地支持开发者和平台提供商,包括AWS、NVIDIA、Google Cloud等25个合作伙伴提供的即用服务,确保无缝的开发和部署体验。

Llama 3.1的性能评测

Meta 称 4050 亿参数的 Llama 3.1-405B 在常识、可引导性、数学、工具使用和多语言翻译等一系列任务中,可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。

Llama 3.1:Meta最新推出的开源大语言模型

此外,8B 与 70B 参数的 Llama 3.1 模型与其他参数量相似的闭源和开源模型相比,也同样具有竞争力。

Llama 3.1:Meta最新推出的开源大语言模型
Llama 3.1:Meta最新推出的开源大语言模型

如何使用Llama 3.1?

Llama 3.1 现已于 Meta 官网和 Hugging Face 开放下载,包括 AWS、英伟达、戴尔、Azure 和 Google Cloud 在内的超过 25 个合作伙伴也已经准备就绪。

Llama 3.1:Meta最新推出的开源大语言模型 25 个合作伙伴
© 版权声明

Warning: Trying to access array offset on value of type bool in /www/wwwroot/ainvp.com/wp-content/themes/onenav/inc/clipimage.php on line 34

相关文章

Code Llama是什么? Code Llama是一种先进的大型语言模型(LLM),由Meta AI 推出,专门用于编码。它能够从代码和自然语言提示生成代码和关于代码的自然语言。Code Llama是基于Llama 2构建的,并提供三个模型:基础代码模型Code Llama、专门针对Python的Codel Llama,以及针对理解自然语言指令进行微调的Code Llama – Instruct。Code Llama在代码任务方面超越了现有的先进公开LLM,并且可免费用于研究和商业用途。 Code Llama 是 Llama 2 的代码专用版本,是通过在其特定于代码的数据集上进一步训练 Llama 2 来创建的,从同一数据集中采样更多数据的时间更长。从本质上讲,Code Llama 具有增强的编码功能,建立在 Llama 2 之上。它可以根据代码和自然语言提示生成代码和有关代码的自然语言(例如,“给我写一个输出斐波那契序列的函数。”)它还可用于代码完成和调试。它支持当今使用的许多最流行的语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。 详细介绍:ai.meta.com Code Llama GitHub:https://github.com/facebookresearch/codellama 下载 Code Llama 模型:https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 阅读研究论文:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/ Code Llama可以做什么? 生成代码: Code Llama可以使用文本提示生成代码,支持包括Python、C++、Java、PHP、Typescript(Javascript)、C#和Bash等多种流行语言。 代码补全和调试: 它可以用于代码补全和调试,支持实时代码补全等低延迟任务。 特殊版本: 还有针对Python代码进一步微调的Code Llama – Python,以及通过指令微调和对齐的Code Llama – Instruct,以更好地理解人们对提示的期望。 如何使用Code Llama? 现在,你就可以在 Perplexity 上免费体验 :  labs.perplexity.ai 选择模型: Code Llama提供了三种大小的模型,分别具有7B、13B和34B参数,以满足不同的服务和延迟要求。 代码生成: 可以通过自然语言提示(例如“为我编写一个输出斐波那契序列的函数。”)生成代码。 代码补全: 具有填充中间(FIM)功能的7B和13B基础和指导模型可以插入现有代码中的代码,支持代码补全等任务。 遵守许可: 在使用Code Llama模型时,用户必须遵守许可和可接受使用政策。 Code Llama的目标是使开发人员的工作流程更高效,使他们能够专注于工作的最人性化方面,而不是重复任务。通过开放的方法,Code Llama有助于促进新技术的发展,改善人们的生活。

Code Llama是什么? Code Llama是一种先进的大型语言模型(LLM),由Meta AI 推出,专门用于编码。它能够从代码和自然语言提示生成代码和关于代码的自然语言。Code Llama是基于Llama 2构建的,并提供三个模型:基础代码模型Code Llama、专门针对Python的Codel Llama,以及针对理解自然语言指令进行微调的Code Llama – Instruct。Code Llama在代码任务方面超越了现有的先进公开LLM,并且可免费用于研究和商业用途。 Code Llama 是 Llama 2 的代码专用版本,是通过在其特定于代码的数据集上进一步训练 Llama 2 来创建的,从同一数据集中采样更多数据的时间更长。从本质上讲,Code Llama 具有增强的编码功能,建立在 Llama 2 之上。它可以根据代码和自然语言提示生成代码和有关代码的自然语言(例如,“给我写一个输出斐波那契序列的函数。”)它还可用于代码完成和调试。它支持当今使用的许多最流行的语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。 详细介绍:ai.meta.com Code Llama GitHub:https://github.com/facebookresearch/codellama 下载 Code Llama 模型:https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 阅读研究论文:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/ Code Llama可以做什么? 生成代码: Code Llama可以使用文本提示生成代码,支持包括Python、C++、Java、PHP、Typescript(Javascript)、C#和Bash等多种流行语言。 代码补全和调试: 它可以用于代码补全和调试,支持实时代码补全等低延迟任务。 特殊版本: 还有针对Python代码进一步微调的Code Llama – Python,以及通过指令微调和对齐的Code Llama – Instruct,以更好地理解人们对提示的期望。 如何使用Code Llama? 现在,你就可以在 Perplexity 上免费体验 :  labs.perplexity.ai 选择模型: Code Llama提供了三种大小的模型,分别具有7B、13B和34B参数,以满足不同的服务和延迟要求。 代码生成: 可以通过自然语言提示(例如“为我编写一个输出斐波那契序列的函数。”)生成代码。 代码补全: 具有填充中间(FIM)功能的7B和13B基础和指导模型可以插入现有代码中的代码,支持代码补全等任务。 遵守许可: 在使用Code Llama模型时,用户必须遵守许可和可接受使用政策。 Code Llama的目标是使开发人员的工作流程更高效,使他们能够专注于工作的最人性化方面,而不是重复任务。通过开放的方法,Code Llama有助于促进新技术的发展,改善人们的生活。