热门

Llama 3.1：Meta最新推出的开源大语言模型

AI训练模型7个月前发布 admin

Llama 3.1是什么？

Llama 3.1是Meta最新推出的开源大语言模型，有三种规格：8B（80亿）、70B（700亿）和405B（4050）亿参数，支持八种语言，具备128K扩展上下文长度。它提供卓越的通用知识、数学计算、多语言翻译和工具使用能力，开放下载并允许开发者定制和微调。Llama 3.1还包括增强的安全工具和广泛的合作伙伴支持，适用于多种AI应用开发。

Llama 3.1：Meta最新推出的开源大语言模型

Llama 3.1的主要特性

参数规模：Llama 3.1包含三种规格：80亿、700亿和4050亿参数，4050亿参数是Llama系列中最强大的模型，具备顶尖的通用知识、数学计算、多语言翻译和工具使用能力，提升了模型的细致性和复杂任务处理能力。
上下文长度：128K上下文长度，能够处理更长的文本输入，适用于长文本摘要、复杂对话和多步骤问题解决，提升了模型在长文本处理中的表现。
多语言支持：支持包括英语、中文、西班牙语、法语、德语、日语、韩语和阿拉伯语在内的八种语言，增强了模型的全球适用性，适用于多语言翻译和跨语言处理。
模型下载和定制：Llama 3.1模型可以从Meta官方网站和Hugging Face平台公开下载，允许开发者进行自定义训练和微调，适应各种应用场景，推动AI技术的普及和创新。
高性能和高效训练：在超过15万亿个标记上进行训练，并使用超过16,000个H100 GPU进行优化，确保模型的高性能和高效能。预训练数据日期截止到2023年12月。
量化技术：为了应对405B模型的运行需求，Meta把模型数据从16位（BF16）量化减少到8位（FP8），大幅降低了计算资源的需求，令模型能够在单一服务器节点上运行。
增强的安全和防护措施：提供了 Llama Guard 3 和 Prompt Guard 等安全工具，以及 Llama Stack API 的评论请求，旨在促进第三方项目更容易地利用 Llama 模型。
广泛的生态系统支持：Meta 改进了模型的训练和微调流程，以及模型的推理和部署方式，以便更广泛地支持开发者和平台提供商，包括AWS、NVIDIA、Google Cloud等25个合作伙伴提供的即用服务，确保无缝的开发和部署体验。

Llama 3.1的性能评测

Meta 称 4050 亿参数的 Llama 3.1-405B 在常识、可引导性、数学、工具使用和多语言翻译等一系列任务中，可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。

Llama 3.1：Meta最新推出的开源大语言模型

此外，8B 与 70B 参数的 Llama 3.1 模型与其他参数量相似的闭源和开源模型相比，也同样具有竞争力。

Llama 3.1：Meta最新推出的开源大语言模型

如何使用Llama 3.1？

Llama 3.1 现已于 Meta 官网和 Hugging Face 开放下载，包括 AWS、英伟达、戴尔、Azure 和 Google Cloud 在内的超过 25 个合作伙伴也已经准备就绪。

模型官网：https://llama.meta.com/
模型下载：https://llama.meta.com/llama-downloads
博客文章：https://ai.meta.com/blog/meta-llama-3-1/
HuggingFace地址：https://huggingface.co/collections/meta-llama/llama-31-669fc079a0c406a149a5738f
GitHub项目：https://github.com/meta-llama/llama-models

Llama 3.1：Meta最新推出的开源大语言模型

25 个合作伙伴

AI训练模型 # AI大模型 # AI开源模型 # AI模型 # llama # Meta

© 版权声明

文章版权归作者所有，未经允许请勿转载。

Warning: Trying to access array offset on value of type bool in /www/wwwroot/ainvp.com/wp-content/themes/onenav/inc/clipimage.php on line 34

相关文章

Audiobox-Meta推出的新一代音频生成模型

Audiobox-Meta推出的新一代音频生成模型

ChatGPT # Audiobox # Meta # 音频生成模型

5个月前

30

火山方舟-一站式大模型服务平台

火山方舟-一站式大模型服务平台

AI训练模型 # AI大模型 # 字节跳动 # 火山引擎

7个月前

40

Code Llama是什么？ Code Llama是一种先进的大型语言模型（LLM），由Meta AI 推出，专门用于编码。它能够从代码和自然语言提示生成代码和关于代码的自然语言。Code Llama是基于Llama 2构建的，并提供三个模型：基础代码模型Code Llama、专门针对Python的Codel Llama，以及针对理解自然语言指令进行微调的Code Llama – Instruct。Code Llama在代码任务方面超越了现有的先进公开LLM，并且可免费用于研究和商业用途。 Code Llama 是 Llama 2 的代码专用版本，是通过在其特定于代码的数据集上进一步训练 Llama 2 来创建的，从同一数据集中采样更多数据的时间更长。从本质上讲，Code Llama 具有增强的编码功能，建立在 Llama 2 之上。它可以根据代码和自然语言提示生成代码和有关代码的自然语言（例如，“给我写一个输出斐波那契序列的函数。”）它还可用于代码完成和调试。它支持当今使用的许多最流行的语言，包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。详细介绍：ai.meta.com Code Llama GitHub：https://github.com/facebookresearch/codellama 下载 Code Llama 模型：https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 阅读研究论文：https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/ Code Llama可以做什么？生成代码: Code Llama可以使用文本提示生成代码，支持包括Python、C++、Java、PHP、Typescript（Javascript）、C#和Bash等多种流行语言。代码补全和调试: 它可以用于代码补全和调试，支持实时代码补全等低延迟任务。特殊版本: 还有针对Python代码进一步微调的Code Llama – Python，以及通过指令微调和对齐的Code Llama – Instruct，以更好地理解人们对提示的期望。如何使用Code Llama？现在，你就可以在 Perplexity 上免费体验： labs.perplexity.ai 选择模型: Code Llama提供了三种大小的模型，分别具有7B、13B和34B参数，以满足不同的服务和延迟要求。代码生成: 可以通过自然语言提示（例如“为我编写一个输出斐波那契序列的函数。”）生成代码。代码补全: 具有填充中间（FIM）功能的7B和13B基础和指导模型可以插入现有代码中的代码，支持代码补全等任务。遵守许可: 在使用Code Llama模型时，用户必须遵守许可和可接受使用政策。 Code Llama的目标是使开发人员的工作流程更高效，使他们能够专注于工作的最人性化方面，而不是重复任务。通过开放的方法，Code Llama有助于促进新技术的发展，改善人们的生活。

Code Llama是什么？ Code Llama是一种先进的大型语言模型（LLM），由Meta AI 推出，专门用于编码。它能够从代码和自然语言提示生成代码和关于代码的自然语言。Code Llama是基于Llama 2构建的，并提供三个模型：基础代码模型Code Llama、专门针对Python的Codel Llama，以及针对理解自然语言指令进行微调的Code Llama – Instruct。Code Llama在代码任务方面超越了现有的先进公开LLM，并且可免费用于研究和商业用途。 Code Llama 是 Llama 2 的代码专用版本，是通过在其特定于代码的数据集上进一步训练 Llama 2 来创建的，从同一数据集中采样更多数据的时间更长。从本质上讲，Code Llama 具有增强的编码功能，建立在 Llama 2 之上。它可以根据代码和自然语言提示生成代码和有关代码的自然语言（例如，“给我写一个输出斐波那契序列的函数。”）它还可用于代码完成和调试。它支持当今使用的许多最流行的语言，包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。详细介绍：ai.meta.com Code Llama GitHub：https://github.com/facebookresearch/codellama 下载 Code Llama 模型：https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 阅读研究论文：https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/ Code Llama可以做什么？生成代码: Code Llama可以使用文本提示生成代码，支持包括Python、C++、Java、PHP、Typescript（Javascript）、C#和Bash等多种流行语言。代码补全和调试: 它可以用于代码补全和调试，支持实时代码补全等低延迟任务。特殊版本: 还有针对Python代码进一步微调的Code Llama – Python，以及通过指令微调和对齐的Code Llama – Instruct，以更好地理解人们对提示的期望。如何使用Code Llama？现在，你就可以在 Perplexity 上免费体验： labs.perplexity.ai 选择模型: Code Llama提供了三种大小的模型，分别具有7B、13B和34B参数，以满足不同的服务和延迟要求。代码生成: 可以通过自然语言提示（例如“为我编写一个输出斐波那契序列的函数。”）生成代码。代码补全: 具有填充中间（FIM）功能的7B和13B基础和指导模型可以插入现有代码中的代码，支持代码补全等任务。遵守许可: 在使用Code Llama模型时，用户必须遵守许可和可接受使用政策。 Code Llama的目标是使开发人员的工作流程更高效，使他们能够专注于工作的最人性化方面，而不是重复任务。通过开放的方法，Code Llama有助于促进新技术的发展，改善人们的生活。

ChatGPT # AI编程 # Code Llama # Meta

8个月前

30

神农大模型-中国农业大学发布的农业AI大模型，覆盖育种、种植农业遥感及气象等

神农大模型-中国农业大学发布的农业AI大模型，覆盖育种、种植农业遥感及气象等

AI训练模型 # AI大模型 # AI训练模型 # 农业大模型

7个月前

20