Gemma-谷歌发布的最新开放模型,小尺寸可商用

5个月前发布 67 00

Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。,Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。

收录时间:
2024-09-11
Gemma-谷歌发布的最新开放模型,小尺寸可商用Gemma-谷歌发布的最新开放模型,小尺寸可商用
Gemma-谷歌发布的最新开放模型,小尺寸可商用

Gemma是什么?

Gemma是谷歌最新发布的一款轻量级开放模型,它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。Gemma是由Google DeepMind和Google其他团队合作开发的,并用拉丁语中意为“宝石”的gemma为其命名。

Gemma共有两个版本:Gemma 2B(20亿参数)和Gemma 7B(70亿参数),每种规模都提供了预训练和指令微调版本。这些模型尺寸相对较小,应用成本也更低,适合各种规模的组织(无论规模大小)进行商用和分发。未来,Gemma这个系列还会发布更大尺寸的模型。

训练数据上,Gemma主要在大量英文文本数据上进行训练的,这些数据主要来源于网络文档、数学和代码。具体来说,Gemma 2B模型训练了大约2万亿(2T)个token,而Gemma 7B模型则训练了大约6万亿(6T)个token。

不过,Gemma没有接受过处理图像或视频等非文本数据的训练,也没有专门针对多语言任务进行优化。

为了方便开发者,谷歌不仅开源模型,还附带开发套装,包括全新的“负责任生成式AI工具包”,为基于Gemma开发安全的人工智能应用程序提供了必要指导和工具,以及跨主流框架(如JAX、PyTorch及原生Keras 3.0下的TensorFlow)的推理和监督微调(SFT)工具链。

各种设备也已经适配好。谷歌已经基于英伟达的GPUs和谷歌云TPUs等多个AI硬件平台,对Gemma进行优化,让模型可以直接在笔记本电脑或台式机上运行。

Gemma官网入口:https://ai.google.dev/gemma

Gemma-谷歌发布的最新开放模型,小尺寸可商用

Gemma的主要特点

以下是Gemma模型的一些主要特点:

  1. 模型大小:Gemma提供了两种大小的模型权重,分别是Gemma 2B和Gemma 7B,每种大小都有预训练和指令调整(instruction-tuned)的变体。
  2. 负责任的生成AI工具包:Google发布了一个新的工具包,提供指导和必要工具,帮助开发者使用Gemma创建更安全的AI应用。
  3. 工具链支持:Gemma模型支持在所有主要框架(JAX、PyTorch和TensorFlow通过原生Keras 3.0)上进行推理和监督式微调(SFT)。
  4. 易用性:提供了预制的Colab和Kaggle笔记本,以及与Hugging Face MaxText、NVIDIA NeMo TensorRT-LLM等流行工具的集成,使得开始使用Gemma变得容易。预训练和指令调整的Gemma模型可以在笔记本电脑、工作站或Google Cloud上运行,并且可以轻松部署在Vertex AI和Google Kubernetes Engine(GKE)上。
  5. 性能优化:Gemma模型在多个AI硬件平台上进行了优化,包括NVIDIA GPU和Google Cloud TPUs,确保了行业领先的性能。
  6. 负责任的设计:Gemma在设计时遵循了Google的AI原则。为了确保预训练模型的安全和可靠性,Google使用了自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外,通过人类反馈的强化学习(RLHF)对指令调整模型进行了广泛的微调,以确保模型行为的负责任性。Google还进行了包括手动红队测试、自动化对抗性测试和模型能力评估在内的严格评估。
  7. 跨框架、工具和硬件优化:Gemma模型可以在多种工具和系统上进行微调,以适应特定应用需求,如摘要或检索增强生成(RAG)。Gemma支持多种工具和系统,包括跨设备兼容性和与NVIDIA GPU的优化。
  8. 免费资源:为了支持开发者和研究人员,Google提供了Kaggle的免费访问、Colab笔记本的免费层级,以及首次使用Google Cloud的300美元信用额度。研究人员还可以申请高达50万美元的Google Cloud信用额度以加速他们的项目。

Google期待随着Gemma模型家族的扩展,将引入更多针对不同应用的新变体,并在接下来的几周内提供连接、学习和与Gemma共同构建的活动和机会。

Gemma的评测结果

在Gemma的技术报告中,谷歌放出了大量训练细节,其中就包括Llama-2的测试对比结果图,大多数指标都超过了Llama-2。

Gemma-谷歌发布的最新开放模型,小尺寸可商用 Gemma与Llama-2的测试对比结果图

在测试中,Gemma模型在18个文本任务中的11个上超越了同样规模的开放模型。它在问答、常识推理、数学和科学以及编程等领域表现出色。Gemma 7B模型在70亿参数规模的语言模型中表现最佳,甚至超过了一些参数量更大的模型。

Gemma-谷歌发布的最新开放模型,小尺寸可商用 Gemma模型在18个文本任务中的评测结果

而最近风头正盛,号称要做“欧洲版OpenAI”的MistralAI是开源领域的新势力,旗下的Mistral 7B被誉为是“最强7B模型”。

在问答、推理、数学/科学、代码场景里,Gemma的表现同样领先。

Gemma-谷歌发布的最新开放模型,小尺寸可商用 Gemma与Mistral 7B的评测结果

如何使用Gemma?

1、个人用户体验地址:https://huggingface.co/chat,模型里选择Gemma即可体验。

2、开发者使用:Gemma提供了面向开发者的快速入门指南,开发者和研究人员可以通过ai.google.dev/gemma了解更多关于Gemma的信息,并获取快速入门指南。

Gemma-谷歌发布的最新开放模型,小尺寸可商用

数据统计

数据评估

Gemma-谷歌发布的最新开放模型,小尺寸可商用浏览人数已经达到67,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:Gemma-谷歌发布的最新开放模型,小尺寸可商用的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找Gemma-谷歌发布的最新开放模型,小尺寸可商用的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于Gemma-谷歌发布的最新开放模型,小尺寸可商用特别声明

本站AI导航站提供的Gemma-谷歌发布的最新开放模型,小尺寸可商用都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI导航站实际控制,在2024年9月11日 上午11:06收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI导航站不承担任何责任。

相关导航

LaVie:上海人工智能实验室开源的视频生成模型

LaVie:上海人工智能实验室开源的视频生成模型

LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。,LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部…
Yi大模型-零一万物发布的开源大模型

Yi大模型-零一万物发布的开源大模型

Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。,Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。
昆仑万维-天工AI大模型

昆仑万维-天工AI大模型

天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。,天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
携程问道:首个旅游行业垂直AI大模型

携程问道:首个旅游行业垂直AI大模型

7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户提出想法,问道可从地域、主题特色等维度,推荐旅行目的地、酒店、景点、行程规划和实时优惠的选项; 在用户需求相对明确时,提供智能查询结果,用户可用文字和语音以自然语言长句的形式进行复杂条件的机票和酒店产品的查询。 携程集团董事局主席梁建章表示,“希望用户从包括‘携程问道’在内的产品获得旅游行业‘可靠的内容,放心的推荐’。,7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户…
SAM 2-Meta推出的图像和视频对象分割模型

SAM 2-Meta推出的图像和视频对象分割模型

SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象进行分割,适用于各种视觉领域。这一模型在原有的Segment Anything Model (SAM)基础上进行了扩展和改进,支持更广泛的应用场景。,SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象…