PaLM 2

PaLM(PathwaysLanguageModel)是一种大型语言模型,即LLM,类似于OpenAI创建的GPT系列或Meta的LLaMA系列模型。谷歌于2022年4月首次宣布推出PaLM,超过了5400亿个训练参数。与其他...

标签:

PaLM 2

更新时间:2023/05/25

访问官网
PaLM 2

PaLM(PathwaysLanguageModel)是一种大型语言模型,即LLM,类似于OpenAI创建的GPT系列或Meta的LLaMA系列模型。谷歌于2022年4月首次宣布推出PaLM,超过了5400亿个训练参数。与其他LLM一样,PaLM是一个灵活的系统,可以执行各种文本生成和编辑任务。例如,你可以将PaLM训练成像ChatGPT这样的对话式聊天机器人,或者你可以将它用于诸如总结文本甚至编写代码等任务。(这类似于谷歌今天也为其Workspace应用程序(如GoogleDocs和Gmail)宣布的功能。)

在2023谷歌I/O大会上,谷歌CEO皮查伊宣布推出对标GPT-4的大模型PaLM2,并正式发布预览版本,改进了数学、代码、推理、多语言翻译和自然语言生成能力。

谷歌将为PaLM2提供四种不同大小的版本,从最小到最大:Gecko、Otter、Bison和Unicorn。Gecko非常轻巧,可以在移动设备上工作,并且速度足够快,即使在离线时也能在设备上运行出色的交互式应用程序。这种多功能性意味着可以对PaLM2进行微调,以更多方式支持整个类别的产品,从而帮助更多人。

PaLM2的特性

PaLM2是谷歌的下一代大语言模型,具有改进的多语言、推理和编码能力。

  • 多语言性:PaLM2在多语言文本方面接受了更多的训练,涵盖100多种语言。这显著提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力,这是一个很难解决的问题。PaLM2还通过了“精通”级别的高级语言能力考试。
  • 推理:PaLM2的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。
  • 编程:PaLM2在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长Python和JavaScript等流行的编程语言,但也可以生成Prolog、Fortran和Verilog等语言的专用代码。

数据统计

相关导航