澜舟科技-孟子大模型

1年前更新 271 0 0

孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。,孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。

收录时间:
2024-09-11
澜舟科技-孟子大模型澜舟科技-孟子大模型
澜舟科技-孟子大模型

孟子大模型是什么?

孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。

官网:https://www.langboat.com/portal/mengzi-model

孟子大模型可以做什么?

孟子预训练模型提供了一系列产品,包括孟子生成式大模型(孟子 GPT)、Mengzi-BERT-base、Mengzi-BERT-base-fin、Mengzi-T5-base、Mengzi-T5-base-MT、Mengzi-GPT-neo-base、Guohua Diffusion、句向量计算等,适用于各种自然语言处理任务,如文本分类、实体识别、关系抽取、阅读理解、文案生成、新闻生成、文本续写、小说生成等。

孟子大模型优势

一个模型,解决多种应用场景

  1. 支持多种模型架构:如 GPT、BERT、T5 等。
  2. 轻量模型性能强化:通过多预训练任务融合、SMART 对抗训练、知识蒸馏等方式,提升模型性能。
  3. 基于知识图谱增强:通过基于实体抽取的增强、知识图谱增强(isa 关系)、知识图谱转文字等方式,增强模型的知识理解能力。
  4. 基于语言学知识增强:通过成分句法融合增强的 Mask 机制、语义角色 Embedding 融合增强、依存关系的注意力权重约束剪枝等方式,增强模型的语言理解能力。
  5. 小样本/零样本学习:通过 Prompts 模板构造、多任务学习技术等方式,提升模型的学习能力。
  6. 基于检索增强:通过知识解耦、可解释性强、外部知识组件实时更新等方式,提升模型的检索能力。

数据统计

相关导航

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-3.5 Turbo 便宜 60% 以上。目前支持文本和视觉,未来将支持更多形式。,GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-…
阅文妙笔大模型:国内首个网文大模型

阅文妙笔大模型:国内首个网文大模型

在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能”。,在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能…
Ferret-UI:苹果公司推出的多模态AI模型

Ferret-UI:苹果公司推出的多模态AI模型

Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并执行任务,聚焦于移动端、关注用户交互。,Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并…
Octopus V2-斯坦福推出的可在设备上运行的大模型

Octopus V2-斯坦福推出的可在设备上运行的大模型

Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Octopus v2的速度快了36倍。,Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Oc…