澜舟科技-孟子大模型

4周前更新 61 0 0

孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。,孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。

收录时间:
2024-09-11
澜舟科技-孟子大模型澜舟科技-孟子大模型
澜舟科技-孟子大模型

孟子大模型是什么?

孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。

官网:https://www.langboat.com/portal/mengzi-model

孟子大模型可以做什么?

孟子预训练模型提供了一系列产品,包括孟子生成式大模型(孟子 GPT)、Mengzi-BERT-base、Mengzi-BERT-base-fin、Mengzi-T5-base、Mengzi-T5-base-MT、Mengzi-GPT-neo-base、Guohua Diffusion、句向量计算等,适用于各种自然语言处理任务,如文本分类、实体识别、关系抽取、阅读理解、文案生成、新闻生成、文本续写、小说生成等。

孟子大模型优势

一个模型,解决多种应用场景

  1. 支持多种模型架构:如 GPT、BERT、T5 等。
  2. 轻量模型性能强化:通过多预训练任务融合、SMART 对抗训练、知识蒸馏等方式,提升模型性能。
  3. 基于知识图谱增强:通过基于实体抽取的增强、知识图谱增强(isa 关系)、知识图谱转文字等方式,增强模型的知识理解能力。
  4. 基于语言学知识增强:通过成分句法融合增强的 Mask 机制、语义角色 Embedding 融合增强、依存关系的注意力权重约束剪枝等方式,增强模型的语言理解能力。
  5. 小样本/零样本学习:通过 Prompts 模板构造、多任务学习技术等方式,提升模型的学习能力。
  6. 基于检索增强:通过知识解耦、可解释性强、外部知识组件实时更新等方式,提升模型的检索能力。

数据统计

相关导航

Monkey:华中科技大学开源的多模态大模型

Monkey:华中科技大学开源的多模态大模型

Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从0预训练,大大提高了研发效率。,Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器…
Qwen2-Math:阿里巴巴最新开源的数学推理大模型

Qwen2-Math:阿里巴巴最新开源的数学推理大模型

Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)、7B(79亿)和72B(720亿)三种参数规模,以适应不同的应用需求。,Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)…
EMO-阿里巴巴发布的AI肖像视频生成框架

EMO-阿里巴巴发布的AI肖像视频生成框架

EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的动态表现,为内容创作和虚拟角色动画制作提供了新工具。,EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的…