中科院自动化研究所-紫东太初大模型

12个月前发布 92 0 0

业界首个三模态千亿参数大模型,支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。,业界首个三模态千亿参数大模型,支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。

收录时间:
2024-09-11
中科院自动化研究所-紫东太初大模型中科院自动化研究所-紫东太初大模型

中科院自动化研究所-紫东太初大模型

紫东太初大模型

“紫东太初”跨模态通用人工智能平台是由中国科学院自动化研究所研发的以多模态大模型为核心、基于全栈国产化基础软硬件平台,可支撑全场景AI应用。

依托面向超大规模的高效分布式训练框架,自动化所构建了具有业界领先性能的中文预训练模型、语音预训练模型、视觉预训练模型,并开拓性地通过跨模态语义关联实现了视觉-文本-语音三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核心能力。

可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习,助推通用人工智能时代加速到来。

“紫东太初”兼具跨模态理解和生成能力,具有了在无监督情况下多任务联合学习、并快速迁移到不同领域数据的强大能力。对更广泛、更多样的下游任务提供模型基础支撑,达成AI在如视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。

在线体验:https://xihe.mindspore.cn/modelzoo/taichu

了解更多:https://gitee.com/mindspore/zidongtaichu

紫东太初特色

  • 全球首个多模态图文音预训练模型
  • 多层次多任务自监督学习
  • 弱关联多模态数据语义统一表达
  • 兼顾任务感知和推理增强的中文预训练模型
  • 多粒度学习与注意力指导的视觉预训练模型
  • 基于自监督预训练的多任务语音建模技术

中文预训练模型

文本预训练模型使用条件语言模型作为自监督目标进行训练,和GPT一样,模型根据上文来预测当前词汇,最终训练得到的模型可以生成流畅的中文表达。

本次开源的中文文本预训练模型由40层Transformer组成,隐层维度2560,包含32个注意力头,共32亿参数。训练语料丰富多样,包括新闻、百科、散文等,文本生成能力强大。

中文预训练模型基础上还可以进行微调操作,充分利用少量有监督数据增强模型在下游任务上的表现,如文本分类,对话生成、古诗创作等;除此之外,中文预训练模型还能够实现简单的少样本学习,如下图所示,输入已知的部分样例,模型能够捕捉类似的规律进行文本生成。

数据统计

相关导航

Monkey:华中科技大学开源的多模态大模型

Monkey:华中科技大学开源的多模态大模型

Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从0预训练,大大提高了研发效率。,Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器…
Gemini-谷歌发布的多模态AI大模型

Gemini-谷歌发布的多模态AI大模型

AIHub 12 月 6 日消息,谷歌宣布推出其认为规模最大、功能最强大的人工智能多模态AI模型 Gemini。意味着它可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。,AIHub 12 月 6 日消息,谷歌宣布推出其认为规模最大、功能最强大的人工智能多模态AI模型 Gemini。意味着它可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。
Claude 3-Anthropic公司最新推出的AI大模型

Claude 3-Anthropic公司最新推出的AI大模型

Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。每个模型都提供了不同的智能水平、速度和成本效益,以适应不同的应用需求。,Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 So…
Open-Sora: Colossal-AI开源的类Sora架构视频生成模型

Open-Sora: Colossal-AI开源的类Sora架构视频生成模型

Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。,Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。