CodeShell-北京大学开源的代码大模型 CodeShell是北京大学知识计算实验室联合四川天府银行AI团队研发的多语言代码大模型基座。CodeShell具有70亿参数,在五千亿Tokens进行了训练,上下文窗口长度为8192。在权威的代码评估Benchmark(HumanEval与MBPP)上,CodeShell取得同等规模最好的性能。 08500 AI训练模型# AI大模型# chat# CodeShell
LaVie:上海人工智能实验室开源的视频生成模型 LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。,LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部… 7750 AI训练模型# LaVie# 上海人工智能实验室# 视频生成器
MusicGen-简单可控的音乐生成模型 MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据文本输入生成新的音乐片段,MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据文本输入生成新的音乐片段 1730 AI训练模型# AI 音乐生成# Meta# MusicGen
GPT-4 GPT-4(Generative Pre-trained Transformer)是 OpenAI 开发的自然语言处理模型 GPT 家族中的第四个版本,该模型依靠强大的神经网络来理解和生成类似人类的语言。 1580 AI训练模型# AI训练模型
360智脑 360智脑是一个由 360 公司开发的 AI 平台,旨在探索全新的人机协作模式,激活用户的创造力和想象力。它提供了一系列的 AI 工具和服务,包括 API 开放平台、360鸿图、360AI搜索、360AI浏览器、360智脑桌面版和企业数字员工等。,360智脑是一个由 360 公司开发的 AI 平台,旨在探索全新的人机协作模式,激活用户的创造力和想象力。它提供了一系列的 AI 工具和服务,包括 API 开放平台、360鸿图、360AI搜索、360… 1210 AI训练模型# 360AI搜索# 360AI浏览器# 360智脑
Gemma-谷歌发布的最新开放模型,小尺寸可商用 Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。,Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。 1160 AI训练模型# Gemma# 开源模型# 谷歌
AnimateDiff-Lightning:字节发布的快速生成视频的AI模型 字节跳动发布的高速视频生成模型,只需要 4-8 步推理就可以生成质量非常不错的视频。,字节跳动发布的高速视频生成模型,只需要 4-8 步推理就可以生成质量非常不错的视频。 1100 AI训练模型# AnimateDiff# 字节跳动# 视频生成
Open-Sora: Colossal-AI开源的类Sora架构视频生成模型 Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。,Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。 1060 AI训练模型# AI视频生成# Open-Sora# Sora
金蝶云·苍穹GPT 金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排、知识智能引擎、个性化扩展、安全可信任等特点。,金蝶云·苍穹GPT是由国内ERP龙头金蝶在2023全球创见者大会上发布的企业级大模型平台。它被定位为最懂管理的企业级大模型平台,也被称作金蝶云的智能新引擎。金蝶云·苍穹GPT拥有多模型能力、多任务编排… 990 AI训练模型# AI大模型# 金蝶云
SiliconCloud – 硅基流动推出的一站式大模型云服务平台 领先的 AI Infra 平台,助力开发者实现 Token 自由。,领先的 AI Infra 平台,助力开发者实现 Token 自由。 980 AI训练模型# AI 模型# 硅基流动
DeepSeek-V2:深度求索发布的第二代开源MoE模型 DeepSeek-V2 基于 2 千亿 MoE 模型底座,领先性能,超低价格,越级场景体验,已在对话官网和API全面上线。,DeepSeek-V2 基于 2 千亿 MoE 模型底座,领先性能,超低价格,越级场景体验,已在对话官网和API全面上线。 980 AI训练模型# DeepSeek# 开源模型
灵医Bot:百度旗下医疗健康AI大模型 百度旗下“灵医智惠” 是百度推出的智慧医疗品牌,其核心产品为 “灵医Bot”,一个医疗健康大模型。,百度旗下“灵医智惠” 是百度推出的智慧医疗品牌,其核心产品为 “灵医Bot”,一个医疗健康大模型。 940 AI训练模型# AI医疗# 医疗大模型# 灵医智惠
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能 GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-3.5 Turbo 便宜 60% 以上。目前支持文本和视觉,未来将支持更多形式。,GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-… 930 AI训练模型# ChatGPT# OpenAI
Claude 3-Anthropic公司最新推出的AI大模型 Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。每个模型都提供了不同的智能水平、速度和成本效益,以适应不同的应用需求。,Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 So… 930 AI训练模型# Claude# Claude 3
腾讯混元大模型 腾讯混元大模型是由腾讯自主研发的大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。 920 AI训练模型# AI训练模型
MiniMax-新一代中文大语言模型 MiniMax 最新一代的中文大语言模型,帮助人类高效写作、激发创意、获取知识、做出决策,MiniMax 最新一代的中文大语言模型,帮助人类高效写作、激发创意、获取知识、做出决策 920 AI训练模型# MiniMax# MiniMax大模型# 人工智能
Yi大模型-零一万物发布的开源大模型 Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。,Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。 910 AI训练模型# Yi大模型# 开源大模型# 李开复
CodeGemma-Google推出的开源代码大模型 CodeGemma是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。,CodeGemma是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。 910 AI训练模型# 代码模型# 开源模型
EMO-阿里巴巴发布的AI肖像视频生成框架 EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的动态表现,为内容创作和虚拟角色动画制作提供了新工具。,EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的… 910 AI训练模型# AI生成视频# AI视频生成# EMO
元象大模型 元象大模型是元象从头训练、全链路自主研发的高性能通用大模型系列,具备优秀的中文创作、逻辑推理和任务执行能力。,元象大模型是元象从头训练、全链路自主研发的高性能通用大模型系列,具备优秀的中文创作、逻辑推理和任务执行能力。 910 AI训练模型# AI大模型# XVERSE# 元象大模型
GPT-4-OpenAI旗下AI大模型 GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。,GPT-4是OpenAI的大型语言模型的最新版本。它在各种各样的互联网文本上进行了训练,但也从其他各种来源学习。因此,它能够以对话的方式生成富有创造性、连贯性和与上下文相关的句子。 880 AI训练模型# AI大模型# GPT-4
澜舟科技-孟子大模型 孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。,孟子预训练模型是基于团队自研的大规模预训练语言模型。可处理多语言、多模态数据,同时支持多种理解和生成任务,能快速满足不同领域、不同应用场景的需求。 880 AI训练模型# AI大模型# 孟子大模型# 澜舟科技
Qwen2-Math:阿里巴巴最新开源的数学推理大模型 Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)、7B(79亿)和72B(720亿)三种参数规模,以适应不同的应用需求。,Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)… 880 AI训练模型# AI模型# 数学大模型
天擎-美亚柏科旗下公共安全大模型 天擎是美亚柏科发布的国内首个公共安全大模型。它在2023年的美亚柏科“智会”生态合作大会上正式发布。这个大模型拥有丰富的公共安全行业知识,具备强大的警务意图识别、警务情报分析、案情推理等业务理解和推理能力。,天擎是美亚柏科发布的国内首个公共安全大模型。它在2023年的美亚柏科“智会”生态合作大会上正式发布。这个大模型拥有丰富的公共安全行业知识,具备强大的警务意图识别、警务情报分析、案情推理等业务理解和推理… 880 AI训练模型# 天擎大模型# 美亚柏科
阅文妙笔大模型:国内首个网文大模型 在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能”。,在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能… 870 AI训练模型# AI大模型# 阅文
新壹视频大模型 新壹视频大模型是国内首个聚焦视频AIGC领域的语言大模型。它依托自身的AI创新技术和大数据资源沉淀,结合对行业的深度理解和认知,更能贴合视频场景,输出文本摘要、语义理解等能力。,新壹视频大模型是国内首个聚焦视频AIGC领域的语言大模型。它依托自身的AI创新技术和大数据资源沉淀,结合对行业的深度理解和认知,更能贴合视频场景,输出文本摘要、语义理解等能力。 860 AI训练模型# 新壹视频大模型