CodeShell-北京大学开源的代码大模型 CodeShell是北京大学知识计算实验室联合四川天府银行AI团队研发的多语言代码大模型基座。CodeShell具有70亿参数,在五千亿Tokens进行了训练,上下文窗口长度为8192。在权威的代码评估Benchmark(HumanEval与MBPP)上,CodeShell取得同等规模最好的性能。 01,1700 AI训练模型# AI大模型# chat# CodeShell
LaVie:上海人工智能实验室开源的视频生成模型 LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。,LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部… 1,1270 AI训练模型# LaVie# 上海人工智能实验室# 视频生成器
SiliconCloud – 硅基流动推出的一站式大模型云服务平台 领先的 AI Infra 平台,助力开发者实现 Token 自由。,领先的 AI Infra 平台,助力开发者实现 Token 自由。 6610 AI训练模型# AI 模型# 硅基流动
Coze Coze是由字节跳动推出的一个AI聊天机器人和应用程序编辑开发平台,可以理解为字节跳动版的GPTs。无论用户是否有编程经验,都可以通过该平台快速创建各种类型的聊天机器人、智能体、AI应用和插件,并将其部署在社交平台和即时聊天应用程序中,如Discord、WhatsApp、Twitter。 3280 AI训练模型# AI训练模型
GPT-4 GPT-4(Generative Pre-trained Transformer)是 OpenAI 开发的自然语言处理模型 GPT 家族中的第四个版本,该模型依靠强大的神经网络来理解和生成类似人类的语言。 2850 AI训练模型# AI训练模型
MusicGen-简单可控的音乐生成模型 MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据文本输入生成新的音乐片段,MusicGen 是一个由Meta发布的开源 AI 音乐生成模型,可以根据文本输入生成新的音乐片段 2770 AI训练模型# AI 音乐生成# Meta# MusicGen
腾讯混元大模型 腾讯混元大模型是由腾讯自主研发的大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。 2070 AI训练模型# AI训练模型
Gemma-谷歌发布的最新开放模型,小尺寸可商用 Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。,Gemma是谷歌最新发布的一款开放模型,属于轻量级开放模型系列。它采用了与创建Gemini模型相同的研究和技术,是一个小尺寸的大语言模型。 1750 AI训练模型# Gemma# 开源模型# 谷歌
Claude 3-Anthropic公司最新推出的AI大模型 Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。每个模型都提供了不同的智能水平、速度和成本效益,以适应不同的应用需求。,Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 So… 1630 AI训练模型# Claude# Claude 3
阅文妙笔大模型:国内首个网文大模型 在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能”。,在 7 月 19 日举行的阅文创作大会上,国内首个网文大模型“阅文妙笔”正式亮相。阅文集团 CEO 兼总裁侯晓楠表示,阅文妙笔是“最懂网文”的大模型,将以 AIGC 为创作生态和 IP 生态“全面赋能… 1540 AI训练模型# AI大模型# 阅文
火山方舟 火山方舟是一个开放的大模型生态平台,它提供了一系列功能,包括模型广场、模型体验、模型训练推理和模型应用。这个平台旨在加速大模型能力渗透到千行百业,助力模型提供方和使用... 01490 AIGC开发平台AI训练模型# AI训练模型
Gradio Gradio是一个开源的Python库,用于构建演示机器学习或数据科学,以及web应用程序。用户可以使用Gradio基于自己的机器学习模型或数据科学工作流快速创建一个漂亮的用户界面,让用户可以尝试拖放他们自己的图像、粘贴文本、录制他们自己的声音,并通过浏览器与您的演示程序进行交互。 1460 AI训练模型# AI训练模型
知乎-知海图大模型 知海图AI,是知乎和面壁科技合作发布的中文大模型,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。,知海图AI,是知乎和面壁科技合作发布的中文大模型,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。 1430 AI训练模型# 知乎# 知海图AI
DALL·E 3 DALL·E 3是OpenAI的文本到图像合成模型的最新版本,旨在使用文本描述生成图像,相比此前的版本,DALL·E 3进一步降低了提示词门槛,提高语义理解和细节优化。原生构建在ChatGPT上,可供所有ChatGPT Plus和企业用户使用,并在2023年秋季通过API和Labs提供。 1420 AI训练模型# AI训练模型
CodeGemma-Google推出的开源代码大模型 CodeGemma是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。,CodeGemma是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。 1420 AI训练模型# 代码模型# 开源模型
灵医Bot:百度旗下医疗健康AI大模型 百度旗下“灵医智惠” 是百度推出的智慧医疗品牌,其核心产品为 “灵医Bot”,一个医疗健康大模型。,百度旗下“灵医智惠” 是百度推出的智慧医疗品牌,其核心产品为 “灵医Bot”,一个医疗健康大模型。 1400 AI训练模型# AI医疗# 医疗大模型# 灵医智惠
DeepSeek-V2:深度求索发布的第二代开源MoE模型 DeepSeek-V2 基于 2 千亿 MoE 模型底座,领先性能,超低价格,越级场景体验,已在对话官网和API全面上线。,DeepSeek-V2 基于 2 千亿 MoE 模型底座,领先性能,超低价格,越级场景体验,已在对话官网和API全面上线。 1400 AI训练模型# DeepSeek# 开源模型
Mistral 7B – Mistral AI 发布的开源大语言模型 Mistral 7B 是法国AI初创公司 Mistral AI 发布的一款先进的 73亿参数语言模型,性能超越了 Llama 2 13B 和 Llama 1 34B。,Mistral 7B 是法国AI初创公司 Mistral AI 发布的一款先进的 73亿参数语言模型,性能超越了 Llama 2 13B 和 Llama 1 34B。 1390 AI训练模型# Mistral 7B# Mistral AI# 大语言模型
Open-Sora: Colossal-AI开源的类Sora架构视频生成模型 Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。,Open-Sora是一个开源Sora复现方案,旨在帮助用户构建类似于OpenAI Sora的视频生成模型。它提供了一个完整的开发流程,包括数据处理、模型训练和部署,支持动态分辨率和多种模型结构。 1390 AI训练模型# AI视频生成# Open-Sora# Sora
AnimateDiff-Lightning:字节发布的快速生成视频的AI模型 字节跳动发布的高速视频生成模型,只需要 4-8 步推理就可以生成质量非常不错的视频。,字节跳动发布的高速视频生成模型,只需要 4-8 步推理就可以生成质量非常不错的视频。 1390 AI训练模型# AnimateDiff# 字节跳动# 视频生成
Meta-ImageBind开源多模态AI大模型 ImageBind能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。,ImageBind能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。 1380 AI训练模型# ImageBind# 多模态大模型# 语言大模型
OpenELM-苹果发布的开源高效语言系列模型 OpenELM是Apple苹果公司发布的一系列开源语言模型,包含OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模版本(包含预训练和指令微调)。,OpenELM是Apple苹果公司发布的一系列开源语言模型,包含OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模版本(包含预训练和指令微调… 1350 AI训练模型# 苹果Apple