Mistral 7B – Mistral AI 发布的开源大语言模型 Mistral 7B 是法国AI初创公司 Mistral AI 发布的一款先进的 73亿参数语言模型,性能超越了 Llama 2 13B 和 Llama 1 34B。,Mistral 7B 是法国AI初创公司 Mistral AI 发布的一款先进的 73亿参数语言模型,性能超越了 Llama 2 13B 和 Llama 1 34B。 860 AI训练模型# Mistral 7B# Mistral AI# 大语言模型
Segment Anything:首个图像分割基础模型 SAM是一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象,SAM是一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象 850 AI训练模型# meta AI# Segment Anything Model# 图像分割
Audiobox-Meta推出的新一代音频生成模型 Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。,Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。 850 AI训练模型# Audiobox# Meta# 音频生成模型
SAM 2-Meta推出的图像和视频对象分割模型 SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象进行分割,适用于各种视觉领域。这一模型在原有的Segment Anything Model (SAM)基础上进行了扩展和改进,支持更广泛的应用场景。,SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象… 850 AI训练模型# 图像分割# 视频分割
Octopus V2-斯坦福推出的可在设备上运行的大模型 Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Octopus v2的速度快了36倍。,Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Oc… 850 AI训练模型# AI代理# AI大模型
SmolLM-HuggingFace发布的高性能小型语言模型 SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多种基准测试中表现不错, 适合跑在手机这种终端设备上。,SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosm… 840 AI训练模型# AI模型# AI训练模型# huggingface
TableGPT:浙江大学发布的表格大模型 TableGPT是一个统一的微调框架,使大模型(LLM)能够使用外部功能命令理解和操作表格,旨在通过使用户能够轻松利用表格数据来为用户提供便利和可访问性。,TableGPT是一个统一的微调框架,使大模型(LLM)能够使用外部功能命令理解和操作表格,旨在通过使用户能够轻松利用表格数据来为用户提供便利和可访问性。 840 AI训练模型# AI大模型# 浙江大学
OpenELM-苹果发布的开源高效语言系列模型 OpenELM是Apple苹果公司发布的一系列开源语言模型,包含OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模版本(包含预训练和指令微调)。,OpenELM是Apple苹果公司发布的一系列开源语言模型,包含OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不同参数规模版本(包含预训练和指令微调… 830 AI训练模型# 苹果Apple
荀子古籍大语言模型 荀子古籍大语言模型是南京农业大学信息管理学院王东波教授团队在北京发布的进行古籍处理和研究的智能工具。,荀子古籍大语言模型是南京农业大学信息管理学院王东波教授团队在北京发布的进行古籍处理和研究的智能工具。 800 AI训练模型# 荀子# 荀子古籍大语言模型# 荀子大模型
云从从容大模型 云从从容大模型是由中国领先的人工智能公司云从科技推出的一种先进的人机协同操作系统(CWOS)。这个系统采用了多模态的人工智能技术,包括但不限于视觉识别、自然语言处理、语音识别等。它的目标是实现数字世界与物理世界之间的无缝连接,为各种应用和服务提供智能化的解决方案。,云从从容大模型是由中国领先的人工智能公司云从科技推出的一种先进的人机协同操作系统(CWOS)。这个系统采用了多模态的人工智能技术,包括但不限于视觉识别、自然语言处理、语音识别等。它的目标是实现数字世界… 800 AI训练模型# 云从科技# 从容大模型
Monkey:华中科技大学开源的多模态大模型 Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从0预训练,大大提高了研发效率。,Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器… 800 AI训练模型# Monkey# 华中科技大学# 多模态大模型
Coze Coze是由字节跳动推出的一个AI聊天机器人和应用程序编辑开发平台,可以理解为字节跳动版的GPTs。无论用户是否有编程经验,都可以通过该平台快速创建各种类型的聊天机器人、智能体、AI应用和插件,并将其部署在社交平台和即时聊天应用程序中,如Discord、WhatsApp、Twitter。 790 AI训练模型# AI训练模型
CogVideoX-智谱推出的开源AI视频生成模型 CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX 系列视频生成模型中的第一个模型,与智谱推出的AI视频生成产品清影同源。,CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX … 790 AI训练模型# AI开源模型# AI视频模型
浦语灵笔-上海AI实验室开源图文混合创作大模型 浦语灵笔是上海人工智能实验室推出的首个图文混合创作大模型,该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。,浦语灵笔是上海人工智能实验室推出的首个图文混合创作大模型,该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。 760 AI训练模型# AI大模型# 上海AI实验室# 浦语灵笔
知乎-知海图大模型 知海图AI,是知乎和面壁科技合作发布的中文大模型,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。,知海图AI,是知乎和面壁科技合作发布的中文大模型,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。 760 AI训练模型# 知乎# 知海图AI
天工SkyMusic-昆仑万维推出的AI音乐生成大模型 「天工SkyMusic」是昆仑万维推出的AI音乐生成大模型,基于昆仑万维「天工3.0」超级大模型打造,是目前国内唯一公开可用的AI音乐生成大模型。具备高质量音乐制作、逼真人声合成、精准歌词控制、多元风格适应及复杂歌唱技巧学习等五大特点。该模型基于先进的Transformer技术,能够根据用户输入生成具有丰富情感表达的音乐作品,旨在推动音乐创作的创新和个性化发展。,「天工SkyMusic」是昆仑万维推出的AI音乐生成大模型,基于昆仑万维「天工3.0」超级大模型打造,是目前国内唯一公开可用的AI音乐生成大模型。具备高质量音乐制作、逼真人声合成、精准歌词控制、多元风… 750 AI训练模型# AI生成音乐# AI音乐生成器# 天工SkyMusic
昆仑万维-天工AI大模型 天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。,天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。 750 AI训练模型# 天工大模型# 昆仑万维
Ferret-UI:苹果公司推出的多模态AI模型 Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并执行任务,聚焦于移动端、关注用户交互。,Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并… 750 AI训练模型# AI 大模型
Grok-1.5V:xAI发布的多模态AI大模型 Grok-1.5V不仅具备强大的文本处理能力,还可以处理各种视觉信息,如文档、图表、截图和照片。这使得Grok-1.5V能够在多学科推理、理解科学图表、阅读文本和实现真实世界的空间理解等领域与现有的前沿多模态模型竞争。,Grok-1.5V不仅具备强大的文本处理能力,还可以处理各种视觉信息,如文档、图表、截图和照片。这使得Grok-1.5V能够在多学科推理、理解科学图表、阅读文本和实现真实世界的空间理解等领域与现有的前… 750 AI训练模型# AI大模型# 多模态模型
文心千帆:百度AI大模型平台 一站式企业级大模型平台,提供先进的生成式AI生产及应用全流程开发工具链,一站式企业级大模型平台,提供先进的生成式AI生产及应用全流程开发工具链 750 AI训练模型# 文心千帆
讯飞星火语音大模型 讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出。该模型适用于语音搜索、聊天输入、游戏娱乐、人机交互、智能客服等多个场景,为企业和开发者提供了强大的语音交互解决方案。,讯飞星火认知大模型是科大讯飞推出的AI大语言模型,专注于提供高精度的语音识别和超拟人化的语音合成服务。它支持多种语言和方言,具备自动语种判断和智能标点功能,能够实现流畅的语音转文字和自然口语的语音输出… 740 AI训练模型# 科大讯飞# 讯飞星火# 讯飞星火语音大模型
Meta-ImageBind开源多模态AI大模型 ImageBind能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。,ImageBind能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。 730 AI训练模型# ImageBind# 多模态大模型# 语言大模型
云知声-山海大模型 山海大模型是最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。,山海大模型是最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。 730 AI训练模型# 云知声# 山海大模型
中科院自动化研究所-紫东太初大模型 业界首个三模态千亿参数大模型,支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。,业界首个三模态千亿参数大模型,支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。 730 AI训练模型# AI 大模型# 紫东太初