Gemma Gemma是由谷歌DeepMind和谷歌的其他团队开发的一系列轻量级、先进的开放AI模型,基于与Gemini模型相同的技术,旨在帮助开发者和研究人员构建负责任的AI应用。Gemma模型系列包括两种权重规模的模型:Gemma 2B 和 Gemma 7B,提供预训练和指令微调版本,支持多种框架,如JAX、PyTorch和TensorFlow,以在不同设备上高效运行。 2360 AI训练模型# AI训练模型
Llama 3 Llama 3是Meta公司最新开源推出的新一代大型语言模型(LLM),包含8B和70B两种参数规模的模型,标志着开源人工智能领域的又一重大进步。作为Llama系列的第三代产品,Llama 3不仅继承了前代模型的强大功能,还通过一系列创新和改进,提供了更高效、更可靠的AI解决方案。 2350 AI训练模型# AI训练模型
CodeGemma-Google推出的开源代码大模型 CodeGemma是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。,CodeGemma是功能强大的轻量级模型集合,可以执行各种编码任务,例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。 2410 AI训练模型# 代码模型# 开源模型
序列猴子 序列猴子是出门问问推出的一款超大规模的语言模型,具有长序列、多模态、单模型、大数据等特点。利用其通用的表示能力与推理能力,用户能够进行多轮交互,从而在使用中获得更加便捷流畅的体验。 2320 AI训练模型# AI训练模型
Meta-ImageBind开源多模态AI大模型 ImageBind能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。,ImageBind能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。 2350 AI训练模型# ImageBind# 多模态大模型# 语言大模型
SAM 2-Meta推出的图像和视频对象分割模型 SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象进行分割,适用于各种视觉领域。这一模型在原有的Segment Anything Model (SAM)基础上进行了扩展和改进,支持更广泛的应用场景。,SAM 2(Segment Anything Model 2)是由Meta推出的新一代AI分割模型,能够在图像和视频中实现高度精确、实时的对象分割。它在不需要定制适配的情况下,能够对任何未曾见过的对象… 2340 AI训练模型# 图像分割# 视频分割
中科院自动化研究所-紫东太初大模型 业界首个三模态千亿参数大模型,支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。,业界首个三模态千亿参数大模型,支持文本、视觉、语音不同模态间的高效协同,可支撑影视创作、工业质检、智能驾驶等产业应用。 2270 AI训练模型# AI 大模型# 紫东太初
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能 GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-3.5 Turbo 便宜 60% 以上。目前支持文本和视觉,未来将支持更多形式。,GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-… 2250 AI训练模型# ChatGPT# OpenAI
Monkey:华中科技大学开源的多模态大模型 Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器进行构建,无需从0预训练,大大提高了研发效率。,Monkey 是华中科技大学与金山软件联合推出的一种高性能多模态大模型,通过提高输入分辨率和引入多级描述生成方法,解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey 可以基于现有视觉编辑器… 2250 AI训练模型# Monkey# 华中科技大学# 多模态大模型
CogVideoX-智谱推出的开源AI视频生成模型 CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX 系列视频生成模型中的第一个模型,与智谱推出的AI视频生成产品清影同源。,CogVideoX是由智谱AI开发的视频生成大模型,具备强大的视频生成能力、只需输入文本或图片就可以轻松完成视频制作。此次开源的是CogVideoX-2B,20亿参数规格的模型,是CogVideoX … 2250 AI训练模型# AI开源模型# AI视频模型
元象大模型 元象大模型是元象从头训练、全链路自主研发的高性能通用大模型系列,具备优秀的中文创作、逻辑推理和任务执行能力。,元象大模型是元象从头训练、全链路自主研发的高性能通用大模型系列,具备优秀的中文创作、逻辑推理和任务执行能力。 2250 AI训练模型# AI大模型# XVERSE# 元象大模型
SmolLM-HuggingFace发布的高性能小型语言模型 SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多种基准测试中表现不错, 适合跑在手机这种终端设备上。,SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosm… 2260 AI训练模型# AI模型# AI训练模型# huggingface
TransGPT:国内首个综合交通大模型 TransGPT是国内首款开源交通大模型,主要致力于在真实交通行业中发挥实际价值。它能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能。,TransGPT是国内首款开源交通大模型,主要致力于在真实交通行业中发挥实际价值。它能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶… 2230 AI训练模型
Ferret-UI:苹果公司推出的多模态AI模型 Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并执行任务,聚焦于移动端、关注用户交互。,Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态模型。它是专门为了增强对移动端用户界面(UI)屏幕的理解而定制的,配备了引用、定位和推理功能。该模型能够“看懂”手机屏幕上的内容并… 2210 AI训练模型# AI 大模型
Segment Anything:首个图像分割基础模型 SAM是一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象,SAM是一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象 2210 AI训练模型# meta AI# Segment Anything Model# 图像分割
EMO-阿里巴巴发布的AI肖像视频生成框架 EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的动态表现,为内容创作和虚拟角色动画制作提供了新工具。,EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,支持多语言和多种肖像风格的… 2190 AI训练模型# AI生成视频# AI视频生成# EMO
Audiobox-Meta推出的新一代音频生成模型 Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。,Audiobox是Meta发布的一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。 2170 AI训练模型# Audiobox# Meta# 音频生成模型
云知声-山海大模型 山海大模型是最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。,山海大模型是最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。 2170 AI训练模型# 云知声# 山海大模型
MiniMax-新一代中文大语言模型 MiniMax 最新一代的中文大语言模型,帮助人类高效写作、激发创意、获取知识、做出决策,MiniMax 最新一代的中文大语言模型,帮助人类高效写作、激发创意、获取知识、做出决策 2160 AI训练模型# MiniMax# MiniMax大模型# 人工智能
Qwen2-Math:阿里巴巴最新开源的数学推理大模型 Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)、7B(79亿)和72B(720亿)三种参数规模,以适应不同的应用需求。,Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)… 2130 AI训练模型# AI模型# 数学大模型
新壹视频大模型 新壹视频大模型是国内首个聚焦视频AIGC领域的语言大模型。它依托自身的AI创新技术和大数据资源沉淀,结合对行业的深度理解和认知,更能贴合视频场景,输出文本摘要、语义理解等能力。,新壹视频大模型是国内首个聚焦视频AIGC领域的语言大模型。它依托自身的AI创新技术和大数据资源沉淀,结合对行业的深度理解和认知,更能贴合视频场景,输出文本摘要、语义理解等能力。 2120 AI训练模型# 新壹视频大模型