GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

7个月前发布 53 00

GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-3.5 Turbo 便宜 60% 以上。目前支持文本和视觉,未来将支持更多形式。,GPT-4o mini是由OpenAI推出的一款高性价比小...

收录时间:
2024-09-11
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

GPT-4o mini是什么?

GPT-4o mini是由OpenAI最新推出的高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。GPT-4o mini 在 MMLU 上的得分率为 82%,目前在 LMSYS 排行榜的聊天偏好方面优于 GPT-4。它的价格为每百万输入tokens15 美分,每百万输出tokens 60美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。

GPT-4o mini 以其低成本和低延迟实现了各种任务,如连锁或并行多个模型调用(如调用多个应用程序接口)、向模型传递大量上下文(如完整代码库或对话历史)或通过快速、实时文本回复与客户交互(如客户支持聊天机器人)的应用。

目前,GPT-4o mini的API服务支持文本和视觉能力,未来还将支持文本、图像、视频和音频输入和输出。该模型的上下文窗口可容纳 128K tokens,每个请求最多支持 16K 输出tokens,知识期限到 2023 年 10 月。由于改进了与 GPT-4o 共享的标记器,现在处理非英语文本更加经济高效。

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

GPT-4o mini的评测结果

GPT-4o mini在文本智能和多模态推理方面超越了GPT-3.5 Turbo和其他学术基准上的小型模型,并支持与GPT-4o相同的语言范围。

  • 推理任务:GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准 MMLU 中的得分率为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
  • 数学和编码能力:GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上以前的小型机型。在测量数学推理的 MGSM 中,GPT-4o mini 的得分率为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 中,GPT-4o mini 的得分率为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
  • 多模态推理:GPT-4o mini 在多模态推理评估 MMMU 中也表现出色,得分率为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

如何使用GPT-4o mini?

  • 个人用户:免费用户、Plus会员 和 Team 用户已经可以在ChatGPT中使用GPT-4o mini。
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

了解更多GPT-4o mini:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

数据统计

相关导航

LaVie:上海人工智能实验室开源的视频生成模型

LaVie:上海人工智能实验室开源的视频生成模型

LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。,LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部…
新壹视频大模型

新壹视频大模型

新壹视频大模型是国内首个聚焦视频AIGC领域的语言大模型。它依托自身的AI创新技术和大数据资源沉淀,结合对行业的深度理解和认知,更能贴合视频场景,输出文本摘要、语义理解等能力。,新壹视频大模型是国内首个聚焦视频AIGC领域的语言大模型。它依托自身的AI创新技术和大数据资源沉淀,结合对行业的深度理解和认知,更能贴合视频场景,输出文本摘要、语义理解等能力。
SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM-HuggingFace发布的高性能小型语言模型

SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多种基准测试中表现不错, 适合跑在手机这种终端设备上。,SmolLM是由 Huggingface 最新发布的一组高性能的小型语言模型,参数分别为 1.35 亿、3.6 亿和 17 亿,训练数据来自高质量数据集 SmolLM-Corpus,其中包括 Cosm…