GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

5个月前发布 36 00

GPT-4o mini是由OpenAI推出的一款高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。它在多项评测中表现优异,在 MMLU 上得分 82%,目前优于 GPT-4,比 GPT-3.5 Turbo 便宜 60% 以上。目前支持文本和视觉,未来将支持更多形式。,GPT-4o mini是由OpenAI推出的一款高性价比小...

收录时间:
2024-09-11
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

GPT-4o mini是什么?

GPT-4o mini是由OpenAI最新推出的高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。GPT-4o mini 在 MMLU 上的得分率为 82%,目前在 LMSYS 排行榜的聊天偏好方面优于 GPT-4。它的价格为每百万输入tokens15 美分,每百万输出tokens 60美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。

GPT-4o mini 以其低成本和低延迟实现了各种任务,如连锁或并行多个模型调用(如调用多个应用程序接口)、向模型传递大量上下文(如完整代码库或对话历史)或通过快速、实时文本回复与客户交互(如客户支持聊天机器人)的应用。

目前,GPT-4o mini的API服务支持文本和视觉能力,未来还将支持文本、图像、视频和音频输入和输出。该模型的上下文窗口可容纳 128K tokens,每个请求最多支持 16K 输出tokens,知识期限到 2023 年 10 月。由于改进了与 GPT-4o 共享的标记器,现在处理非英语文本更加经济高效。

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

GPT-4o mini的评测结果

GPT-4o mini在文本智能和多模态推理方面超越了GPT-3.5 Turbo和其他学术基准上的小型模型,并支持与GPT-4o相同的语言范围。

  • 推理任务:GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准 MMLU 中的得分率为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
  • 数学和编码能力:GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上以前的小型机型。在测量数学推理的 MGSM 中,GPT-4o mini 的得分率为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 中,GPT-4o mini 的得分率为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
  • 多模态推理:GPT-4o mini 在多模态推理评估 MMMU 中也表现出色,得分率为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

如何使用GPT-4o mini?

  • 个人用户:免费用户、Plus会员 和 Team 用户已经可以在ChatGPT中使用GPT-4o mini。
GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能

了解更多GPT-4o mini:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/

数据统计

数据评估

GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能浏览人数已经达到36,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能特别声明

本站AI导航站提供的GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI导航站实际控制,在2024年9月11日 下午12:08收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI导航站不承担任何责任。

相关导航

Claude 3-Anthropic公司最新推出的AI大模型

Claude 3-Anthropic公司最新推出的AI大模型

Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。每个模型都提供了不同的智能水平、速度和成本效益,以适应不同的应用需求。,Claude 3是Anthropic公司推出的一系列先进的人工智能模型,它们在多种认知任务上设定了新的行业标准。这个模型家族包括三个不同级别的模型:Claude 3 Haiku、Claude 3 So…
Joule-SAP旗下AI对话助手

Joule-SAP旗下AI对话助手

Joule 是 SAP 推出的一款先进的人工智能助手,设计用于与 SAP 的各种业务系统进行深度交互。与传统的 AI 助手不同,Joule 不仅能执行基础任务,还能理解用户在特定业务环境中的独特角色和需求。这使得 Joule 成为一个真正能理解你业务的 AI 副驾驶员。,Joule 是 SAP 推出的一款先进的人工智能助手,设计用于与 SAP 的各种业务系统进行深度交互。与传统的 AI 助手不同,Joule 不仅能执行基础任务,还能理解用户在特定业务环境中的独特角色和…
携程问道:首个旅游行业垂直AI大模型

携程问道:首个旅游行业垂直AI大模型

7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户提出想法,问道可从地域、主题特色等维度,推荐旅行目的地、酒店、景点、行程规划和实时优惠的选项; 在用户需求相对明确时,提供智能查询结果,用户可用文字和语音以自然语言长句的形式进行复杂条件的机票和酒店产品的查询。 携程集团董事局主席梁建章表示,“希望用户从包括‘携程问道’在内的产品获得旅游行业‘可靠的内容,放心的推荐’。,7 月 17 日,携程发布旅游行业首个垂直大模型“携程问道”。 据介绍,在大模型的基础上,“携程问道”筛选高质量非结构性旅游数据 200 亿,结合携程现有精确的实时数据进行了自研垂直模型的训练。 用户…
Qwen2-Math:阿里巴巴最新开源的数学推理大模型

Qwen2-Math:阿里巴巴最新开源的数学推理大模型

Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)、7B(79亿)和72B(720亿)三种参数规模,以适应不同的应用需求。,Qwen2-Math是阿里巴巴最新开源的数学推理大模型,是基于 Qwen2 LLM 构建的专门用于数学解题的一系列语言模型。Qwen2-Math 提供了基础和指令微调两种版本,分别有1.5B(15亿)…