GPT-4o mini是什么?
GPT-4o mini是由OpenAI最新推出的高性价比小型模型,具有成本低、性能强、功能多样和安全可靠等特点。GPT-4o mini 在 MMLU 上的得分率为 82%,目前在 LMSYS 排行榜的聊天偏好方面优于 GPT-4。它的价格为每百万输入tokens15 美分,每百万输出tokens 60美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。
GPT-4o mini 以其低成本和低延迟实现了各种任务,如连锁或并行多个模型调用(如调用多个应用程序接口)、向模型传递大量上下文(如完整代码库或对话历史)或通过快速、实时文本回复与客户交互(如客户支持聊天机器人)的应用。
目前,GPT-4o mini的API服务支持文本和视觉能力,未来还将支持文本、图像、视频和音频输入和输出。该模型的上下文窗口可容纳 128K tokens,每个请求最多支持 16K 输出tokens,知识期限到 2023 年 10 月。由于改进了与 GPT-4o 共享的标记器,现在处理非英语文本更加经济高效。
GPT-4o mini的评测结果
GPT-4o mini在文本智能和多模态推理方面超越了GPT-3.5 Turbo和其他学术基准上的小型模型,并支持与GPT-4o相同的语言范围。
- 推理任务:GPT-4o mini 在涉及文本和视觉的推理任务方面优于其他小型模型,在文本智能和推理基准 MMLU 中的得分率为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。
- 数学和编码能力:GPT-4o mini 在数学推理和编码任务中表现出色,优于市场上以前的小型机型。在测量数学推理的 MGSM 中,GPT-4o mini 的得分率为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 中,GPT-4o mini 的得分率为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。
- 多模态推理:GPT-4o mini 在多模态推理评估 MMMU 中也表现出色,得分率为 59.4%,而 Gemini Flash 为 56.1%,Claude Haiku 为 50.2%。
如何使用GPT-4o mini?
- 个人用户:免费用户、Plus会员 和 Team 用户已经可以在ChatGPT中使用GPT-4o mini。
- 开发者:开发者用户可以在Assistants API、Chat Completions API和Batch API三个API服务中调用GPT-4o mini的文本和视觉能力。
了解更多GPT-4o mini:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/
数据统计
数据评估
本站AI导航站提供的GPT-4o mini:OpenAI最新推出的AI模型,更快更便宜更智能都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI导航站实际控制,在2024年9月11日 下午12:08收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI导航站不承担任何责任。