GPT-4o mini

面向高频调用的轻量多模态模型,成本更低

已发布
schedule发布时间2024年7月18日

GPT-4o mini 是 OpenAI 面向低成本、高并发场景推出的轻量模型。它保留了 GPT-4o 系列的多模态和通用语言能力,但在成本与响应速度上更适合批量任务、简单客服、分类、摘要和轻量代码辅助等场景

stars能力特性

visibility视觉理解code函数调用stream流式输出data_object结构化输出

payments上下文与价格

上下文长度128,000
最大输出16,384
知识截止2023-09
输入价格$0.15/ 每 1M tokens
输出价格$0.6/ 每 1M tokens
缓存输入价格$0.075/ 每 1M tokens

description详细介绍

模型概述

GPT-4o mini 的定位是高性价比通用模型,适合把大量重复请求从旗舰模型迁移出来。它常被用于分类、摘要、信息抽取、简单问答和前置路由

使用建议

在实际产品中,可以用 GPT-4o mini 处理简单请求,再把复杂推理、多轮复杂上下文或高价值任务转交给更强的模型

lightbulb典型场景

  • 批量文本分类
  • 低成本客服回复
  • 短文本摘要
  • 模型路由前置判断

thumb_up优势特点

  • 调用成本低
  • 响应速度快
  • 适合大规模并发
  • 可承担大量基础文本任务

info局限性

  • 复杂推理能力弱于旗舰模型
  • 长链路任务需要更强模型兜底
  • 专业领域准确性需要业务验证

compare_arrows替代模型

link参考来源

以上内容综合整理自官方文档与公开资料,具体以官方为准