AI Model Encyclopedia

auto_stories模型百科

全面介绍主流大语言模型,包括能力定位、技术参数、使用场景与优劣对比

psychology
深度模型介绍为每个模型提供详细的能力介绍、典型场景、优劣势对比与参考来源

domainGoogle

Googlegemini-flash

Gemini 3.5 Flash

Gemini 3.5 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

发布时间 2026年5月
Googlegemini-flash-lite

Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.25/1M tokens输出 $1.5/1M tokens发布时间 2026年5月
Googlegemini-flash-lite

Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash Lite Preview 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.25/1M tokens输出 $1.5/1M tokens发布时间 2026年3月
Googlegemini-flash

Nano Banana 2

Nano Banana 2 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

66K 上下文多模态输入 $0.5/1M tokens输出 $60/1M tokens发布时间 2026年2月
Googlegemini-pro

Gemini 3.1 Pro Preview Custom Tools

Gemini 3.1 Pro Preview Custom Tools 是 Google 提供的 gemini-pro 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $2/1M tokens输出 $12/1M tokens发布时间 2026年2月
Googlegemini-pro

Gemini 3.1 Pro Preview

Gemini 3.1 Pro Preview 是 Google 提供的 gemini-pro 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $2/1M tokens输出 $12/1M tokens发布时间 2026年2月
Googlegemini-flash

Gemini 3 Flash Preview

Gemini 3 Flash Preview 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.5/1M tokens输出 $3/1M tokens发布时间 2025年12月
Googlegemini-pro

Gemini 3 Pro Preview

Gemini 3 Pro Preview 是 Google 提供的 gemini-pro 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $2/1M tokens输出 $12/1M tokens发布时间 2025年11月
Googlegemini-flash

Gemini Flash Latest

Gemini Flash Latest 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.3/1M tokens输出 $2.5/1M tokens发布时间 2025年9月
Googlegemini-flash-lite

Gemini Flash-Lite Latest

Gemini Flash-Lite Latest 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.1/1M tokens输出 $0.4/1M tokens发布时间 2025年9月
Googlegemini-flash

Nano Banana

Nano Banana 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-06

33K 上下文多模态输入 $0.3/1M tokens输出 $30/1M tokens发布时间 2025年8月
Googlegemini-flash-lite

Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.1/1M tokens输出 $0.4/1M tokens发布时间 2025年6月
Googlegemini

Gemini Embedding 001

Gemini Embedding 001 是 Google 提供的 gemini 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

2K 上下文输入 $0.15/1M tokens输出 $0/1M tokens发布时间 2025年5月
Googlegemini-flash

Gemini 2.5 Pro Preview TTS

Gemini 2.5 Pro Preview TTS 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

8K 上下文输入 $1/1M tokens输出 $20/1M tokens发布时间 2025年5月
Googlegemini-flash

Gemini 2.5 Flash Preview TTS

Gemini 2.5 Flash Preview TTS 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

8K 上下文输入 $0.5/1M tokens输出 $10/1M tokens发布时间 2025年5月
Googlegemini-pro

Gemini 2.5 Pro

Google 高阶多模态模型,适合长上下文和复杂推理

知识截止:2025-01

1049K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年3月
Googlegemini-flash

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

1049K 上下文多模态输入 $0.3/1M tokens输出 $2.5/1M tokens发布时间 2025年3月
Googlegemini-pro

Gemini 2.5 Pro

Google 高阶多模态模型,适合长上下文和复杂推理

Gemini 2.5 Pro 是 Google Gemini 系列中的高阶模型,强调长上下文、多模态理解和复杂问题处理。它适合处理大型文档、视频或图像相关理解任务,也适合需要与 Google 生态结合的 AI 应用

1049K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年3月
Googlegemini-flash

Gemini 2.5 Flash

面向低延迟和高吞吐的 Gemini 轻量模型

Gemini 2.5 Flash 是 Google 面向速度、成本和高吞吐场景推出的模型,适合需要快速响应的问答、摘要、分类、搜索增强和多模态轻量任务。它通常与 Pro 系列搭配使用,用于承担高频基础请求

1049K 上下文多模态输入 $0.3/1M tokens输出 $2.5/1M tokens发布时间 2025年3月
Googlegemini-flash-lite

Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务

知识截止:2024-06

1049K 上下文多模态输入 $0.075/1M tokens输出 $0.3/1M tokens发布时间 2024年12月
Googlegemini-flash

Gemini 2.0 Flash

Gemini 2.0 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务

知识截止:2024-06

1049K 上下文多模态输入 $0.1/1M tokens输出 $0.4/1M tokens发布时间 2024年12月

domainDeepSeek

DeepSeekdeepseek-thinking

DeepSeek V4 Pro

DeepSeek V4 Pro 是 DeepSeek 提供的 deepseek-thinking 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

1000K 上下文输入 ¥3/1M tokens输出 ¥6/1M tokens发布时间 2026年4月
DeepSeekdeepseek-flash

DeepSeek V4 Flash

DeepSeek V4 Flash 是 DeepSeek 提供的 deepseek-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

1000K 上下文输入 ¥1/1M tokens输出 ¥2/1M tokens发布时间 2026年4月
DeepSeekdeepseek-thinking

DeepSeek Reasoner

DeepSeek Reasoner 是 DeepSeek 提供的 deepseek-thinking 模型,适合对话、内容生成和自动化任务

知识截止:2025-09

1000K 上下文输入 $0.14/1M tokens输出 $0.28/1M tokens发布时间 2025年12月
DeepSeekdeepseek

DeepSeek Chat

DeepSeek 通用聊天模型,适合中文问答和内容生成

DeepSeek Chat 是 DeepSeek 面向通用对话场景的模型,适合中文问答、内容生成、代码解释和知识库问答。它常用于需要稳定中文体验和较好成本控制的产品中

1000K 上下文输入 $0.14/1M tokens输出 $0.28/1M tokens发布时间 2025年12月

domainOpenAI

OpenAIgpt-pro

GPT-5.5 Pro

GPT-5.5 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务

知识截止:2025-12-01

1050K 上下文多模态输入 $30/1M tokens输出 $180/1M tokens发布时间 2026年4月
OpenAIgpt-pro

GPT-5.4 Pro

GPT-5.4 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

1050K 上下文多模态输入 $30/1M tokens输出 $180/1M tokens发布时间 2026年3月
OpenAIgpt

GPT-5.3 Chat (latest)

GPT-5.3 Chat (latest) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

128K 上下文多模态输入 $1.75/1M tokens输出 $14/1M tokens发布时间 2026年3月
OpenAIgpt-codex-spark

GPT-5.3 Codex Spark

GPT-5.3 Codex Spark 是 OpenAI 提供的 gpt-codex-spark 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

128K 上下文多模态输入 $1.75/1M tokens输出 $14/1M tokens发布时间 2026年2月
OpenAIgpt-codex

GPT-5.3 Codex

GPT-5.3 Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

400K 上下文多模态输入 $1.75/1M tokens输出 $14/1M tokens发布时间 2026年2月
OpenAIgpt

GPT-5.2

GPT-5.2 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

400K 上下文多模态输入 $1.75/1M tokens输出 $14/1M tokens发布时间 2025年12月
OpenAIgpt-pro

GPT-5.2 Pro

GPT-5.2 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

400K 上下文多模态输入 $21/1M tokens输出 $168/1M tokens发布时间 2025年12月
OpenAIgpt-codex

GPT-5.2 Chat

GPT-5.2 Chat 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

128K 上下文多模态输入 $1.75/1M tokens输出 $14/1M tokens发布时间 2025年12月
OpenAIgpt-codex

GPT-5.2 Codex

GPT-5.2 Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

400K 上下文多模态输入 $1.75/1M tokens输出 $14/1M tokens发布时间 2025年12月
OpenAIgpt-codex

GPT-5.1 Codex mini

GPT-5.1 Codex mini 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $0.25/1M tokens输出 $2/1M tokens发布时间 2025年11月
OpenAIgpt-codex

GPT-5.1 Chat

GPT-5.1 Chat 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

128K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年11月
OpenAIgpt

GPT-5.1

GPT-5.1 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年11月
OpenAIgpt-codex

GPT-5.1 Codex Max

GPT-5.1 Codex Max 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年11月
OpenAIgpt-codex

GPT-5.1 Codex

GPT-5.1 Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年11月
OpenAIgpt-pro

GPT-5 Pro

GPT-5 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $15/1M tokens输出 $120/1M tokens发布时间 2025年10月
OpenAIgpt-codex

GPT-5-Codex

GPT-5-Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年9月
OpenAIgpt-codex

GPT-5 Chat (latest)

GPT-5 Chat (latest) 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年8月
OpenAIgpt-nano

GPT-5 Nano

GPT-5 Nano 是 OpenAI 提供的 gpt-nano 模型,适合对话、内容生成和自动化任务

知识截止:2024-05-30

400K 上下文多模态输入 $0.05/1M tokens输出 $0.4/1M tokens发布时间 2025年8月
OpenAIgpt

GPT-5

GPT-5 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2024-09-30

400K 上下文多模态输入 $1.25/1M tokens输出 $10/1M tokens发布时间 2025年8月
OpenAIgpt-mini

GPT-5 Mini

面向新一代 GPT 系列的轻量版本,适合成本敏感场景

GPT-5 Mini 通常用于需要新一代 GPT 能力但又关注成本和延迟的场景。它适合做默认轻量模型、批量内容处理、搜索增强问答和应用内助手,在能力与价格之间取得更均衡的折中

400K 上下文多模态输入 $0.25/1M tokens输出 $2/1M tokens发布时间 2025年8月
OpenAIo-pro

o3-pro

o3-pro 是 OpenAI 提供的 o-pro 模型,适合对话、内容生成和自动化任务

知识截止:2024-05

200K 上下文多模态输入 $20/1M tokens输出 $80/1M tokens发布时间 2025年6月
OpenAIo-mini

o4-mini

o4-mini 是 OpenAI 提供的 o-mini 模型,适合对话、内容生成和自动化任务

知识截止:2024-05

200K 上下文多模态输入 $1.1/1M tokens输出 $4.4/1M tokens发布时间 2025年4月
OpenAIo

o3

o3 是 OpenAI 提供的 o 模型,适合对话、内容生成和自动化任务

知识截止:2024-05

200K 上下文多模态输入 $2/1M tokens输出 $8/1M tokens发布时间 2025年4月
OpenAIgpt

GPT-4.1

GPT-4.1 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2024-04

1048K 上下文多模态输入 $2/1M tokens输出 $8/1M tokens发布时间 2025年4月
OpenAIgpt-mini

GPT-4.1 mini

GPT-4.1 mini 是 OpenAI 提供的 gpt-mini 模型,适合对话、内容生成和自动化任务

知识截止:2024-04

1048K 上下文多模态输入 $0.4/1M tokens输出 $1.6/1M tokens发布时间 2025年4月
OpenAIgpt-nano

GPT-4.1 nano

GPT-4.1 nano 是 OpenAI 提供的 gpt-nano 模型,适合对话、内容生成和自动化任务

知识截止:2024-04

1048K 上下文多模态输入 $0.1/1M tokens输出 $0.4/1M tokens发布时间 2025年4月
OpenAIo-pro

o1-pro

o1-pro 是 OpenAI 提供的 o-pro 模型,适合对话、内容生成和自动化任务

知识截止:2023-09

200K 上下文多模态输入 $150/1M tokens输出 $600/1M tokens发布时间 2025年3月
OpenAIo-mini

o3-mini

OpenAI 轻量推理模型,适合代码、数学和复杂分析的成本优化版本

o3-mini 是 OpenAI 面向推理任务推出的轻量模型,适合代码调试、数学题解析、规则推演和技术问题分析。它比通用轻量模型更重视推理链路,同时比高阶推理模型更适合成本敏感场景

200K 上下文输入 $1.1/1M tokens输出 $4.4/1M tokens发布时间 2024年12月
OpenAIo

o1

OpenAI 推理模型,适合复杂问题分析和多步骤任务

o1 是 OpenAI 面向复杂推理任务推出的模型系列,重点能力在数学、代码、逻辑分析和多步骤问题拆解。相比普通对话模型,o1 更适合需要审慎分析和推演的任务,但通常成本更高、响应也更慢

200K 上下文多模态输入 $15/1M tokens输出 $60/1M tokens发布时间 2024年12月
OpenAIgpt

GPT-4o (2024-11-20)

GPT-4o (2024-11-20) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2023-09

128K 上下文多模态输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2024年11月
OpenAIo

o1-preview

o1-preview 是 OpenAI 提供的 o 模型,适合对话、内容生成和自动化任务

知识截止:2023-09

128K 上下文输入 $15/1M tokens输出 $60/1M tokens发布时间 2024年9月
OpenAIo-mini

o1-mini

更轻量的推理模型,适合代码和数学类任务

o1-mini 是 o1 系列中更轻量的推理模型,常用于代码、数学、逻辑拆解等对推理有要求但又关注成本的场景。它在部分专业任务上比通用轻量模型更可靠,但不适合作为所有对话场景的默认模型

128K 上下文输入 $1.1/1M tokens输出 $4.4/1M tokens发布时间 2024年9月
OpenAIgpt

GPT-4o (2024-08-06)

GPT-4o (2024-08-06) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2023-09

128K 上下文多模态输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2024年8月
OpenAIgpt-mini

GPT-4o mini

面向高频调用的轻量多模态模型,成本更低

GPT-4o mini 是 OpenAI 面向低成本、高并发场景推出的轻量模型。它保留了 GPT-4o 系列的多模态和通用语言能力,但在成本与响应速度上更适合批量任务、简单客服、分类、摘要和轻量代码辅助等场景

128K 上下文多模态输入 $0.15/1M tokens输出 $0.6/1M tokens发布时间 2024年7月
OpenAIo-mini

o4-mini-deep-research

o4-mini-deep-research 是 OpenAI 提供的 o-mini 模型,适合对话、内容生成和自动化任务

知识截止:2024-05

200K 上下文多模态输入 $2/1M tokens输出 $8/1M tokens发布时间 2024年6月
OpenAIo

o3-deep-research

o3-deep-research 是 OpenAI 提供的 o 模型,适合对话、内容生成和自动化任务

知识截止:2024-05

200K 上下文多模态输入 $10/1M tokens输出 $40/1M tokens发布时间 2024年6月
OpenAIgpt

GPT-4o (2024-05-13)

GPT-4o (2024-05-13) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2023-09

128K 上下文多模态输入 $5/1M tokens输出 $15/1M tokens发布时间 2024年5月
OpenAIgpt

GPT-4o

OpenAI 旗舰多模态模型,兼顾文本、图像和实时交互

GPT-4o 是 OpenAI 面向通用场景推出的旗舰多模态模型,名称中的 o 代表 omni,强调其在文本、图像和语音交互上的统一能力。它适合需要稳定理解、生成、代码辅助和图像分析的产品场景,在速度和成本上相较早期 GPT-4 系列更适合规模化接入

128K 上下文多模态输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2024年5月
OpenAItext-embedding

text-embedding-3-large

text-embedding-3-large 是 OpenAI 提供的 text-embedding 模型,适合对话、内容生成和自动化任务

知识截止:2024-01

8K 上下文输入 $0.13/1M tokens输出 $0/1M tokens发布时间 2024年1月
OpenAItext-embedding

text-embedding-3-small

text-embedding-3-small 是 OpenAI 提供的 text-embedding 模型,适合对话、内容生成和自动化任务

知识截止:2024-01

8K 上下文输入 $0.02/1M tokens输出 $0/1M tokens发布时间 2024年1月
OpenAIgpt

GPT-4 Turbo

GPT-4 Turbo 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2023-12

128K 上下文多模态输入 $10/1M tokens输出 $30/1M tokens发布时间 2023年11月
OpenAIgpt

GPT-4

GPT-4 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2023-11

8K 上下文输入 $30/1M tokens输出 $60/1M tokens发布时间 2023年11月
OpenAIgpt

GPT-3.5-turbo

GPT-3.5-turbo 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务

知识截止:2021-09-01

16K 上下文输入 $0.5/1M tokens输出 $1.5/1M tokens发布时间 2023年3月
OpenAItext-embedding

text-embedding-ada-002

text-embedding-ada-002 是 OpenAI 提供的 text-embedding 模型,适合对话、内容生成和自动化任务

知识截止:2022-12

8K 上下文输入 $0.1/1M tokens输出 $0/1M tokens发布时间 2022年12月
OpenAIgpt-mini

GPT-5.4 nano

面向极低成本和高吞吐任务的 GPT-5.4 小型版本

GPT-5.4 nano 是 OpenAI 的通用模型,适合批量标签、简单抽取、轻量路由、内容预处理和对延迟成本极敏感的场景

400K 上下文多模态输入 $0.2/1M tokens输出 $1.25/1M tokens
OpenAIgpt

GPT-5.4

OpenAI 高能力通用模型,适合质量和成本之间的平衡选型

GPT-5.4 是 OpenAI 的通用模型,适合产品助手、内容生成、代码辅助、结构化处理和多模态理解等通用任务

1050K 上下文多模态输入 $2.5/1M tokens输出 $15/1M tokens
OpenAIgpt-mini

GPT-5.4 mini

更低延迟和更低成本的 GPT-5.4 轻量版本

GPT-5.4 mini 是 OpenAI 的通用模型,适合高频调用、客服问答、摘要改写、轻量分类和成本敏感的自动化流程

400K 上下文多模态输入 $0.75/1M tokens输出 $4.5/1M tokens
OpenAIgpt

GPT-5.5

OpenAI 旗舰通用模型,面向复杂推理、代码和高质量生成任务

GPT-5.5 是 OpenAI 的通用模型,适合高难度问答、复杂代码、长文分析、Agent 工作流和需要更强综合能力的生产场景

1050K 上下文多模态输入 $5/1M tokens输出 $30/1M tokens
OpenAIgpt-image

GPT Image 2

OpenAI 新一代图像生成与编辑模型,面向高质量视觉创作场景

GPT Image 2 是 OpenAI 官方模型目录中的图像生成模型,重点面向文本生成图像、图像编辑、创意设计和视觉内容生产

OpenAIrealtime

GPT Realtime 2

面向实时语音交互的推理型 Realtime 模型

GPT Realtime 2 面向低延迟语音输入和语音输出场景,更适合需要语音输入、语音输出和多轮推理的实时助手、电话客服、语音代理和互动式应用

OpenAIrealtime-mini

GPT Realtime mini

更低成本的 OpenAI 实时语音交互模型

GPT Realtime mini 面向低延迟语音输入和语音输出场景,更适合对成本和延迟敏感的实时语音助手、客服机器人、语音入口和轻量多轮交互

OpenAIrealtime

GPT Realtime 1.5

支持音频输入与音频输出的 OpenAI 实时语音模型

GPT Realtime 1.5 面向低延迟语音输入和语音输出场景,适合需要稳定实时对话体验的语音助手、会议辅助、互动语音产品和原型验证

OpenAIrealtime

GPT Realtime Translate

面向流式语音到语音翻译的 OpenAI 实时模型

GPT Realtime Translate 面向实时语音翻译场景,重点是跨语言对话、会议翻译和低延迟语音互译

OpenAIrealtime

GPT Realtime Whisper

面向实时转写的 OpenAI 流式语音识别模型

GPT Realtime Whisper 面向语音转文字场景,适合实时字幕、语音输入、会议记录和语音流转写

OpenAItranscribe

GPT-4o Transcribe

由 GPT-4o 驱动的语音转文字模型

GPT-4o Transcribe 面向语音转文字场景,适合高质量音频转写、字幕生成、会议记录和语音内容处理

OpenAItranscribe

GPT-4o mini Transcribe

由 GPT-4o mini 驱动的轻量语音转文字模型

GPT-4o mini Transcribe 面向语音转文字场景,适合批量音频处理、低成本转写、语音输入和实时字幕

domain月之暗面(Kimi)

月之暗面(Kimi)kimi-k2.6

Kimi K2.6

Kimi K2.6 是 Moonshot AI 提供的 kimi-k2.6 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

262K 上下文多模态输入 $0.95/1M tokens输出 $4/1M tokens发布时间 2026年4月
月之暗面(Kimi)kimi-k2.5

Kimi K2.5

Kimi K2.5 是 Moonshot AI 提供的 kimi-k2.5 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

262K 上下文多模态输入 $0.6/1M tokens输出 $3/1M tokens发布时间 2026年1月
月之暗面(Kimi)kimi-thinking

Kimi K2 Thinking

Kimi K2 Thinking 是 Moonshot AI 提供的 kimi-thinking 模型,适合对话、内容生成和自动化任务

知识截止:2024-08

262K 上下文输入 $0.6/1M tokens输出 $2.5/1M tokens发布时间 2025年11月
月之暗面(Kimi)kimi-thinking

Kimi K2 Thinking Turbo

Kimi K2 Thinking Turbo 是 Moonshot AI 提供的 kimi-thinking 模型,适合对话、内容生成和自动化任务

知识截止:2024-08

262K 上下文输入 $1.15/1M tokens输出 $8/1M tokens发布时间 2025年11月
月之暗面(Kimi)kimi

Kimi K2 0905

Kimi K2 0905 是 Moonshot AI 提供的 kimi 模型,适合对话、内容生成和自动化任务

知识截止:2024-10

262K 上下文输入 $0.6/1M tokens输出 $2.5/1M tokens发布时间 2025年9月
月之暗面(Kimi)kimi

Kimi K2 Turbo

Kimi K2 Turbo 是 Moonshot AI 提供的 kimi 模型,适合对话、内容生成和自动化任务

知识截止:2024-10

262K 上下文输入 $2.4/1M tokens输出 $10/1M tokens发布时间 2025年9月
月之暗面(Kimi)kimi

Kimi K2 0711

Kimi K2 0711 是 Moonshot AI 提供的 kimi 模型,适合对话、内容生成和自动化任务

知识截止:2024-10

131K 上下文输入 $0.6/1M tokens输出 $2.5/1M tokens发布时间 2025年7月
月之暗面(Kimi)kimi

Moonshot v1 128K

月之暗面超长上下文模型,适合长文档分析、检索增强和复杂阅读任务

Moonshot v1 128K 是月之暗面 Kimi 体系模型,适合中文问答、长文档理解、内容生成和知识库场景

月之暗面(Kimi)kimi-k2

Kimi K2

月之暗面面向复杂推理、代码和 Agent 任务的 Kimi 系列模型

Kimi K2 是月之暗面 Kimi 体系模型,适合中文问答、长文档理解、内容生成和知识库场景

domainAnthropic

Anthropicclaude-opus

Claude Opus 4.7

Claude Opus 4.7 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务

知识截止:2026-01-31

1000K 上下文多模态输入 $5/1M tokens输出 $25/1M tokens发布时间 2026年4月
Anthropicclaude-sonnet

Claude Sonnet 4.6

Claude Sonnet 4.6 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务

知识截止:2025-08-31

1000K 上下文多模态输入 $3/1M tokens输出 $15/1M tokens发布时间 2026年2月
Anthropicclaude-opus

Claude Opus 4.6

Claude Opus 4.6 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务

知识截止:2025-05-31

1000K 上下文多模态输入 $5/1M tokens输出 $25/1M tokens发布时间 2026年2月
Anthropicclaude-opus

Claude Opus 4.5 (latest)

Claude Opus 4.5 (latest) 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务

知识截止:2025-03-31

200K 上下文多模态输入 $5/1M tokens输出 $25/1M tokens发布时间 2025年11月
Anthropicclaude-haiku

Claude Haiku 4.5

Claude Haiku 4.5 (latest) 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务

知识截止:2025-02-28

200K 上下文多模态输入 $1/1M tokens输出 $5/1M tokens发布时间 2025年10月
Anthropicclaude

Claude Sonnet 4.5

Claude Sonnet 系列升级版,强调代码、代理和复杂任务执行

Claude Sonnet 4.5 延续 Sonnet 系列的均衡定位,并进一步强化代码、代理式任务执行和长时间复杂工作流。它适合软件开发、数据分析、文档处理和企业自动化等场景,是 Claude 生态中面向高质量任务的主力选择

200K 上下文多模态输入 $3/1M tokens输出 $15/1M tokens发布时间 2025年9月
Anthropicclaude-opus

Claude Opus 4.1 (latest)

Claude Opus 4.1 (latest) 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务

知识截止:2025-03-31

200K 上下文多模态输入 $15/1M tokens输出 $75/1M tokens发布时间 2025年8月
Anthropicclaude-opus

Claude Opus 4 (latest)

Claude Opus 4 (latest) 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务

知识截止:2025-03-31

200K 上下文多模态输入 $15/1M tokens输出 $75/1M tokens发布时间 2025年5月
Anthropicclaude-sonnet

Claude Sonnet 4 (latest)

Claude Sonnet 4 (latest) 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务

知识截止:2025-03-31

200K 上下文多模态输入 $3/1M tokens输出 $15/1M tokens发布时间 2025年5月
Anthropicclaude

Claude Sonnet 4

Anthropic 主力模型,适合长文理解、代码和严肃写作

Claude Sonnet 4 是 Anthropic Claude 系列的主力模型,定位在高质量文本理解、长文处理、代码辅助和企业知识工作流。它通常以稳健、克制、长上下文体验好著称,适合需要可靠输出和复杂文档处理的应用

发布时间 2025年5月
Anthropicclaude

Claude Opus 4

Claude 高阶模型,适合复杂推理、代码和长时间任务

Claude Opus 4 是 Anthropic Claude 系列中面向高难度任务的模型,适合复杂代码、深度文档分析、研究辅助和多步骤任务执行。相比 Sonnet 系列,它更适合高价值、复杂度更高的任务

发布时间 2025年5月
Anthropicclaude-sonnet

Claude Sonnet 3.7

Claude Sonnet 3.7 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务

知识截止:2024-10-31

200K 上下文多模态输入 $3/1M tokens输出 $15/1M tokens发布时间 2025年2月
Anthropicclaude-haiku

Claude Haiku 3.5 (latest)

Claude Haiku 3.5 (latest) 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务

知识截止:2024-07-31

200K 上下文多模态输入 $0.8/1M tokens输出 $4/1M tokens发布时间 2024年10月
Anthropicclaude-haiku

Claude Haiku 3.5

Claude Haiku 3.5 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务

知识截止:2024-07-31

200K 上下文多模态输入 $0.8/1M tokens输出 $4/1M tokens发布时间 2024年10月
Anthropicclaude-sonnet

Claude Sonnet 3.5 v2

Claude Sonnet 3.5 v2 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务

知识截止:2024-04-30

200K 上下文多模态输入 $3/1M tokens输出 $15/1M tokens发布时间 2024年10月
Anthropicclaude-haiku

Claude Haiku 3

Claude Haiku 3 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务

知识截止:2023-08-31

200K 上下文多模态输入 $0.25/1M tokens输出 $1.25/1M tokens发布时间 2024年3月
Anthropicclaude-sonnet

Claude Sonnet 3

Claude Sonnet 3 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务

知识截止:2023-08-31

200K 上下文多模态输入 $3/1M tokens输出 $15/1M tokens发布时间 2024年3月
Anthropicclaude-opus

Claude Opus 3

Claude Opus 3 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务

知识截止:2023-08-31

200K 上下文多模态输入 $15/1M tokens输出 $75/1M tokens发布时间 2024年2月

domain跃问(StepFun)

跃问(StepFun)

Step 3.5 Flash 2603

Step 3.5 Flash 2603 是 stepfun 提供的 AI 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

256K 上下文输入 $0.1/1M tokens输出 $0.3/1M tokens发布时间 2026年4月
跃问(StepFun)

Step 3.5 Flash

Step 3.5 Flash 是 stepfun 提供的 AI 模型,适合对话、内容生成和自动化任务

知识截止:2025-01

输入 ¥0.14/1M tokens发布时间 2026年1月
跃问(StepFun)step-1

Step 1 32K

跃问 Step 1 长上下文模型,适合文档理解、摘要和知识问答

Step 1 32K 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用

输入 ¥15/1M tokens输出 ¥70/1M tokens
跃问(StepFun)step-1

Step 1 128K

跃问 Step 1 超长上下文模型,适合长文档分析和检索增强任务

Step 1 128K 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用

跃问(StepFun)step-2

Step 2 Mini

跃问 Step 2 轻量模型,适合低延迟和成本敏感的高频调用场景

Step 2 Mini 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用

输入 ¥1/1M tokens输出 ¥2/1M tokens
跃问(StepFun)step-vision

Step 1V 8K

跃问视觉理解模型,适合图文问答、多模态分析和视觉内容理解

Step 1V 8K 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用

多模态输入 ¥5/1M tokens输出 ¥20/1M tokens

domainMistral

Mistralmistral-small

Mistral Small 4

Mistral Small 4 是 Mistral 提供的 mistral-small 模型,适合对话、内容生成和自动化任务

知识截止:2025-06

256K 上下文多模态输入 $0.15/1M tokens输出 $0.6/1M tokens发布时间 2026年3月
Mistraldevstral

Devstral 2

Devstral 2 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务

知识截止:2025-12

262K 上下文输入 $0.4/1M tokens输出 $2/1M tokens发布时间 2025年12月
Mistraldevstral

Devstral Small 2

Devstral Small 2 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务

知识截止:2025-12

256K 上下文多模态输入 $0/1M tokens输出 $0/1M tokens发布时间 2025年12月
Mistraldevstral

Devstral 2 (latest)

Devstral 2 (latest) 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务

知识截止:2025-12

262K 上下文输入 $0.4/1M tokens输出 $2/1M tokens发布时间 2025年12月
Mistralmistral-medium

Mistral Medium 3.1

Mistral Medium 3.1 是 Mistral 提供的 mistral-medium 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

262K 上下文多模态输入 $0.4/1M tokens输出 $2/1M tokens发布时间 2025年8月
Mistraldevstral

Devstral Medium

Devstral Medium 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

128K 上下文输入 $0.4/1M tokens输出 $2/1M tokens发布时间 2025年7月
Mistraldevstral

Devstral Small

Devstral Small 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

128K 上下文输入 $0.1/1M tokens输出 $0.3/1M tokens发布时间 2025年7月
Mistralmistral-small

Mistral Small 3.2

Mistral Small 3.2 是 Mistral 提供的 mistral-small 模型,适合对话、内容生成和自动化任务

知识截止:2025-03

128K 上下文多模态输入 $0.1/1M tokens输出 $0.3/1M tokens发布时间 2025年6月
Mistraldevstral

Devstral Small 2505

Devstral Small 2505 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

128K 上下文输入 $0.1/1M tokens输出 $0.3/1M tokens发布时间 2025年5月
Mistralmistral-medium

Mistral Medium 3

Mistral Medium 3 是 Mistral 提供的 mistral-medium 模型,适合对话、内容生成和自动化任务

知识截止:2025-05

131K 上下文多模态输入 $0.4/1M tokens输出 $2/1M tokens发布时间 2025年5月
Mistralmagistral-medium

Magistral Medium (latest)

Magistral Medium (latest) 是 Mistral 提供的 magistral-medium 模型,适合对话、内容生成和自动化任务

知识截止:2025-06

128K 上下文输入 $2/1M tokens输出 $5/1M tokens发布时间 2025年3月
Mistralmagistral-small

Magistral Small

Magistral Small 是 Mistral 提供的 magistral-small 模型,适合对话、内容生成和自动化任务

知识截止:2025-06

128K 上下文输入 $0.5/1M tokens输出 $1.5/1M tokens发布时间 2025年3月
Mistralmistral-large

Mistral Large 3

Mistral Large 3 是 Mistral 提供的 mistral-large 模型,适合对话、内容生成和自动化任务

知识截止:2024-11

262K 上下文多模态输入 $0.5/1M tokens输出 $1.5/1M tokens发布时间 2024年11月
Mistralmistral-large

Mistral Large 2.1

Mistral Large 2.1 是 Mistral 提供的 mistral-large 模型,适合对话、内容生成和自动化任务

知识截止:2024-11

131K 上下文输入 $2/1M tokens输出 $6/1M tokens发布时间 2024年11月
Mistralministral

Ministral 3B (latest)

Ministral 3B (latest) 是 Mistral 提供的 ministral 模型,适合对话、内容生成和自动化任务

知识截止:2024-10

128K 上下文输入 $0.04/1M tokens输出 $0.04/1M tokens发布时间 2024年10月
Mistralpixtral

Pixtral 12B

Pixtral 12B 是 Mistral 提供的 pixtral 模型,适合对话、内容生成和自动化任务

知识截止:2024-09

128K 上下文多模态输入 $0.15/1M tokens输出 $0.15/1M tokens发布时间 2024年9月
Mistralmistral-nemo

Mistral Nemo

Mistral Nemo 是 Mistral 提供的 mistral-nemo 模型,适合对话、内容生成和自动化任务

知识截止:2024-07

128K 上下文输入 $0.15/1M tokens输出 $0.15/1M tokens发布时间 2024年7月
Mistralmixtral

Mixtral 8x22B

Mixtral 8x22B 是 Mistral 提供的 mixtral 模型,适合对话、内容生成和自动化任务

知识截止:2024-04

64K 上下文输入 $2/1M tokens输出 $6/1M tokens发布时间 2024年4月
Mistralmixtral

Mixtral 8x7B

Mixtral 8x7B 是 Mistral 提供的 mixtral 模型,适合对话、内容生成和自动化任务

知识截止:2024-01

32K 上下文输入 $0.7/1M tokens输出 $0.7/1M tokens发布时间 2023年12月
Mistralmistral

Mistral 7B

Mistral 7B 是 Mistral 提供的 mistral 模型,适合对话、内容生成和自动化任务

知识截止:2023-12

8K 上下文输入 $0.25/1M tokens输出 $0.25/1M tokens发布时间 2023年9月
Mistralcodestral

Codestral

Mistral 代码模型,适合代码补全、代码生成和开发辅助场景

Codestral 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景

256K 上下文输入 $0.3/1M tokens输出 $0.9/1M tokens
Mistralmistral-small

Mistral Small

Mistral 轻量通用模型,适合低延迟、高并发和成本敏感场景

Mistral Small 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景

256K 上下文多模态输入 $0.15/1M tokens输出 $0.6/1M tokens
Mistralmistral-large

Mistral Large

Mistral 高阶通用模型,适合复杂推理、企业问答和多语言任务

Mistral Large 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景

262K 上下文多模态输入 $0.5/1M tokens输出 $1.5/1M tokens
Mistralministral

Ministral 8B

Mistral 小参数模型,适合边缘部署、低成本调用和基础文本任务

Ministral 8B 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景

128K 上下文输入 $0.1/1M tokens输出 $0.1/1M tokens
Mistralpixtral

Pixtral Large

Mistral 多模态视觉模型,适合图文理解、视觉问答和多模态分析

Pixtral Large 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景

128K 上下文多模态输入 $2/1M tokens输出 $6/1M tokens
Mistralmixtral

Mixtral 8x7B

Mistral MoE 开源模型,适合通用语言任务、研究和自部署场景

Mixtral 8x7B 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景

domain智谱 AI

智谱 AIglm-flash

GLM-4.7-FlashX

GLM-4.7-FlashX 是 Zhipu AI 提供的 glm-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

200K 上下文输入 $0.07/1M tokens输出 $0.4/1M tokens发布时间 2026年1月
智谱 AIglm-flash

GLM-4.7-Flash

GLM-4.7-Flash 是 Zhipu AI 提供的 glm-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

200K 上下文输入 $0/1M tokens输出 $0/1M tokens发布时间 2026年1月
智谱 AIglm

GLM-4.7

GLM-4.7 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

205K 上下文输入 $0.6/1M tokens输出 $2.2/1M tokens发布时间 2025年12月
智谱 AIglm

GLM-4.6V

GLM-4.6V 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

128K 上下文多模态输入 $0.3/1M tokens输出 $0.9/1M tokens发布时间 2025年12月
智谱 AIglm

GLM-4.6

GLM-4.6 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

205K 上下文输入 $0.6/1M tokens输出 $2.2/1M tokens发布时间 2025年9月
智谱 AIglm

GLM-4.5V

GLM-4.5V 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

64K 上下文多模态输入 $0.6/1M tokens输出 $1.8/1M tokens发布时间 2025年8月
智谱 AIglm-air

GLM-4.5-Air

GLM-4.5-Air 是 Zhipu AI 提供的 glm-air 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

131K 上下文输入 $0.2/1M tokens输出 $1.1/1M tokens发布时间 2025年7月
智谱 AIglm

GLM-4.5

GLM-4.5 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

131K 上下文输入 $0.6/1M tokens输出 $2.2/1M tokens发布时间 2025年7月
智谱 AIglm-flash

GLM-4.5-Flash

GLM-4.5-Flash 是 Zhipu AI 提供的 glm-flash 模型,适合对话、内容生成和自动化任务

知识截止:2025-04

131K 上下文输入 $0/1M tokens输出 $0/1M tokens发布时间 2025年7月
智谱 AIglm

GLM-4-Air

智谱 AI 轻量通用模型,适合低成本、高并发的中文任务

GLM-4-Air 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务

智谱 AIglm

GLM-4-Flash

智谱 AI 快速响应模型,适合高频对话和轻量自动化场景

GLM-4-Flash 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务

智谱 AIglm-4.5

GLM-4.5

智谱 AI 面向智能体、代码和复杂推理任务的新一代模型

GLM-4.5 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务

智谱 AIglm-z1

GLM-Z1

智谱 AI 推理模型,适合多步骤分析、数学、代码和复杂问题求解

GLM-Z1 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务

domainCohere

Coherecommand-a

Command A Translate

Command A Translate 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

8K 上下文输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2025年8月
Coherecommand-a

Command A Reasoning

Command A Reasoning 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

256K 上下文输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2025年8月
Coherecommand-a

Command A Vision

Command A Vision 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

128K 上下文多模态输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2025年7月
Coherecommand-a

Command A

Command A 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

256K 上下文输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2025年3月
Coherecommand-r

Command R7B Arabic

Command R7B Arabic 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

128K 上下文输入 $0.0375/1M tokens输出 $0.15/1M tokens发布时间 2025年2月
Coherecommand-r

Command R

Command R 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

128K 上下文输入 $0.15/1M tokens输出 $0.6/1M tokens发布时间 2024年8月
Coherecommand-r

Command R+

Command R+ 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

128K 上下文输入 $2.5/1M tokens输出 $10/1M tokens发布时间 2024年8月
Coherecommand-r

Command R7B

Command R7B 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务

知识截止:2024-06-01

128K 上下文输入 $0.0375/1M tokens输出 $0.15/1M tokens发布时间 2024年2月
Coherecommand

Command A

Cohere 面向企业智能体和复杂任务的高阶生成模型

Command A 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成

Coherecommand-r

Command R+

Cohere 面向检索增强、工具调用和企业问答的高阶模型

Command R+ 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成

Coherecommand-r

Command R

Cohere 面向 RAG、长上下文和多语言问答的通用模型

Command R 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成

Coherecommand

Command Light

Cohere 轻量生成模型,适合低延迟文本生成和基础对话场景

Command Light 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成

Cohereembed

Embed v4.0

Cohere 向量嵌入模型,适合语义检索、聚类和 RAG 知识库构建

Embed v4.0 是 Cohere 向量嵌入模型,适合语义检索、RAG 索引、文本聚类和相似度计算

Coherererank

Rerank v3.5

Cohere 重排序模型,适合提升检索结果相关性和 RAG 答案质量

Rerank v3.5 是 Cohere 重排序模型,适合搜索结果重排、RAG 召回精排和答案质量提升

domainMeta Llama

Meta Llamallama

Llama-4-Scout-17B-16E-Instruct-FP8

Llama-4-Scout-17B-16E-Instruct-FP8 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务

知识截止:2024-08

128K 上下文多模态输入 $0/1M tokens输出 $0/1M tokens发布时间 2025年4月
Meta Llamallama

Llama-3.3-8B-Instruct

Llama-3.3-8B-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务

知识截止:2023-12

128K 上下文输入 $0/1M tokens输出 $0/1M tokens发布时间 2024年12月
Meta Llamallama

Llama-3.3-70B-Instruct

Llama-3.3-70B-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务

知识截止:2023-12

128K 上下文输入 $0/1M tokens输出 $0/1M tokens发布时间 2024年12月
Meta Llamallama-3.1

Llama 3.1 8B

Meta Llama 轻量开源模型,适合本地部署、基础对话和低成本推理

Llama 3.1 8B 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务

Meta Llamallama-3.1

Llama 3.1 70B

Meta Llama 中高参数开源模型,适合通用语言理解、生成和企业自部署

Llama 3.1 70B 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务

Meta Llamallama-3.1

Llama 3.1 405B

Meta Llama 大参数开源模型,适合复杂推理、多语言任务和高质量生成

Llama 3.1 405B 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务

Meta Llamallama-3.2

Llama 3.2 Vision

Meta Llama 视觉模型,适合图文理解、视觉问答和多模态应用

Llama 3.2 Vision 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务

Meta Llamallama-4

Llama 4 Scout

Meta Llama 4 系列模型,面向多模态、长上下文和高效推理场景

Llama 4 Scout 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务

Meta Llamallama-4

Llama 4 Maverick

Meta Llama 4 高阶模型,适合复杂多模态任务、智能体和高质量生成

Llama 4 Maverick 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务

domain小米(MiMo)

小米(MiMo)mimo

MiMo V2.5

小米 MiMo 系列通用模型,适合中文对话、内容生成和工具调用场景

MiMo V2.5 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景

1000K 上下文多模态输入 ¥2.8/1M tokens输出 ¥14/1M tokens
小米(MiMo)mimo

MiMo V2.5 Pro

小米 MiMo 高阶模型,适合更复杂的推理、代码和长文本任务

MiMo V2.5 Pro 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景

1000K 上下文输入 ¥7/1M tokens输出 ¥21/1M tokens
小米(MiMo)mimo

MiMo V2 Flash

小米 MiMo 轻量低延迟模型,适合高频对话和快速响应场景

MiMo V2 Flash 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景

256K 上下文输入 ¥0.7/1M tokens输出 ¥2.1/1M tokens
小米(MiMo)mimo

MiMo V2 Omni

小米 MiMo 多模态模型,适合图文理解和综合交互场景

MiMo V2 Omni 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景

256K 上下文多模态输入 ¥2.8/1M tokens输出 ¥14/1M tokens
小米(MiMo)mimo

MiMo V2 Pro

小米 MiMo Pro 模型,适合复杂任务、代码辅助和业务自动化

MiMo V2 Pro 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景

1000K 上下文输入 ¥7/1M tokens输出 ¥21/1M tokens

domainMiniMax

MiniMaxabab

ABAB6.5s Chat

MiniMax ABAB 系列对话模型,适合中文问答、写作和业务助手场景

ABAB6.5s Chat 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估

MiniMaxabab

ABAB6.5 Chat

MiniMax 通用对话模型,适合长文本理解、内容生成和复杂交互

ABAB6.5 Chat 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估

MiniMaxminimax-text

MiniMax Text 01

MiniMax 文本模型,适合通用语言理解、生成和智能体任务

MiniMax Text 01 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估

MiniMaxminimax-m

MiniMax M1

MiniMax 推理模型,适合长上下文推理、代码和复杂任务规划

MiniMax M1 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估

MiniMaxminimax-speech

MiniMax Speech 01

MiniMax 语音模型,适合语音生成、对话和多媒体内容场景

MiniMax Speech 01 面向语音和多媒体内容场景,适合语音生成、语音交互和音频化产品体验

domain火山引擎(豆包)

火山引擎(豆包)doubao

Doubao Pro

火山引擎豆包高阶通用模型,适合复杂文本理解、生成和业务自动化

Doubao Pro 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景

火山引擎(豆包)doubao

Doubao Lite

火山引擎豆包轻量模型,适合低成本高并发对话和基础文本任务

Doubao Lite 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景

火山引擎(豆包)doubao-seed

Doubao Seed 1.6

豆包 Seed 系列模型,适合通用对话、推理和智能体应用评估

Doubao Seed 1.6 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景

输入 ¥0.8/1M tokens输出 ¥2/1M tokens
火山引擎(豆包)doubao-thinking

Doubao Seed 1.6 Thinking

豆包思考模型,适合复杂推理、多步骤分析和代码辅助场景

Doubao Seed 1.6 Thinking 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景

火山引擎(豆包)doubao-vision

Doubao Vision Pro

豆包视觉理解模型,适合图文分析、多模态问答和视觉内容处理

Doubao Vision Pro 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景

domain百度(文心)

百度(文心)ernie

ERNIE 4.0 Turbo 8K

百度文心旗舰通用模型,适合中文理解、内容生成和企业级应用

ERNIE 4.0 Turbo 8K 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用

百度(文心)ernie-4.5

ERNIE 4.5 Turbo

百度文心 4.5 系列模型,适合多场景中文任务、知识问答和业务助手

ERNIE 4.5 Turbo 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用

百度(文心)ernie-x1

ERNIE X1

百度文心推理模型,适合复杂分析、逻辑推理和多步骤问题求解

ERNIE X1 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用

百度(文心)ernie-speed

ERNIE Speed

百度文心高速模型,适合低延迟对话和高频基础文本任务

ERNIE Speed 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用

百度(文心)ernie-lite

ERNIE Lite

百度文心轻量模型,适合成本敏感的问答、摘要和内容生成场景

ERNIE Lite 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用