Gemini 3.5 Flash
Gemini 3.5 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
全面介绍主流大语言模型,包括能力定位、技术参数、使用场景与优劣对比
Gemini 3.5 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 3.1 Flash Lite 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 3.1 Flash Lite Preview 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Nano Banana 2 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 3.1 Pro Preview Custom Tools 是 Google 提供的 gemini-pro 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 3.1 Pro Preview 是 Google 提供的 gemini-pro 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 3 Flash Preview 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 3 Pro Preview 是 Google 提供的 gemini-pro 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini Flash Latest 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini Flash-Lite Latest 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Nano Banana 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-06
Gemini 2.5 Flash-Lite 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini Embedding 001 是 Google 提供的 gemini 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
Gemini 2.5 Pro Preview TTS 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Gemini 2.5 Flash Preview TTS 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Google 高阶多模态模型,适合长上下文和复杂推理
知识截止:2025-01
Gemini 2.5 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Google 高阶多模态模型,适合长上下文和复杂推理
Gemini 2.5 Pro 是 Google Gemini 系列中的高阶模型,强调长上下文、多模态理解和复杂问题处理。它适合处理大型文档、视频或图像相关理解任务,也适合需要与 Google 生态结合的 AI 应用
面向低延迟和高吞吐的 Gemini 轻量模型
Gemini 2.5 Flash 是 Google 面向速度、成本和高吞吐场景推出的模型,适合需要快速响应的问答、摘要、分类、搜索增强和多模态轻量任务。它通常与 Pro 系列搭配使用,用于承担高频基础请求
Gemini 2.0 Flash-Lite 是 Google 提供的 gemini-flash-lite 模型,适合对话、内容生成和自动化任务
知识截止:2024-06
Gemini 2.0 Flash 是 Google 提供的 gemini-flash 模型,适合对话、内容生成和自动化任务
知识截止:2024-06
DeepSeek V4 Pro 是 DeepSeek 提供的 deepseek-thinking 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
DeepSeek V4 Flash 是 DeepSeek 提供的 deepseek-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
DeepSeek Reasoner 是 DeepSeek 提供的 deepseek-thinking 模型,适合对话、内容生成和自动化任务
知识截止:2025-09
DeepSeek 通用聊天模型,适合中文问答和内容生成
DeepSeek Chat 是 DeepSeek 面向通用对话场景的模型,适合中文问答、内容生成、代码解释和知识库问答。它常用于需要稳定中文体验和较好成本控制的产品中
GPT-5.5 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务
知识截止:2025-12-01
GPT-5.4 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.3 Chat (latest) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.3 Codex Spark 是 OpenAI 提供的 gpt-codex-spark 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.3 Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.2 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.2 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.2 Chat 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.2 Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
GPT-5.1 Codex mini 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5.1 Chat 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5.1 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5.1 Codex Max 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5.1 Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5 Pro 是 OpenAI 提供的 gpt-pro 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5-Codex 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5 Chat (latest) 是 OpenAI 提供的 gpt-codex 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
GPT-5 Nano 是 OpenAI 提供的 gpt-nano 模型,适合对话、内容生成和自动化任务
知识截止:2024-05-30
GPT-5 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2024-09-30
面向新一代 GPT 系列的轻量版本,适合成本敏感场景
GPT-5 Mini 通常用于需要新一代 GPT 能力但又关注成本和延迟的场景。它适合做默认轻量模型、批量内容处理、搜索增强问答和应用内助手,在能力与价格之间取得更均衡的折中
o3-pro 是 OpenAI 提供的 o-pro 模型,适合对话、内容生成和自动化任务
知识截止:2024-05
o4-mini 是 OpenAI 提供的 o-mini 模型,适合对话、内容生成和自动化任务
知识截止:2024-05
o3 是 OpenAI 提供的 o 模型,适合对话、内容生成和自动化任务
知识截止:2024-05
GPT-4.1 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2024-04
GPT-4.1 mini 是 OpenAI 提供的 gpt-mini 模型,适合对话、内容生成和自动化任务
知识截止:2024-04
GPT-4.1 nano 是 OpenAI 提供的 gpt-nano 模型,适合对话、内容生成和自动化任务
知识截止:2024-04
o1-pro 是 OpenAI 提供的 o-pro 模型,适合对话、内容生成和自动化任务
知识截止:2023-09
OpenAI 轻量推理模型,适合代码、数学和复杂分析的成本优化版本
o3-mini 是 OpenAI 面向推理任务推出的轻量模型,适合代码调试、数学题解析、规则推演和技术问题分析。它比通用轻量模型更重视推理链路,同时比高阶推理模型更适合成本敏感场景
OpenAI 推理模型,适合复杂问题分析和多步骤任务
o1 是 OpenAI 面向复杂推理任务推出的模型系列,重点能力在数学、代码、逻辑分析和多步骤问题拆解。相比普通对话模型,o1 更适合需要审慎分析和推演的任务,但通常成本更高、响应也更慢
GPT-4o (2024-11-20) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2023-09
o1-preview 是 OpenAI 提供的 o 模型,适合对话、内容生成和自动化任务
知识截止:2023-09
更轻量的推理模型,适合代码和数学类任务
o1-mini 是 o1 系列中更轻量的推理模型,常用于代码、数学、逻辑拆解等对推理有要求但又关注成本的场景。它在部分专业任务上比通用轻量模型更可靠,但不适合作为所有对话场景的默认模型
GPT-4o (2024-08-06) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2023-09
面向高频调用的轻量多模态模型,成本更低
GPT-4o mini 是 OpenAI 面向低成本、高并发场景推出的轻量模型。它保留了 GPT-4o 系列的多模态和通用语言能力,但在成本与响应速度上更适合批量任务、简单客服、分类、摘要和轻量代码辅助等场景
o4-mini-deep-research 是 OpenAI 提供的 o-mini 模型,适合对话、内容生成和自动化任务
知识截止:2024-05
o3-deep-research 是 OpenAI 提供的 o 模型,适合对话、内容生成和自动化任务
知识截止:2024-05
GPT-4o (2024-05-13) 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2023-09
OpenAI 旗舰多模态模型,兼顾文本、图像和实时交互
GPT-4o 是 OpenAI 面向通用场景推出的旗舰多模态模型,名称中的 o 代表 omni,强调其在文本、图像和语音交互上的统一能力。它适合需要稳定理解、生成、代码辅助和图像分析的产品场景,在速度和成本上相较早期 GPT-4 系列更适合规模化接入
text-embedding-3-large 是 OpenAI 提供的 text-embedding 模型,适合对话、内容生成和自动化任务
知识截止:2024-01
text-embedding-3-small 是 OpenAI 提供的 text-embedding 模型,适合对话、内容生成和自动化任务
知识截止:2024-01
GPT-4 Turbo 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2023-12
GPT-4 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2023-11
GPT-3.5-turbo 是 OpenAI 提供的 gpt 模型,适合对话、内容生成和自动化任务
知识截止:2021-09-01
text-embedding-ada-002 是 OpenAI 提供的 text-embedding 模型,适合对话、内容生成和自动化任务
知识截止:2022-12
面向极低成本和高吞吐任务的 GPT-5.4 小型版本
GPT-5.4 nano 是 OpenAI 的通用模型,适合批量标签、简单抽取、轻量路由、内容预处理和对延迟成本极敏感的场景
OpenAI 高能力通用模型,适合质量和成本之间的平衡选型
GPT-5.4 是 OpenAI 的通用模型,适合产品助手、内容生成、代码辅助、结构化处理和多模态理解等通用任务
更低延迟和更低成本的 GPT-5.4 轻量版本
GPT-5.4 mini 是 OpenAI 的通用模型,适合高频调用、客服问答、摘要改写、轻量分类和成本敏感的自动化流程
OpenAI 旗舰通用模型,面向复杂推理、代码和高质量生成任务
GPT-5.5 是 OpenAI 的通用模型,适合高难度问答、复杂代码、长文分析、Agent 工作流和需要更强综合能力的生产场景
OpenAI 新一代图像生成与编辑模型,面向高质量视觉创作场景
GPT Image 2 是 OpenAI 官方模型目录中的图像生成模型,重点面向文本生成图像、图像编辑、创意设计和视觉内容生产
面向实时语音交互的推理型 Realtime 模型
GPT Realtime 2 面向低延迟语音输入和语音输出场景,更适合需要语音输入、语音输出和多轮推理的实时助手、电话客服、语音代理和互动式应用
更低成本的 OpenAI 实时语音交互模型
GPT Realtime mini 面向低延迟语音输入和语音输出场景,更适合对成本和延迟敏感的实时语音助手、客服机器人、语音入口和轻量多轮交互
支持音频输入与音频输出的 OpenAI 实时语音模型
GPT Realtime 1.5 面向低延迟语音输入和语音输出场景,适合需要稳定实时对话体验的语音助手、会议辅助、互动语音产品和原型验证
面向流式语音到语音翻译的 OpenAI 实时模型
GPT Realtime Translate 面向实时语音翻译场景,重点是跨语言对话、会议翻译和低延迟语音互译
面向实时转写的 OpenAI 流式语音识别模型
GPT Realtime Whisper 面向语音转文字场景,适合实时字幕、语音输入、会议记录和语音流转写
由 GPT-4o 驱动的语音转文字模型
GPT-4o Transcribe 面向语音转文字场景,适合高质量音频转写、字幕生成、会议记录和语音内容处理
由 GPT-4o mini 驱动的轻量语音转文字模型
GPT-4o mini Transcribe 面向语音转文字场景,适合批量音频处理、低成本转写、语音输入和实时字幕
Kimi K2.6 是 Moonshot AI 提供的 kimi-k2.6 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Kimi K2.5 是 Moonshot AI 提供的 kimi-k2.5 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Kimi K2 Thinking 是 Moonshot AI 提供的 kimi-thinking 模型,适合对话、内容生成和自动化任务
知识截止:2024-08
Kimi K2 Thinking Turbo 是 Moonshot AI 提供的 kimi-thinking 模型,适合对话、内容生成和自动化任务
知识截止:2024-08
Kimi K2 0905 是 Moonshot AI 提供的 kimi 模型,适合对话、内容生成和自动化任务
知识截止:2024-10
Kimi K2 Turbo 是 Moonshot AI 提供的 kimi 模型,适合对话、内容生成和自动化任务
知识截止:2024-10
Kimi K2 0711 是 Moonshot AI 提供的 kimi 模型,适合对话、内容生成和自动化任务
知识截止:2024-10
月之暗面超长上下文模型,适合长文档分析、检索增强和复杂阅读任务
Moonshot v1 128K 是月之暗面 Kimi 体系模型,适合中文问答、长文档理解、内容生成和知识库场景
月之暗面面向复杂推理、代码和 Agent 任务的 Kimi 系列模型
Kimi K2 是月之暗面 Kimi 体系模型,适合中文问答、长文档理解、内容生成和知识库场景
Claude Opus 4.7 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务
知识截止:2026-01-31
Claude Sonnet 4.6 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务
知识截止:2025-08-31
Claude Opus 4.6 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务
知识截止:2025-05-31
Claude Opus 4.5 (latest) 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务
知识截止:2025-03-31
Claude Haiku 4.5 (latest) 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务
知识截止:2025-02-28
Claude Sonnet 系列升级版,强调代码、代理和复杂任务执行
Claude Sonnet 4.5 延续 Sonnet 系列的均衡定位,并进一步强化代码、代理式任务执行和长时间复杂工作流。它适合软件开发、数据分析、文档处理和企业自动化等场景,是 Claude 生态中面向高质量任务的主力选择
Claude Opus 4.1 (latest) 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务
知识截止:2025-03-31
Claude Opus 4 (latest) 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务
知识截止:2025-03-31
Claude Sonnet 4 (latest) 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务
知识截止:2025-03-31
Anthropic 主力模型,适合长文理解、代码和严肃写作
Claude Sonnet 4 是 Anthropic Claude 系列的主力模型,定位在高质量文本理解、长文处理、代码辅助和企业知识工作流。它通常以稳健、克制、长上下文体验好著称,适合需要可靠输出和复杂文档处理的应用
Claude 高阶模型,适合复杂推理、代码和长时间任务
Claude Opus 4 是 Anthropic Claude 系列中面向高难度任务的模型,适合复杂代码、深度文档分析、研究辅助和多步骤任务执行。相比 Sonnet 系列,它更适合高价值、复杂度更高的任务
Claude Sonnet 3.7 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务
知识截止:2024-10-31
Claude Haiku 3.5 (latest) 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务
知识截止:2024-07-31
Claude Haiku 3.5 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务
知识截止:2024-07-31
Claude Sonnet 3.5 v2 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务
知识截止:2024-04-30
Claude Haiku 3 是 Anthropic 提供的 claude-haiku 模型,适合对话、内容生成和自动化任务
知识截止:2023-08-31
Claude Sonnet 3 是 Anthropic 提供的 claude-sonnet 模型,适合对话、内容生成和自动化任务
知识截止:2023-08-31
Claude Opus 3 是 Anthropic 提供的 claude-opus 模型,适合对话、内容生成和自动化任务
知识截止:2023-08-31
Step 3.5 Flash 2603 是 stepfun 提供的 AI 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Step 3.5 Flash 是 stepfun 提供的 AI 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
跃问 Step 1 长上下文模型,适合文档理解、摘要和知识问答
Step 1 32K 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用
跃问 Step 1 超长上下文模型,适合长文档分析和检索增强任务
Step 1 128K 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用
跃问 Step 2 轻量模型,适合低延迟和成本敏感的高频调用场景
Step 2 Mini 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用
跃问视觉理解模型,适合图文问答、多模态分析和视觉内容理解
Step 1V 8K 是阶跃星辰 Step 系列模型,适合中文问答、长文本、多模态理解和企业级应用
Mistral Small 4 是 Mistral 提供的 mistral-small 模型,适合对话、内容生成和自动化任务
知识截止:2025-06
Devstral 2 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务
知识截止:2025-12
Devstral Small 2 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务
知识截止:2025-12
Devstral 2 (latest) 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务
知识截止:2025-12
Mistral Medium 3.1 是 Mistral 提供的 mistral-medium 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
Devstral Medium 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
Devstral Small 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
Mistral Small 3.2 是 Mistral 提供的 mistral-small 模型,适合对话、内容生成和自动化任务
知识截止:2025-03
Devstral Small 2505 是 Mistral 提供的 devstral 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
Mistral Medium 3 是 Mistral 提供的 mistral-medium 模型,适合对话、内容生成和自动化任务
知识截止:2025-05
Magistral Medium (latest) 是 Mistral 提供的 magistral-medium 模型,适合对话、内容生成和自动化任务
知识截止:2025-06
Magistral Small 是 Mistral 提供的 magistral-small 模型,适合对话、内容生成和自动化任务
知识截止:2025-06
Mistral Large 3 是 Mistral 提供的 mistral-large 模型,适合对话、内容生成和自动化任务
知识截止:2024-11
Mistral Large 2.1 是 Mistral 提供的 mistral-large 模型,适合对话、内容生成和自动化任务
知识截止:2024-11
Ministral 3B (latest) 是 Mistral 提供的 ministral 模型,适合对话、内容生成和自动化任务
知识截止:2024-10
Pixtral 12B 是 Mistral 提供的 pixtral 模型,适合对话、内容生成和自动化任务
知识截止:2024-09
Mistral Nemo 是 Mistral 提供的 mistral-nemo 模型,适合对话、内容生成和自动化任务
知识截止:2024-07
Mixtral 8x22B 是 Mistral 提供的 mixtral 模型,适合对话、内容生成和自动化任务
知识截止:2024-04
Mixtral 8x7B 是 Mistral 提供的 mixtral 模型,适合对话、内容生成和自动化任务
知识截止:2024-01
Mistral 7B 是 Mistral 提供的 mistral 模型,适合对话、内容生成和自动化任务
知识截止:2023-12
Mistral 代码模型,适合代码补全、代码生成和开发辅助场景
Codestral 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景
Mistral 轻量通用模型,适合低延迟、高并发和成本敏感场景
Mistral Small 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景
Mistral 高阶通用模型,适合复杂推理、企业问答和多语言任务
Mistral Large 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景
Mistral 小参数模型,适合边缘部署、低成本调用和基础文本任务
Ministral 8B 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景
Mistral 多模态视觉模型,适合图文理解、视觉问答和多模态分析
Pixtral Large 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景
Mistral MoE 开源模型,适合通用语言任务、研究和自部署场景
Mixtral 8x7B 是 Mistral 官方模型,适合多语言任务、企业问答、代码、多模态或自部署场景
GLM-4.7-FlashX 是 Zhipu AI 提供的 glm-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.7-Flash 是 Zhipu AI 提供的 glm-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.7 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.6V 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.6 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.5V 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.5-Air 是 Zhipu AI 提供的 glm-air 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.5 是 Zhipu AI 提供的 glm 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
GLM-4.5-Flash 是 Zhipu AI 提供的 glm-flash 模型,适合对话、内容生成和自动化任务
知识截止:2025-04
智谱 AI 轻量通用模型,适合低成本、高并发的中文任务
GLM-4-Air 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务
智谱 AI 快速响应模型,适合高频对话和轻量自动化场景
GLM-4-Flash 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务
智谱 AI 面向智能体、代码和复杂推理任务的新一代模型
GLM-4.5 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务
智谱 AI 推理模型,适合多步骤分析、数学、代码和复杂问题求解
GLM-Z1 是智谱 AI GLM 系列模型,适合中文对话、企业知识问答、代码辅助和智能体任务
Command A Translate 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command A Reasoning 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command A Vision 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command A 是 Cohere 提供的 command-a 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command R7B Arabic 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command R 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command R+ 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Command R7B 是 Cohere 提供的 command-r 模型,适合对话、内容生成和自动化任务
知识截止:2024-06-01
Cohere 面向企业智能体和复杂任务的高阶生成模型
Command A 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成
Cohere 面向检索增强、工具调用和企业问答的高阶模型
Command R+ 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成
Cohere 面向 RAG、长上下文和多语言问答的通用模型
Command R 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成
Cohere 轻量生成模型,适合低延迟文本生成和基础对话场景
Command Light 是 Cohere 生成模型,适合企业问答、RAG、智能体和多语言生成
Cohere 向量嵌入模型,适合语义检索、聚类和 RAG 知识库构建
Embed v4.0 是 Cohere 向量嵌入模型,适合语义检索、RAG 索引、文本聚类和相似度计算
Cohere 重排序模型,适合提升检索结果相关性和 RAG 答案质量
Rerank v3.5 是 Cohere 重排序模型,适合搜索结果重排、RAG 召回精排和答案质量提升
Llama-4-Maverick-17B-128E-Instruct-FP8 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2024-08
Cerebras-Llama-4-Scout-17B-16E-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Llama-4-Scout-17B-16E-Instruct-FP8 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2024-08
Cerebras-Llama-4-Maverick-17B-128E-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Groq-Llama-4-Maverick-17B-128E-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2025-01
Llama-3.3-8B-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2023-12
Llama-3.3-70B-Instruct 是 llama 提供的 llama 模型,适合对话、内容生成和自动化任务
知识截止:2023-12
Meta Llama 轻量开源模型,适合本地部署、基础对话和低成本推理
Llama 3.1 8B 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务
Meta Llama 中高参数开源模型,适合通用语言理解、生成和企业自部署
Llama 3.1 70B 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务
Meta Llama 大参数开源模型,适合复杂推理、多语言任务和高质量生成
Llama 3.1 405B 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务
Meta Llama 视觉模型,适合图文理解、视觉问答和多模态应用
Llama 3.2 Vision 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务
Meta Llama 4 系列模型,面向多模态、长上下文和高效推理场景
Llama 4 Scout 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务
Meta Llama 4 高阶模型,适合复杂多模态任务、智能体和高质量生成
Llama 4 Maverick 是 Meta Llama 官方模型,适合开源生态、自部署、多语言生成、多模态或智能体任务
小米 MiMo 系列通用模型,适合中文对话、内容生成和工具调用场景
MiMo V2.5 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景
小米 MiMo 高阶模型,适合更复杂的推理、代码和长文本任务
MiMo V2.5 Pro 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景
小米 MiMo 轻量低延迟模型,适合高频对话和快速响应场景
MiMo V2 Flash 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景
小米 MiMo 多模态模型,适合图文理解和综合交互场景
MiMo V2 Omni 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景
小米 MiMo Pro 模型,适合复杂任务、代码辅助和业务自动化
MiMo V2 Pro 是小米 MiMo 体系模型,适合中文对话、工具调用、多模态交互和智能硬件生态场景
MiniMax ABAB 系列对话模型,适合中文问答、写作和业务助手场景
ABAB6.5s Chat 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估
MiniMax 通用对话模型,适合长文本理解、内容生成和复杂交互
ABAB6.5 Chat 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估
MiniMax 文本模型,适合通用语言理解、生成和智能体任务
MiniMax Text 01 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估
MiniMax 推理模型,适合长上下文推理、代码和复杂任务规划
MiniMax M1 是 MiniMax 官方模型,适合中文对话、内容生成、业务助手和多模态产品能力评估
MiniMax 语音模型,适合语音生成、对话和多媒体内容场景
MiniMax Speech 01 面向语音和多媒体内容场景,适合语音生成、语音交互和音频化产品体验
火山引擎豆包高阶通用模型,适合复杂文本理解、生成和业务自动化
Doubao Pro 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景
火山引擎豆包轻量模型,适合低成本高并发对话和基础文本任务
Doubao Lite 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景
豆包 Seed 系列模型,适合通用对话、推理和智能体应用评估
Doubao Seed 1.6 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景
豆包思考模型,适合复杂推理、多步骤分析和代码辅助场景
Doubao Seed 1.6 Thinking 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景
豆包视觉理解模型,适合图文分析、多模态问答和视觉内容处理
Doubao Vision Pro 是火山引擎豆包体系模型,适合中文对话、内容生成、多模态理解和企业自动化场景
百度文心旗舰通用模型,适合中文理解、内容生成和企业级应用
ERNIE 4.0 Turbo 8K 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用
百度文心 4.5 系列模型,适合多场景中文任务、知识问答和业务助手
ERNIE 4.5 Turbo 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用
百度文心推理模型,适合复杂分析、逻辑推理和多步骤问题求解
ERNIE X1 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用
百度文心高速模型,适合低延迟对话和高频基础文本任务
ERNIE Speed 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用
百度文心轻量模型,适合成本敏感的问答、摘要和内容生成场景
ERNIE Lite 是百度文心/千帆体系模型,适合中文理解、知识问答、内容生成和企业应用