为什么输入和输出价格不同?
模型服务商通常会对生成输出收取更高费用,因为输出生成消耗更多推理计算资源。
快速估算您的 API 使用成本
把官方单价、中转倍率和 tokens 规模放在一起比较。
输入或粘贴文本,快速估算大约会消耗多少 Tokens。内容只在本地计算。
这是通用估算值,精确数量会因不同模型 tokenizer 略有差异。
| 模型名称 / MODEL | 提供商 / PROVIDER | 上下文 | 输入 / INPUT ($) | 输出 / OUTPUT ($) |
|---|---|---|---|---|
| GPT-4o | OpenAI | 128K | 5.00 | 15.00 |
| GPT-4 Turbo | OpenAI | 128K | 10.00 | 30.00 |
| Claude 3.5 Sonnet | Anthropic | 200K | 3.00 | 15.00 |
| Claude 3 Opus | Anthropic | 200K | 15.00 | 75.00 |
| Gemini 1.5 Pro | 2M | 3.50 | 10.50 | |
| DeepSeek Chat | DeepSeek | 64K | 0.27 | 1.10 |
| Qwen Plus | Alibaba Cloud | 128K | 0.40 | 1.20 |
* 价格数据仅供参考,实际计费以官方 API 为准。
大多数模型 API 会分别计算输入 tokens 和输出 tokens。中转站可能还会叠加倍率或自定义单价。
Prompt、系统指令、历史对话和工具上下文通常都会作为输入 tokens 计费。
模型生成的回答通常按输出 tokens 计费,单价往往高于输入 tokens。
中转站可能存在加价或套餐折算,建议用最终成本和官方价格做对比。
模型服务商通常会对生成输出收取更高费用,因为输出生成消耗更多推理计算资源。
这里的文本 token 计算是通用估算,精确数量会因不同模型和 tokenizer 有差异。
不要只看标价,还要结合汇率、中转倍率、实际支持模型名和可用性一起比较。