Gemini 2.5 Flash
面向低延迟和高吞吐的 Gemini 轻量模型
Gemini 2.5 Flash 是 Google 面向速度、成本和高吞吐场景推出的模型,适合需要快速响应的问答、摘要、分类、搜索增强和多模态轻量任务。它通常与 Pro 系列搭配使用,用于承担高频基础请求
stars能力特性
visibility视觉理解code函数调用stream流式输出data_object结构化输出
payments上下文与价格
上下文长度1,048,576
最大输出65,536
知识截止2025-01
输入价格$0.3/ 每 1M tokens
输出价格$2.5/ 每 1M tokens
缓存输入价格$0.03/ 每 1M tokens
description详细介绍
模型概述
Gemini 2.5 Flash 的定位是快速、经济、可规模化。它适合在产品中承担大量基础请求,并在需要更强分析能力时转交给 Pro 系列
使用建议
如果你正在构建实时助手、批量处理或低延迟应用,可以优先用 Flash 系列做默认模型,再按任务复杂度升级到 Pro
lightbulb典型场景
- 实时问答助手
- 批量摘要和分类
- 搜索增强问答
- 低延迟多模态任务
thumb_up优势特点
- 响应快
- 成本相对可控
- 适合高频调用
- 保留 Gemini 多模态生态能力
info局限性
- 复杂推理不如 Pro 系列
- 专业长文分析需谨慎评估
- 供应商能力和价格可能动态调整
扫码联系在线客服