Gemini 2.5 Flash

面向低延迟和高吞吐的 Gemini 轻量模型

已发布

schedule发布时间：2025年3月20日

Gemini 2.5 Flash 是 Google 面向速度、成本和高吞吐场景推出的模型，适合需要快速响应的问答、摘要、分类、搜索增强和多模态轻量任务。它通常与 Pro 系列搭配使用，用于承担高频基础请求

stars能力特性

visibility视觉理解code函数调用data_object结构化输出

上下文长度1,048,576

最大输出65,536

知识截止2025-01

输入价格$0.3/ 每 1M tokens

输出价格$2.5/ 每 1M tokens

缓存输入价格$0.03/ 每 1M tokens

Gemini 2.5 Flash 的定位是快速、经济、可规模化。它适合在产品中承担大量基础请求，并在需要更强分析能力时转交给 Pro 系列

如果你正在构建实时助手、批量处理或低延迟应用，可以优先用 Flash 系列做默认模型，再按任务复杂度升级到 Pro