Gemini 2.5 Flash

面向低延迟和高吞吐的 Gemini 轻量模型

已发布
schedule发布时间2025年3月20日

Gemini 2.5 Flash 是 Google 面向速度、成本和高吞吐场景推出的模型,适合需要快速响应的问答、摘要、分类、搜索增强和多模态轻量任务。它通常与 Pro 系列搭配使用,用于承担高频基础请求

stars能力特性

visibility视觉理解code函数调用stream流式输出data_object结构化输出

payments上下文与价格

上下文长度1,048,576
最大输出65,536
知识截止2025-01
输入价格$0.3/ 每 1M tokens
输出价格$2.5/ 每 1M tokens
缓存输入价格$0.03/ 每 1M tokens

description详细介绍

模型概述

Gemini 2.5 Flash 的定位是快速、经济、可规模化。它适合在产品中承担大量基础请求,并在需要更强分析能力时转交给 Pro 系列

使用建议

如果你正在构建实时助手、批量处理或低延迟应用,可以优先用 Flash 系列做默认模型,再按任务复杂度升级到 Pro

lightbulb典型场景

  • 实时问答助手
  • 批量摘要和分类
  • 搜索增强问答
  • 低延迟多模态任务

thumb_up优势特点

  • 响应快
  • 成本相对可控
  • 适合高频调用
  • 保留 Gemini 多模态生态能力

info局限性

  • 复杂推理不如 Pro 系列
  • 专业长文分析需谨慎评估
  • 供应商能力和价格可能动态调整

compare_arrows替代模型

link参考来源

以上内容综合整理自官方文档与公开资料,具体以官方为准