首页模型市场Gemini 3.5 Flash
G

gemini-3.5-flash

对话/推理代码服务正常

Gemini 3.5 Flash 是谷歌(Google)推出的高速多模态大语言模型,专为低延迟、高并发与大规模部署场景设计,在保持优秀理解能力的同时,大幅提升了响应速度与调用效率,是性价比极高的 Gemini 系列模型。Flash 版本原生支持文本与图像的多模态理解,能够快速完成对话生成、文档摘要、信息抽取、图像识别与轻量级代码任务。借助超长上下文窗口,模型可一次性处理长篇文档、大量数据与多轮对话,并保持连贯稳定的输出质量,即便在高频调用场景下依然表现可靠。

输入1.5/1M/1M
输出9/1M/1M
缓存输入/1M
缓存读取2/1M/1M
API 接入
System Prompt
User Message *必填
Temperature 0.70
Max Tokens 1024
输出格式
流式输出(Stream)
提示词缓存(Cache)
缓存说明
开启后长 System Prompt 自动缓存,重复请求可节省最多 90% 输入成本
Idle — 等待运行
点击发送请求
响应将在此处流式显示

模型介绍

Gemini 3.5 Flash