gemini-3.5-flash

对话/推理代码● 服务正常

Gemini 3.5 Flash 是谷歌（Google）推出的高速多模态大语言模型，专为低延迟、高并发与大规模部署场景设计，在保持优秀理解能力的同时，大幅提升了响应速度与调用效率，是性价比极高的 Gemini 系列模型。Flash 版本原生支持文本与图像的多模态理解，能够快速完成对话生成、文档摘要、信息抽取、图像识别与轻量级代码任务。借助超长上下文窗口，模型可一次性处理长篇文档、大量数据与多轮对话，并保持连贯稳定的输出质量，即便在高频调用场景下依然表现可靠。

输入1.5/1M/1M

输出9/1M/1M

缓存输入—/1M

缓存读取2/1M/1M

API 接入

System Prompt

User Message *必填

Temperature 0.70

Max Tokens 1024

输出格式

流式输出（Stream）

提示词缓存（Cache）

缓存说明

开启后长 System Prompt 自动缓存，重复请求可节省最多 90% 输入成本

Idle — 等待运行

◎

点击发送请求

响应将在此处流式显示

模型介绍

Gemini 3.5 Flash