Gemini 3.1 Flash Lite - OpenAI SDK - 完整参数文档
- 使用 OpenAI SDK 格式调用 Gemini-3.1-flash-lite-preview 模型
- 同步处理模式,实时返回对话内容
- 纯文本对话:单轮或多轮上下文对话,可参考示例代码中simple_text、multi_turn示例
- 系统提示词:自定义 AI 的角色和行为,可参考示例代码中system_prompt示例
- 多模态输入:支持文本 + 图像混合输入,可参考示例代码中vision、multi_image示例
https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。授权
##所有接口均需要使用Bearer Token进行认证##
获取 API Key:
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY请求体
对话模型名称
gemini-3.1-flash-lite-preview "gemini-3.1-flash-lite-preview"
对话消息列表,支持多轮对话和多模态输入
1是否以流式方式返回响应
true: 流式返回,逐块实时返回内容false: 等待完整响应后一次性返回
false
生成回复的最大 completion token 数量,对应 Gemini 的 maxOutputTokens。
1 <= x <= 655362000
生成回复的最大 token 数量,兼容旧版 OpenAI 参数。
1 <= x <= 655362000
采样温度,控制输出的随机性
说明:
- 较低值(如 0.2): 更确定、更聚焦的输出
- 较高值(如 1.5): 更随机、更有创意的输出
0 <= x <= 20.7
核采样(Nucleus Sampling)参数
说明:
- 控制从累积概率前多少的token中采样
- 例如 0.9 表示从累积概率达到90%的token中选择
- 默认值: 1.0(考虑所有token)
建议: 不要同时调整 temperature 和 top_p
0 <= x <= 10.9
重复 token 惩罚系数,范围 -2 到 2,对应 Gemini 的 frequencyPenalty。
-2 <= x <= 20
已出现 token 惩罚系数,范围 -2 到 2,对应 Gemini 的 presencePenalty。
-2 <= x <= 20
停止序列,支持字符串或字符串数组,对应 Gemini 的 stopSequences。
生成候选数量
x >= 11
限制思考工作量。Gemini 3 仅支持 low/high 思考层级,medium 会映射到更高一级,且不支持 none。
low, medium, high "medium"
用于尽可能复现输出的随机种子,对应 Gemini 的 seed。
12345
是否返回 token 的 logprob 信息,对应 Gemini 的 responseLogprobs。
true
每个 token 返回的 top logprob 数量,对应 Gemini 的 logprobs。
0 <= x <= 205
响应格式设置,支持 JSON mode 与 JSON Schema,对应 Gemini 的 responseMimeType、responseSchema 和 responseJsonSchema。
- Option 1
- Option 2
流式响应的选项。当 stream 为 true 时,可设置此字段
工具定义列表,用于 Function Calling
控制工具调用行为
none, auto, required Gemini 扩展参数