Gemini 3.1 Flash Lite - OpenAI SDK - Vollständige Referenz
- Aufruf des Gemini-3.1-flash-lite-preview Modells im OpenAI SDK-Format
- Synchroner Verarbeitungsmodus, gibt Gesprächsinhalte in Echtzeit zurück
- Klartextgespräch: Einzel- oder Mehrrunden-Kontextdialog, siehe simple_text und multi_turn Beispiele in den Codebeispielen
- System-Prompt: KI-Rolle und -Verhalten anpassen, siehe system_prompt Beispiel in den Codebeispielen
- Multimodale Eingabe: Unterstützt gemischte Text- + Bildeingabe, siehe vision und multi_image Beispiele in den Codebeispielen
https://direct.evolink.ai und bietet bessere Unterstützung für Textmodelle sowie persistente Verbindungen. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient bei Textmodellen als Ausweichadresse.Autorisierungen
##Alle APIs erfordern Bearer-Token-Authentifizierung##
API-Schlüssel erhalten:
Besuchen Sie die API-Schlüsselverwaltungsseite, um Ihren API-Schlüssel zu erhalten
Zum Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYBody
Chat-Modellname
gemini-3.1-flash-lite-preview "gemini-3.1-flash-lite-preview"
Liste der Chat-Nachrichten, unterstützt Mehrrunden-Dialog und multimodale Eingabe
1Ob die Antwort im Streaming-Modus zurückgegeben werden soll
true: Streaming-Rückgabe, empfängt Inhalte in Echtzeit-Blöckenfalse: Gibt die vollständige Antwort auf einmal zurück
false
Maximum number of completion tokens for the generated response, corresponding to Gemini's maxOutputTokens.
1 <= x <= 655362000
Maximum number of tokens for the generated response, compatible with the legacy OpenAI parameter.
1 <= x <= 655362000
Sampling-Temperatur, steuert die Zufälligkeit der Ausgabe
Beschreibung:
- Niedrigere Werte (z. B. 0.2): Deterministischere, fokussiertere Ausgabe
- Höhere Werte (z. B. 1.5): Zufälligere, kreativere Ausgabe
0 <= x <= 20.7
Nucleus-Sampling-Parameter
Beschreibung:
- Steuert die Auswahl aus Tokens mit kumulativer Wahrscheinlichkeit
- Beispiel: 0,9 bedeutet Auswahl aus Tokens mit kumulativer Wahrscheinlichkeit bis zu 90 %
- Standard: 1.0 (berücksichtigt alle Tokens)
Empfehlung: temperature und top_p nicht gleichzeitig anpassen
0 <= x <= 10.9
Frequency penalty coefficient. Range: -2.0 to 2.0. Corresponds to Gemini's frequencyPenalty.
-2 <= x <= 20
Presence penalty coefficient. Range: -2.0 to 2.0. Corresponds to Gemini's presencePenalty.
-2 <= x <= 20
Stop sequences. Supports a string or string array, corresponding to Gemini's stopSequences.
Number of generated candidates.
x >= 11
Begrenzt den Denkaufwand. Gemini 3 unterstützt die Denkstufen low/high; medium wird der höheren Stufe zugeordnet und none wird nicht unterstützt.
low, medium, high "medium"
Random seed used to make output as reproducible as possible, corresponding to Gemini's seed.
12345
Whether to return token logprob information, corresponding to Gemini's responseLogprobs.
true
Number of top logprob values returned for each token, corresponding to Gemini's logprobs.
0 <= x <= 205
Response format settings, supporting JSON mode and JSON Schema, corresponding to Gemini's responseMimeType, responseSchema and responseJsonSchema.
- Option 1
- Option 2
Streaming response options. Can be set when stream is true.
List of tool definitions for Function Calling.
Controls tool-calling behavior.
none, auto, required Gemini extension parameters.
Antwort
Chat-Vervollständigung erfolgreich generiert
Eindeutiger Bezeichner für die Chat-Vervollständigung
"chatcmpl-20251010015944503180122WJNB8Eid"
Tatsächlich verwendeter Modellname
"gemini-3.1-flash-lite-preview"
Antworttyp
chat.completion "chat.completion"
Erstellungszeitstempel
1760032810
Liste der Chat-Vervollständigungsoptionen
Token-Nutzungsstatistiken