Zum Hauptinhalt springen
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "Bitte stelle dich vor"
    }
  ]
}
'
{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hallo! Ich bin GLM-5.2 und kann dir bei Konversation, Schlussfolgern, Schreiben, Programmieren und vielen weiteren Aufgaben helfen.",
        "reasoning_content": "Lass mich dieses Problem zunächst analysieren...",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}
BaseURL: Die Standard-BaseURL ist https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.

Autorisierungen

Authorization
string
header
erforderlich

##Alle APIs erfordern eine Bearer-Token-Authentifizierung##

API-Key erhalten:

Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Body

application/json
model
enum<string>
Standard:glm-5.2
erforderlich

Code des aufgerufenen Modells

  • glm-5.2: Neuestes Flaggschiff-Modell, bietet komplexes Schlussfolgern, extrem langen Kontext und höchste Inferenzgeschwindigkeit
Verfügbare Optionen:
glm-5.2
Beispiel:

"glm-5.2"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
erforderlich

Liste der Konversationsnachrichten, enthält die vollständigen Kontextinformationen des aktuellen Gesprächs

Unterstützt vier Rollen: system, user, assistant, tool. Nachrichten mit unterschiedlichen Rollen haben unterschiedliche Feldstrukturen; wählen Sie die entsprechende Rolle zur Ansicht aus. Mindestens 1 Nachricht erforderlich, und es dürfen nicht ausschließlich System- oder Assistentennachrichten enthalten sein.

Minimum array length: 1
stream
boolean
Standard:false

Ob der Streaming-Ausgabemodus aktiviert wird

  • false: Das Modell gibt die vollständige Antwort nach der Generierung auf einmal zurück (Standard), geeignet für kurze Texte und Stapelverarbeitung
  • true: Gibt über Server-Sent Events (SSE) in Echtzeit blockweise zurück, geeignet für Chat und lange Texte; am Ende des Streams wird data: [DONE] zurückgegeben
Beispiel:

false

thinking
object

Steuert, ob die Gedankenkette (Chain of Thought) aktiviert wird

reasoning_effort
enum<string>
Standard:max

Steuert den Grad des Schlussfolgerns des Modells (exklusive Fähigkeit von GLM-5.2)

Hinweise:

  • Nur wirksam, wenn thinking aktiviert ist, Standard max
  • Werte von stark nach schwach: max > xhigh > high > medium > low > minimal > none

GLM-5.2 Zuordnungsregeln (zur Kompatibilität mit anderen Protokollen):

  • xhigh → entspricht max
  • low / medium → entspricht high
  • none / minimal → verzichtet auf Nachdenken (kein tiefes Schlussfolgern)
Verfügbare Optionen:
max,
xhigh,
high,
medium,
low,
minimal,
none
Beispiel:

"max"

do_sample
boolean
Standard:true

Ob eine Sampling-Strategie aktiviert wird

  • true (Standard): Verwendet temperature / top_p für zufälliges Sampling, vielfältigere Ausgabe
  • false: Wählt stets das Wort mit der höchsten Wahrscheinlichkeit (Greedy Decoding), deterministischere Ausgabe; in diesem Fall werden temperature und top_p ignoriert

Für Aufgaben, die Konsistenz und Reproduzierbarkeit erfordern (z. B. Codegenerierung, Übersetzung), wird false empfohlen

Beispiel:

true

temperature
number<float>
Standard:1

Sampling-Temperatur, steuert Zufälligkeit und Kreativität der Ausgabe

Hinweise:

  • Wertebereich: [0.0, 1.0], auf zwei Dezimalstellen begrenzt
  • Höhere Werte (z. B. 0,8): Zufälliger und kreativer, geeignet für kreatives Schreiben
  • Niedrigere Werte (z. B. 0,2): Stabiler und deterministischer, geeignet für faktenbasierte Fragen und Codegenerierung
  • GLM-5.2 Standardwert: 1.0

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0 <= x <= 1
Beispiel:

1

top_p
number<float>
Standard:0.95

Nucleus-Sampling-Parameter, eine Alternative zum temperature-Sampling

Hinweise:

  • Wertebereich: [0.01, 1.0], auf zwei Dezimalstellen begrenzt
  • Das Modell berücksichtigt nur Kandidatenwörter, deren kumulative Wahrscheinlichkeit top_p erreicht; z. B. bedeutet 0,1, dass nur die wahrscheinlichsten 10 % der Wörter berücksichtigt werden
  • Kleinere Werte erzeugen fokussiertere, konsistentere Ausgabe; größere Werte erhöhen die Vielfalt
  • GLM-5.2 Standardwert: 0.95

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0.01 <= x <= 1
Beispiel:

0.95

max_tokens
integer

Obergrenze für die Anzahl der vom Modell ausgegebenen Tokens

Hinweise:

  • GLM-5.2 unterstützt maximal 131.072 Tokens (128K) Ausgabelänge, empfohlen wird ein Wert von mindestens 1024
  • Bei aktiviertem thinking zählen auch die Tokens der Gedankenkette zu dieser Obergrenze
  • Wenn die Generierung aus dem Grund length abgeschnitten wird, versuchen Sie, diesen Wert zu erhöhen
Erforderlicher Bereich: 1 <= x <= 131072
Beispiel:

1024

tools
(Function-Werkzeug · object | Retrieval-Werkzeug (Wissensdatenbank-Abruf) · object | Web-Search-Werkzeug (Websuche) · object | MCP-Werkzeug · object)[]

Liste der Werkzeuge, die das Modell aufrufen kann

Hinweise:

  • Unterstützt Function Calling (function), Wissensdatenbank-Abruf (retrieval), Websuche (web_search) und MCP (mcp)
  • Unterstützt bis zu 128 Funktionen
Maximum array length: 128
tool_choice
enum<string>
Standard:auto

Steuert, wie das Modell auswählt, welche Funktion aufgerufen wird

Hinweise: Nur wirksam, wenn der Werkzeugtyp function ist; standardmäßig und ausschließlich wird auto unterstützt (das Modell entscheidet automatisch, ob ein Werkzeug aufgerufen wird)

Verfügbare Optionen:
auto
Beispiel:

"auto"

stop
string[]

Liste der Stoppwörter

Hinweise:

  • Wenn der generierte Text auf eine angegebene Zeichenkette trifft, wird die Generierung sofort gestoppt (das Stoppwort selbst ist im zurückgegebenen Text nicht enthalten)
  • Derzeit wird nur ein einzelnes Stoppwort unterstützt, im Format ["stop_word1"], z. B. ["Human:"]
Maximum array length: 4
Beispiel:
["Human:"]
response_format
object

Gibt das Ausgabeformat der Modellantwort an, Standard ist text

Hinweise:

  • { "type": "json_object" } aktiviert den JSON-Modus, das Modell gibt gültige Daten im JSON-Format zurück, geeignet für Szenarien wie strukturierte Datenextraktion
  • Bei Verwendung des JSON-Modus wird empfohlen, in der system- oder user-Nachricht ausdrücklich JSON-Ausgabe zu verlangen
request_id
string

Eindeutige Kennung der Anfrage

Hinweise:

  • Wird von der Clientseite übergeben, Länge 6-64 Zeichen, zur Sicherstellung der Eindeutigkeit wird das UUID-Format empfohlen
  • Wird sie nicht angegeben, generiert die Plattform sie automatisch
Required string length: 6 - 64
Beispiel:

"req-7f3a2c1e8b9d4f0a"

user_id
string

Eindeutige Kennung des Endbenutzers

Hinweise: Länge 6-128 Zeichen, empfohlen wird eine eindeutige Kennung ohne sensible Informationen; sie hilft der Plattform, Missbrauch zu überwachen und zu erkennen

Required string length: 6 - 128
Beispiel:

"user-abc123456"

Antwort

Chat-Vervollständigung erfolgreich

id
string

Aufgaben-ID

Beispiel:

"chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a"

object
enum<string>

Antworttyp

Verfügbare Optionen:
chat.completion
Beispiel:

"chat.completion"

request_id
string

Anfrage-ID (wird zurückgegeben, wenn in der Anfrage request_id angegeben wurde)

Beispiel:

"req-7f3a2c1e8b9d4f0a"

created
integer

Erstellungszeit der Anfrage, Unix-Zeitstempel (Sekunden)

Beispiel:

1777021417

model
string

Modellname

Beispiel:

"glm-5.2"

choices
object[]

Liste der Modellantworten

usage
object

Token-Nutzungsstatistik, die bei Abschluss des Aufrufs zurückgegeben wird

Informationen zur Websuche, werden zurückgegeben, wenn das web_search-Werkzeug verwendet wird und eine Suche getroffen wird

content_filter
object[]

Informationen zur Inhaltssicherheit