curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "Bitte stelle dich vor"
    }
  ]
}
'

{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hallo! Ich bin GLM-5.2 und kann dir bei Konversation, Schlussfolgern, Schreiben, Programmieren und vielen weiteren Aufgaben helfen.",
        "reasoning_content": "Lass mich dieses Problem zunächst analysieren...",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}

GLM-5.2

GLM-5.2 - OpenAI-kompatible API

Verwenden Sie das OpenAI Chat Completions-Protokoll, um das GLM-5.2 Modell aufzurufen
Synchroner Verarbeitungsmodus, gibt Konversationsinhalte in Echtzeit zurück
Reine Textkonversation: Einzelrunden- oder Mehrrundenkontext-Dialog
System-Prompts: Passen Sie Rolle und Verhalten der KI über role=system-Nachrichten an
Tiefes Nachdenken: Schaltet die Gedankenkette über thinking.type ein/aus, reasoning_effort reguliert die Intensität des Schlussfolgerns; der Denkprozess wird über reasoning_content zurückgegeben
Streaming-Ausgabe: Unterstützt SSE-Streaming-Antworten (stream=true)
Werkzeugaufrufe: Unterstützt Function Calling, Wissensdatenbank-Abruf (retrieval), Websuche (web_search) und MCP (bis zu 128 Werkzeuge)
Strukturierte Ausgabe: Aktivieren Sie den JSON-Modus über response_format

Hinweise zur Streaming-Antwort: Wenn stream=true, erfolgt die Rückgabe über Server-Sent Events, wobei jede Nachricht das Format data: {JSON} hat und am Ende data: [DONE] zurückgegeben wird. Jeder Datenblock (ChatCompletionChunk) enthält id, created, model, choices, optional usage und content_filter; dabei gibt choices[].delta inkrementell role / content / reasoning_content / tool_calls zurück, und choices[].finish_reason nennt im letzten Block den Abschlussgrund.

POST

chat

completions

curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "Bitte stelle dich vor"
    }
  ]
}
'

{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hallo! Ich bin GLM-5.2 und kann dir bei Konversation, Schlussfolgern, Schreiben, Programmieren und vielen weiteren Aufgaben helfen.",
        "reasoning_content": "Lass mich dieses Problem zunächst analysieren...",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}

BaseURL: Die Standard-BaseURL ist https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.

Autorisierungen

Authorization

string

header

erforderlich

##Alle APIs erfordern eine Bearer-Token-Authentifizierung##

API-Key erhalten:

Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Body

application/json

model

enum<string>

Standard:glm-5.2

erforderlich

Code des aufgerufenen Modells

glm-5.2: Neuestes Flaggschiff-Modell, bietet komplexes Schlussfolgern, extrem langen Kontext und höchste Inferenzgeschwindigkeit

Verfügbare Optionen:

glm-5.2

Beispiel:

"glm-5.2"

messages

(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]

erforderlich

Liste der Konversationsnachrichten, enthält die vollständigen Kontextinformationen des aktuellen Gesprächs

Unterstützt vier Rollen: system, user, assistant, tool. Nachrichten mit unterschiedlichen Rollen haben unterschiedliche Feldstrukturen; wählen Sie die entsprechende Rolle zur Ansicht aus. Mindestens 1 Nachricht erforderlich, und es dürfen nicht ausschließlich System- oder Assistentennachrichten enthalten sein.

Minimum array length: 1

System Message
User Message
Assistant Message
Tool Message

Show child attributes

stream

boolean

Standard:false

Ob der Streaming-Ausgabemodus aktiviert wird

false: Das Modell gibt die vollständige Antwort nach der Generierung auf einmal zurück (Standard), geeignet für kurze Texte und Stapelverarbeitung
true: Gibt über Server-Sent Events (SSE) in Echtzeit blockweise zurück, geeignet für Chat und lange Texte; am Ende des Streams wird data: [DONE] zurückgegeben

Beispiel:

false

thinking

object

Steuert, ob die Gedankenkette (Chain of Thought) aktiviert wird

Show child attributes

reasoning_effort

enum<string>

Standard:max

Steuert den Grad des Schlussfolgerns des Modells (exklusive Fähigkeit von GLM-5.2)

Hinweise:

Nur wirksam, wenn thinking aktiviert ist, Standard max
Werte von stark nach schwach: max > xhigh > high > medium > low > minimal > none

GLM-5.2 Zuordnungsregeln (zur Kompatibilität mit anderen Protokollen):

xhigh → entspricht max
low / medium → entspricht high
none / minimal → verzichtet auf Nachdenken (kein tiefes Schlussfolgern)

Verfügbare Optionen:

max,

xhigh,

high,

medium,

low,

minimal,

none

Beispiel:

"max"

do_sample

boolean

Standard:true

Ob eine Sampling-Strategie aktiviert wird

true (Standard): Verwendet temperature / top_p für zufälliges Sampling, vielfältigere Ausgabe
false: Wählt stets das Wort mit der höchsten Wahrscheinlichkeit (Greedy Decoding), deterministischere Ausgabe; in diesem Fall werden temperature und top_p ignoriert

Für Aufgaben, die Konsistenz und Reproduzierbarkeit erfordern (z. B. Codegenerierung, Übersetzung), wird false empfohlen

Beispiel:

true

temperature

number<float>

Standard:1

Sampling-Temperatur, steuert Zufälligkeit und Kreativität der Ausgabe

Hinweise:

Wertebereich: [0.0, 1.0], auf zwei Dezimalstellen begrenzt
Höhere Werte (z. B. 0,8): Zufälliger und kreativer, geeignet für kreatives Schreiben
Niedrigere Werte (z. B. 0,2): Stabiler und deterministischer, geeignet für faktenbasierte Fragen und Codegenerierung
GLM-5.2 Standardwert: 1.0

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0 <= x <= 1

Beispiel:

1

top_p

number<float>

Standard:0.95

Nucleus-Sampling-Parameter, eine Alternative zum temperature-Sampling

Hinweise:

Wertebereich: [0.01, 1.0], auf zwei Dezimalstellen begrenzt
Das Modell berücksichtigt nur Kandidatenwörter, deren kumulative Wahrscheinlichkeit top_p erreicht; z. B. bedeutet 0,1, dass nur die wahrscheinlichsten 10 % der Wörter berücksichtigt werden
Kleinere Werte erzeugen fokussiertere, konsistentere Ausgabe; größere Werte erhöhen die Vielfalt
GLM-5.2 Standardwert: 0.95

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0.01 <= x <= 1

Beispiel:

0.95

max_tokens

integer

Obergrenze für die Anzahl der vom Modell ausgegebenen Tokens

Hinweise:

GLM-5.2 unterstützt maximal 131.072 Tokens (128K) Ausgabelänge, empfohlen wird ein Wert von mindestens 1024
Bei aktiviertem thinking zählen auch die Tokens der Gedankenkette zu dieser Obergrenze
Wenn die Generierung aus dem Grund length abgeschnitten wird, versuchen Sie, diesen Wert zu erhöhen

Erforderlicher Bereich: 1 <= x <= 131072

Beispiel:

1024

tools

(Function-Werkzeug · object | Retrieval-Werkzeug (Wissensdatenbank-Abruf) · object | Web-Search-Werkzeug (Websuche) · object | MCP-Werkzeug · object)[]

Liste der Werkzeuge, die das Modell aufrufen kann

Hinweise:

Unterstützt Function Calling (function), Wissensdatenbank-Abruf (retrieval), Websuche (web_search) und MCP (mcp)
Unterstützt bis zu 128 Funktionen

Maximum array length: 128

Function-Werkzeug
Retrieval-Werkzeug (Wissensdatenbank-Abruf)
Web-Search-Werkzeug (Websuche)
MCP-Werkzeug

Show child attributes

tool_choice

enum<string>

Standard:auto

Steuert, wie das Modell auswählt, welche Funktion aufgerufen wird

Hinweise: Nur wirksam, wenn der Werkzeugtyp function ist; standardmäßig und ausschließlich wird auto unterstützt (das Modell entscheidet automatisch, ob ein Werkzeug aufgerufen wird)

Verfügbare Optionen:

auto

Beispiel:

"auto"

stop

string[]

Liste der Stoppwörter

Hinweise:

Wenn der generierte Text auf eine angegebene Zeichenkette trifft, wird die Generierung sofort gestoppt (das Stoppwort selbst ist im zurückgegebenen Text nicht enthalten)
Derzeit wird nur ein einzelnes Stoppwort unterstützt, im Format ["stop_word1"], z. B. ["Human:"]

Maximum array length: 4

Beispiel:

["Human:"]

response_format

object

Gibt das Ausgabeformat der Modellantwort an, Standard ist text

Hinweise:

{ "type": "json_object" } aktiviert den JSON-Modus, das Modell gibt gültige Daten im JSON-Format zurück, geeignet für Szenarien wie strukturierte Datenextraktion
Bei Verwendung des JSON-Modus wird empfohlen, in der system- oder user-Nachricht ausdrücklich JSON-Ausgabe zu verlangen

Show child attributes

request_id

string

Eindeutige Kennung der Anfrage

Hinweise:

Wird von der Clientseite übergeben, Länge 6-64 Zeichen, zur Sicherstellung der Eindeutigkeit wird das UUID-Format empfohlen
Wird sie nicht angegeben, generiert die Plattform sie automatisch

Required string length: 6 - 64

Beispiel:

"req-7f3a2c1e8b9d4f0a"

user_id

string

Eindeutige Kennung des Endbenutzers

Hinweise: Länge 6-128 Zeichen, empfohlen wird eine eindeutige Kennung ohne sensible Informationen; sie hilft der Plattform, Missbrauch zu überwachen und zu erkennen

Required string length: 6 - 128

Beispiel:

"user-abc123456"

Antwort

Chat-Vervollständigung erfolgreich

string

Aufgaben-ID

Beispiel:

"chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a"

object

enum<string>

Antworttyp

Verfügbare Optionen:

chat.completion

Beispiel:

"chat.completion"

request_id

string

Anfrage-ID (wird zurückgegeben, wenn in der Anfrage request_id angegeben wurde)

Beispiel:

"req-7f3a2c1e8b9d4f0a"

created

integer

Erstellungszeit der Anfrage, Unix-Zeitstempel (Sekunden)

Beispiel:

1777021417

model

string

Modellname

Beispiel:

"glm-5.2"

choices

object[]

Liste der Modellantworten

Show child attributes

usage

object

Token-Nutzungsstatistik, die bei Abschluss des Aufrufs zurückgegeben wird

Show child attributes

web_search

object[]

Informationen zur Websuche, werden zurückgegeben, wenn das web_search-Werkzeug verwendet wird und eine Suche getroffen wird

Show child attributes

content_filter

object[]

Informationen zur Inhaltssicherheit

Show child attributes

MiniMax-M2.5 - Vollständige API-Referenz Guthabennutzung abrufen