GLM-5.2 - Anthropic-kompatible API
- Ruft das GLM-5.2 Modell über das Anthropic Messages-Protokoll auf
- Anfrage-/Antwortstruktur ist an die Anthropic API angeglichen
- System-Prompt: Wird über das Top-Level-Feld
systemübergeben - Nachdenkmodus: GLM-5.2 aktiviert das Nachdenken standardmäßig, der Denkinhalt wird über einen
content[type=thinking]-Block zurückgegeben; übergeben Siethinking.type=disabledzum Abschalten - Streaming-Ausgabe: SSE-Ereignisstrom
- Werkzeugaufrufe: Kompatibel mit dem Anthropic
tool_use/tool_result-Ablauf - ⚠️ Keine Multimodalität: GLM-5.2 ist ein reines Textmodell, Bild-/Videoinhaltsblöcke werden ignoriert
https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.Autorisierungen
##Alle APIs erfordern eine Bearer-Token-Authentifizierung##
API-Key erhalten:
Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten
Zum Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYAnmerkung: EvoLink verwendet für /v1/messages einheitlich die Bearer-Token-Authentifizierung.
Body
Das aufzurufende Modell
glm-5.2 "glm-5.2"
Liste der Konversationsnachrichten, im Wechsel von user / assistant pro Runde
Hinweise:
- Enthält mindestens 1 Nachricht
- Die letzte Nachricht hat üblicherweise
role=user - Unterstützt mehrrundigen Kontext, das Modell bezieht sich auf den Verlauf
1Gibt die Obergrenze der Länge des generierten Inhalts an (Anzahl Tokens)
Hinweise:
- Die durch thinking erzeugten Tokens zählen ebenfalls zu dieser Obergrenze
- Beim Erreichen der Obergrenze wird der Inhalt abgeschnitten, die Antwort liefert
stop_reason=max_tokens
x >= 11024
System-Prompt, dient zum Festlegen von Rolle und Verhalten der KI
Hinweise:
- Unterstützt eine Zeichenkette oder ein Array von Inhaltsblöcken
- Wird über das Top-Level-Feld
systemübergeben (nicht in messages legen) - Das Modell folgt den system-Vorgaben
- ⚠️ Ein zu langer system kann abgeschnitten werden: Für langen Kontext legen Sie diesen in
messages, häufen Sie nicht alles imsysteman
"You are a helpful assistant."
Sampling-Temperatur
Hinweise:
- Je höher der Wert, desto vielfältiger die Ausgabe; je niedriger, desto deterministischer
- Empfohlener Bereich
[0, 1]
0 <= x <= 11
Nucleus-Sampling-Schwelle
Hinweise:
- Bereich
[0, 1] - Es wird empfohlen, temperature und top_p nicht gleichzeitig anzupassen
0 <= x <= 10.9
Sampling nur aus den K Tokens mit der höchsten Wahrscheinlichkeit (Anthropic-spezifischer Parameter)
Hinweise:
- Je kleiner der Wert, desto deterministischer die Ausgabe; je größer, desto vielfältiger die Kandidaten
x >= 010
Benutzerdefinierte Stoppsequenzen: Die Generierung stoppt, sobald eine der Zeichenketten getroffen wird
Hinweise:
- Bei einem Treffer wird abgeschnitten, der Inhalt vor der Trefferstelle wird normal zurückgegeben
- ⚠️ Achtung: Beim Treffen einer Stoppsequenz liefert GLM-5.2 für
stop_reasonden Wertend_turn(statt des Anthropic-Standardwertsstop_sequence), und die Antwort enthält auch keinstop_sequence-Feld. Wenn ein Client zur Trefferbestimmung aufstop_reason=="stop_sequence"angewiesen ist, ist eine Sonderbehandlung nötig
["\n\n"]Ob als SSE-Stream zurückgegeben wird
true: Streaming-Rückgabe über Server-Sent Events (Standard-Anthropic-Ereignissequenz: message_start / content_block_start / content_block_delta / message_delta / message_stop)false: Gibt nach vollständiger Antwort alles auf einmal zurück (Standard)
false
Steuert das tiefe Nachdenken
Hinweise:
- GLM-5.2 ist ein Schlussfolgerungsmodell, wird dieses Feld nicht übergeben, ist das Nachdenken standardmäßig aktiviert
- Bei Aktivierung erscheint im
content-Array der Antwort ein Block des Denkprozesses mittype="thinking"(wird nach Output-Tokens abgerechnet,signaturekann eine leere Zeichenkette sein) - Die Übergabe von
{"type":"disabled"}schaltet das Nachdenken ab und reduziert die Output-Tokens erheblich - ⚠️ Nur der binäre
type-Schalter ist wirksam: Parameter für Denkbudget/-stufe wiebudget_tokens,effortgreifen nicht (werden ignoriert), eine feine Steuerung der Denkmenge ist nicht möglich
Liste der Werkzeugdefinitionen
Hinweise:
- Folgt der Anthropic-Werkzeugdefinitionsspezifikation
input_schemaverwendet ein JSON-Schema-Objekt- Das Modell gibt einen Standard-
tool_use-Block zurück,stop_reason=tool_use
Strategie der Werkzeugauswahl
Anfrage-Metadaten
Antwort
Nachrichtenobjekt
Nachrichtenantwort im Anthropic-Stil
Eindeutige Nachrichten-ID (Format: msg_<uuid>)
Typ des Antwortobjekts
message assistant Tatsächlich verwendetes Modell
"glm-5.2"
Liste der Antwortinhaltsblöcke
Mögliche block type:
thinking: Denkprozess (wenn das Nachdenken aktiviert ist, standardmäßig aktiviert)text: finaler Antworttexttool_use: vom Modell ausgelöster Werkzeugaufruf
Stoppgrund
end_turn: natürliches Ende (⚠️ wird auch beim Treffen von stop_sequences zurückgegeben)max_tokens: max_tokens-Obergrenze erreichttool_use: Das Modell löst einen Werkzeugaufruf aus
end_turn, max_tokens, tool_use Token-Nutzungsstatistik (Anthropic-Spezifikation)