Zum Hauptinhalt springen
POST
/
v1
/
chat
/
completions
curl --request POST \ --url https://direct.evolink.ai/v1/chat/completions \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "MiniMax-M3", "messages": [ { "role": "user", "content": "Bitte stelle dich vor" } ] } '
{ "id": "066b36619b147e326d17053cccdef70f", "choices": [ { "finish_reason": "stop", "index": 0, "message": { "content": "<think>\nDer Benutzer fragt nach der Hauptstadt von Frankreich, was eine Allgemeinwissensfrage ist. Die Antwort lautet Paris.\n</think>\nDie Hauptstadt von Frankreich ist **Paris**.", "role": "assistant", "name": "MiniMax AI", "audio_content": "" } } ], "created": 1777026807, "model": "MiniMax-M3", "object": "chat.completion", "usage": { "total_tokens": 60, "total_characters": 0, "prompt_tokens": 7, "completion_tokens": 53, "prompt_tokens_details": { "cached_tokens": 0 } }, "input_sensitive": false, "output_sensitive": false, "input_sensitive_type": 0, "output_sensitive_type": 0, "base_resp": { "status_code": 0, "status_msg": "" } }

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL: Die Standard-BaseURL ist https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.

Autorisierungen

Authorization
string
header
erforderlich

##Alle APIs erfordern eine Bearer-Token-Authentifizierung##

API-Key erhalten:

Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Body

application/json
model
enum<string>
erforderlich

Name des Chat-Modells

Verfügbare Optionen:
MiniMax-M3
Beispiel:

"MiniMax-M3"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
erforderlich

Liste der Konversationsnachrichten, unterstützt Mehrrundendialog

Nachrichten mit unterschiedlichen Rollen haben unterschiedliche Feldstrukturen; wählen Sie die entsprechende Rolle zur Ansicht aus

Minimum array length: 1
thinking
object

Steuert tiefes Nachdenken

Hinweise:

  • Standardwert adaptive: Das Modell entscheidet adaptiv anhand der Schwierigkeit des Problems, ob tiefes Nachdenken eingesetzt wird
  • Standardmäßig wird der Denkinhalt inline in das Antwort-content eingebettet (umschlossen von <think>...</think>-Tags); um ihn in ein eigenes Feld auszulagern, verwenden Sie reasoning_split
reasoning_split
boolean

Ob der Denkinhalt in ein separates Feld ausgelagert wird

  • false (Standard): Der Denkinhalt wird inline in content eingebettet, umschlossen von <think>...</think>-Tags
  • true: Der Denkinhalt wird in choices[].message.reasoning_content und reasoning_details ausgelagert
temperature
number
Standard:1

Sampling-Temperatur, steuert die Zufälligkeit der Ausgabe

Hinweise:

  • Niedrigere Werte (z. B. 0,2): Deterministischere, fokussiertere Ausgabe
  • Höhere Werte (z. B. 1,5): Zufälligere, kreativere Ausgabe
  • Bereich: [0, 2], Standard 1
Erforderlicher Bereich: 0 <= x <= 2
Beispiel:

1

top_p
number
Standard:0.95

Nucleus-Sampling-Parameter

Hinweise:

  • Steuert das Sampling aus Tokens mit kumulativer Wahrscheinlichkeit
  • z. B. 0,95 bedeutet die Auswahl aus Tokens, die 95 % kumulative Wahrscheinlichkeit erreichen
  • Bereich: [0, 1], MiniMax-M3 Standard 0,95

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0 <= x <= 1
Beispiel:

0.95

max_completion_tokens
integer

Obergrenze für die Länge des generierten Inhalts (in Tokens)

Hinweise:

  • MiniMax-M3 empfohlen 131.072 (128K), maximal 524.288 (512K)
  • Vom Nachdenken erzeugte Tokens zählen ebenfalls zu dieser Grenze
  • Wenn die Generierung aufgrund von length unterbrochen wird, versuchen Sie, diesen Wert zu erhöhen
Erforderlicher Bereich: 1 <= x <= 524288
Beispiel:

131072

stream
boolean
Standard:false

Ob die Antwort im Streaming-Modus zurückgegeben wird

  • true: Streaming-Antwort, gibt Inhalte in Echtzeit-Chunks über SSE (Server-Sent Events) zurück
  • false: Wartet auf die vollständige Antwort, bevor sie zurückgegeben wird (Standard)
Beispiel:

false

stream_options
object

Optionen für die Streaming-Antwort

Nur wirksam, wenn stream=true

tools
object[]

Liste der Werkzeugdefinitionen für Function Calling

Jedes Werkzeug benötigt einen Namen, eine Beschreibung und ein Parameterschema

max_tokens
integer
veraltet

Veralteter Parameter zur Begrenzung der Generierungslänge

Hinweis: Veraltet, bitte verwenden Sie stattdessen max_completion_tokens

Erforderlicher Bereich: x >= 1

Antwort

Chat-Vervollständigung erfolgreich

id
string

Eindeutige Kennung für die Chat-Vervollständigung

Beispiel:

"0668a381bdc3c0ded310e27c9a46d16e7"

model
string

Tatsächlich verwendeter Modellname

Beispiel:

"MiniMax-M3"

object
enum<string>

Antworttyp

Verfügbare Optionen:
chat.completion
Beispiel:

"chat.completion"

created
integer

Erstellungszeitstempel (Unix-Sekunden)

Beispiel:

1777026807

choices
object[]

Liste der Chat-Vervollständigungsoptionen

usage
object

Token-Nutzungsstatistik

input_sensitive
boolean

Ob der Eingabeinhalt einen Filter für sensible Wörter ausgelöst hat. Wenn die Eingabe schwerwiegend gegen die Richtlinien verstößt, gibt die API einen Inhaltsverstoßfehler mit leerem Antwortinhalt zurück

input_sensitive_type
integer

Art des durch die Eingabe ausgelösten sensiblen Worts (wird zurückgegeben, wenn input_sensitive true ist): 1 schwerer Verstoß; 2 Pornografie; 3 Werbung; 4 verbotener Inhalt; 5 beleidigende Sprache; 6 Gewalt/Terrorismus; 7 Sonstiges

output_sensitive
boolean

Ob der Ausgabeinhalt einen Filter für sensible Wörter ausgelöst hat

output_sensitive_type
integer

Art des durch die Ausgabe ausgelösten sensiblen Worts

base_resp
object

Statuscode und Fehlerdetails