Zum Hauptinhalt springen
POST
/
v1
/
messages
curl --request POST \ --url https://direct.evolink.ai/v1/messages \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "MiniMax-M3", "max_tokens": 1024, "messages": [ { "role": "user", "content": "Hallo, Welt" } ] } '
{ "id": "066a381bdc3c0ded310e27c9a46d16e7", "type": "message", "role": "assistant", "model": "MiniMax-M3", "content": [ { "type": "thinking", "thinking": "Der Benutzer fragt nach der Hauptstadt von Japan, was eine grundlegende Geografiefrage ist. Die Antwort lautet Tokio, ich kann sie direkt geben.", "signature": "066a381bdc3c0ded310e27c9a46d16e7" }, { "type": "text", "text": "Die Hauptstadt von Japan ist **Tokio**." } ], "stop_reason": "end_turn", "usage": { "input_tokens": 7, "output_tokens": 77, "cache_creation_input_tokens": 0, "cache_read_input_tokens": 0 } }
BaseURL: Die Standard-BaseURL ist https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.

Autorisierungen

Authorization
string
header
erforderlich

##Alle APIs erfordern eine Bearer-Token-Authentifizierung##

API-Key erhalten:

Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Hinweis: EvoLink verwendet für /v1/messages einheitlich die Bearer-Token-Authentifizierung.

Body

application/json
model
enum<string>
erforderlich

Aufzurufendes Modell

Verfügbare Optionen:
MiniMax-M3
Beispiel:

"MiniMax-M3"

messages
object[]
erforderlich

Liste der Konversationsnachrichten, abwechselnd user- / assistant-Runden

Hinweise:

  • Muss mindestens 1 Nachricht enthalten
  • Die letzte Nachricht ist typischerweise role=user
Minimum array length: 1
max_tokens
integer

Obergrenze für die Länge des generierten Inhalts (in Tokens)

Hinweise:

  • MiniMax-M3 empfohlen 131.072 (128K), maximal 524.288 (512K)
  • Vom Nachdenken erzeugte Tokens zählen ebenfalls zu dieser Grenze
  • Inhalte, die die Grenze überschreiten, werden abgeschnitten; wenn die Generierung aufgrund von length unterbrochen wird, versuchen Sie, diesen Wert zu erhöhen
Erforderlicher Bereich: 1 <= x <= 524288
Beispiel:

1024

system

System-Prompt, dient zum Festlegen der Rolle und des Verhaltens der KI

Hinweise:

  • Unterstützt eine Zeichenkette oder ein Array von Zeichenketten
  • Wird über das system-Feld der obersten Ebene übergeben
Beispiel:

"You are a helpful assistant."

temperature
number
Standard:1

Sampling-Temperatur

Hinweise:

  • Bereich: [0, 2]
  • Standard 1; höhere Werte erzeugen divergentere Ausgaben, niedrigere Werte erzeugen deterministischere Ausgaben
Erforderlicher Bereich: 0 <= x <= 2
Beispiel:

1

top_p
number
Standard:0.95

Nucleus-Sampling-Schwellenwert

Hinweise:

  • Bereich: [0, 1], MiniMax-M3 Standard 0,95
  • Es wird empfohlen, temperature und top_p nicht gleichzeitig anzupassen
Erforderlicher Bereich: 0 <= x <= 1
Beispiel:

0.95

stream
boolean
Standard:false

Ob über SSE-Streaming zurückgegeben wird

  • true: Server-Sent Events Streaming-Antwort
  • false: Wartet auf die vollständige Antwort, bevor sie zurückgegeben wird (Standard)
Beispiel:

false

thinking
object

Steuert tiefes Nachdenken. Wenn Nachdenken aktiviert ist, müssen Thinking-Blöcke in Mehrrundengesprächen unverändert zurückgegeben werden

Hinweise:

  • Standardwert adaptive: Das Modell entscheidet adaptiv anhand der Schwierigkeit des Problems, ob tiefes Nachdenken eingesetzt wird
  • Wenn aktiviert, enthält das Antwort-content-Array einen Reasoning-Block mit type="thinking" (wird als Ausgabe-Tokens berechnet)
tools
object[]

Liste der Werkzeugdefinitionen

Hinweise:

  • Folgt der Anthropic-Werkzeugdefinitionsspezifikation
  • input_schema verwendet ein JSON-Schema-Objekt
tool_choice
object

Strategie zur Werkzeugauswahl. Es werden nur auto und none unterstützt

metadata
object

Anfrage-Metadaten

Antwort

Message-Objekt

Nachrichtenantwort im Anthropic-Stil

id
string

Eindeutige Nachrichten-ID

type
enum<string>

Typ des Antwortobjekts

Verfügbare Optionen:
message
role
enum<string>
Verfügbare Optionen:
assistant
model
string

Tatsächlich verwendetes Modell

Beispiel:

"MiniMax-M3"

content
object[]

Liste der Antwortinhaltsblöcke

Mögliche Blocktypen:

  • thinking: Reasoning-Prozess (nur wenn Nachdenken aktiv ist)
  • text: Endgültiger Antworttext
  • tool_use: Vom Modell initiierter Werkzeugaufruf
stop_reason
enum<string>

Stoppgrund

  • end_turn: Natürlicher Abschluss
  • max_tokens: max_tokens-Limit erreicht
  • tool_use: Modell hat einen Werkzeugaufruf ausgelöst
Verfügbare Optionen:
end_turn,
max_tokens,
tool_use
usage
object

Token-Nutzungsstatistik (Anthropic-Spezifikation)