Zum Hauptinhalt springen
POST
/
v1
/
messages
curl --request POST \
  --url https://direct.evolink.ai/v1/messages \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "max_tokens": 1024,
  "messages": [
    {
      "role": "user",
      "content": "Hallo, Welt"
    }
  ]
}
'
{
  "id": "066a381bdc3c0ded310e27c9a46d16e7",
  "type": "message",
  "role": "assistant",
  "model": "MiniMax-M3",
  "content": [
    {
      "type": "thinking",
      "thinking": "Der Benutzer fragt nach der Hauptstadt von Japan, was eine grundlegende Geografiefrage ist. Die Antwort lautet Tokio, ich kann sie direkt geben.",
      "signature": "066a381bdc3c0ded310e27c9a46d16e7"
    },
    {
      "type": "text",
      "text": "Die Hauptstadt von Japan ist **Tokio**."
    }
  ],
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 7,
    "output_tokens": 77,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL: Die Standard-BaseURL ist https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.

Autorisierungen

Authorization
string
header
erforderlich

##Alle APIs erfordern eine Bearer-Token-Authentifizierung##

API-Key erhalten:

Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Hinweis: EvoLink verwendet für /v1/messages einheitlich die Bearer-Token-Authentifizierung.

Body

application/json
model
enum<string>
erforderlich

Aufzurufendes Modell

Verfügbare Optionen:
MiniMax-M3
Beispiel:

"MiniMax-M3"

messages
object[]
erforderlich

Liste der Konversationsnachrichten, abwechselnd user- / assistant-Runden

Hinweise:

  • Muss mindestens 1 Nachricht enthalten
  • Die letzte Nachricht ist typischerweise role=user
Minimum array length: 1
max_tokens
integer

Obergrenze für die Länge des generierten Inhalts (in Tokens)

Hinweise:

  • MiniMax-M3 empfohlen 131.072 (128K), maximal 524.288 (512K)
  • Vom Nachdenken erzeugte Tokens zählen ebenfalls zu dieser Grenze
  • Inhalte, die die Grenze überschreiten, werden abgeschnitten; wenn die Generierung aufgrund von length unterbrochen wird, versuchen Sie, diesen Wert zu erhöhen
Erforderlicher Bereich: 1 <= x <= 524288
Beispiel:

1024

system

System-Prompt, dient zum Festlegen der Rolle und des Verhaltens der KI

Hinweise:

  • Unterstützt eine Zeichenkette oder ein Array von Zeichenketten
  • Wird über das system-Feld der obersten Ebene übergeben
Beispiel:

"You are a helpful assistant."

temperature
number
Standard:1

Sampling-Temperatur

Hinweise:

  • Bereich: [0, 2]
  • Standard 1; höhere Werte erzeugen divergentere Ausgaben, niedrigere Werte erzeugen deterministischere Ausgaben
Erforderlicher Bereich: 0 <= x <= 2
Beispiel:

1

top_p
number
Standard:0.95

Nucleus-Sampling-Schwellenwert

Hinweise:

  • Bereich: [0, 1], MiniMax-M3 Standard 0,95
  • Es wird empfohlen, temperature und top_p nicht gleichzeitig anzupassen
Erforderlicher Bereich: 0 <= x <= 1
Beispiel:

0.95

stream
boolean
Standard:false

Ob über SSE-Streaming zurückgegeben wird

  • true: Server-Sent Events Streaming-Antwort
  • false: Wartet auf die vollständige Antwort, bevor sie zurückgegeben wird (Standard)
Beispiel:

false

thinking
object

Steuert tiefes Nachdenken. Wenn Nachdenken aktiviert ist, müssen Thinking-Blöcke in Mehrrundengesprächen unverändert zurückgegeben werden

Hinweise:

  • Standardwert adaptive: Das Modell entscheidet adaptiv anhand der Schwierigkeit des Problems, ob tiefes Nachdenken eingesetzt wird
  • Wenn aktiviert, enthält das Antwort-content-Array einen Reasoning-Block mit type="thinking" (wird als Ausgabe-Tokens berechnet)
tools
object[]

Liste der Werkzeugdefinitionen

Hinweise:

  • Folgt der Anthropic-Werkzeugdefinitionsspezifikation
  • input_schema verwendet ein JSON-Schema-Objekt
tool_choice
object

Strategie zur Werkzeugauswahl. Es werden nur auto und none unterstützt

metadata
object

Anfrage-Metadaten

Antwort

Message-Objekt

Nachrichtenantwort im Anthropic-Stil

id
string

Eindeutige Nachrichten-ID

type
enum<string>

Typ des Antwortobjekts

Verfügbare Optionen:
message
role
enum<string>
Verfügbare Optionen:
assistant
model
string

Tatsächlich verwendetes Modell

Beispiel:

"MiniMax-M3"

content
object[]

Liste der Antwortinhaltsblöcke

Mögliche Blocktypen:

  • thinking: Reasoning-Prozess (nur wenn Nachdenken aktiv ist)
  • text: Endgültiger Antworttext
  • tool_use: Vom Modell initiierter Werkzeugaufruf
stop_reason
enum<string>

Stoppgrund

  • end_turn: Natürlicher Abschluss
  • max_tokens: max_tokens-Limit erreicht
  • tool_use: Modell hat einen Werkzeugaufruf ausgelöst
Verfügbare Optionen:
end_turn,
max_tokens,
tool_use
usage
object

Token-Nutzungsstatistik (Anthropic-Spezifikation)