MiniMax-M3 - Anthropic-kompatible API
- Verwenden Sie das Anthropic Messages-Protokoll, um das MiniMax-M3 Modell aufzurufen
- Anfrage- / Antwortstruktur richtet sich nach der Anthropic API
- Multimodales Gespräch:
contentunterstützt Text- und Bildinhaltsblöcke - System-Prompts: Werden über das Feld
systemder obersten Ebene übergeben - Denkmodus: Wird über das
thinking-Objekt gesteuert; der Denkinhalt wird über einencontent[type=thinking]-Block zurückgegeben - Streaming-Ausgabe: SSE-Event-Stream
- Werkzeugaufrufe: Kompatibel mit dem Anthropic
tool_use/tool_result-Ablauf
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://direct.evolink.ai, die Textmodelle und langlebige Verbindungen besser unterstützt. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient als Ausweichadresse für Textmodelle.Autorisierungen
##Alle APIs erfordern eine Bearer-Token-Authentifizierung##
API-Key erhalten:
Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten
Zum Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYHinweis: EvoLink verwendet für /v1/messages einheitlich die Bearer-Token-Authentifizierung.
Body
Aufzurufendes Modell
MiniMax-M3 "MiniMax-M3"
Liste der Konversationsnachrichten, abwechselnd user- / assistant-Runden
Hinweise:
- Muss mindestens 1 Nachricht enthalten
- Die letzte Nachricht ist typischerweise
role=user
1Obergrenze für die Länge des generierten Inhalts (in Tokens)
Hinweise:
- MiniMax-M3 empfohlen 131.072 (128K), maximal 524.288 (512K)
- Vom Nachdenken erzeugte Tokens zählen ebenfalls zu dieser Grenze
- Inhalte, die die Grenze überschreiten, werden abgeschnitten; wenn die Generierung aufgrund von
lengthunterbrochen wird, versuchen Sie, diesen Wert zu erhöhen
1 <= x <= 5242881024
System-Prompt, dient zum Festlegen der Rolle und des Verhaltens der KI
Hinweise:
- Unterstützt eine Zeichenkette oder ein Array von Zeichenketten
- Wird über das
system-Feld der obersten Ebene übergeben
"You are a helpful assistant."
Sampling-Temperatur
Hinweise:
- Bereich:
[0, 2] - Standard 1; höhere Werte erzeugen divergentere Ausgaben, niedrigere Werte erzeugen deterministischere Ausgaben
0 <= x <= 21
Nucleus-Sampling-Schwellenwert
Hinweise:
- Bereich:
[0, 1], MiniMax-M3 Standard 0,95 - Es wird empfohlen, temperature und top_p nicht gleichzeitig anzupassen
0 <= x <= 10.95
Ob über SSE-Streaming zurückgegeben wird
true: Server-Sent Events Streaming-Antwortfalse: Wartet auf die vollständige Antwort, bevor sie zurückgegeben wird (Standard)
false
Steuert tiefes Nachdenken. Wenn Nachdenken aktiviert ist, müssen Thinking-Blöcke in Mehrrundengesprächen unverändert zurückgegeben werden
Hinweise:
- Standardwert
adaptive: Das Modell entscheidet adaptiv anhand der Schwierigkeit des Problems, ob tiefes Nachdenken eingesetzt wird - Wenn aktiviert, enthält das Antwort-
content-Array einen Reasoning-Block mittype="thinking"(wird als Ausgabe-Tokens berechnet)
Liste der Werkzeugdefinitionen
Hinweise:
- Folgt der Anthropic-Werkzeugdefinitionsspezifikation
input_schemaverwendet ein JSON-Schema-Objekt
Strategie zur Werkzeugauswahl. Es werden nur auto und none unterstützt
Anfrage-Metadaten
Antwort
Message-Objekt
Nachrichtenantwort im Anthropic-Stil
Eindeutige Nachrichten-ID
Typ des Antwortobjekts
message assistant Tatsächlich verwendetes Modell
"MiniMax-M3"
Liste der Antwortinhaltsblöcke
Mögliche Blocktypen:
thinking: Reasoning-Prozess (nur wenn Nachdenken aktiv ist)text: Endgültiger Antworttexttool_use: Vom Modell initiierter Werkzeugaufruf
Stoppgrund
end_turn: Natürlicher Abschlussmax_tokens: max_tokens-Limit erreichttool_use: Modell hat einen Werkzeugaufruf ausgelöst
end_turn, max_tokens, tool_use Token-Nutzungsstatistik (Anthropic-Spezifikation)