MiniMax-M3 - OpenAI-kompatible API

Autorisierungen

Authorization

string

header

erforderlich

##Alle APIs erfordern eine Bearer-Token-Authentifizierung##

API-Key erhalten:

Besuchen Sie die API-Key-Verwaltungsseite, um Ihren API-Key zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Body

application/json

model

enum<string>

erforderlich

Name des Chat-Modells

Verfügbare Optionen:

MiniMax-M3

Beispiel:

"MiniMax-M3"

messages

(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]

erforderlich

Liste der Konversationsnachrichten, unterstützt Mehrrundendialog

Nachrichten mit unterschiedlichen Rollen haben unterschiedliche Feldstrukturen; wählen Sie die entsprechende Rolle zur Ansicht aus

Minimum array length: 1

System Message
User Message
Assistant Message
Tool Message

Show child attributes

thinking

object

Steuert tiefes Nachdenken

Hinweise:

Standardwert adaptive: Das Modell entscheidet adaptiv anhand der Schwierigkeit des Problems, ob tiefes Nachdenken eingesetzt wird
Standardmäßig wird der Denkinhalt inline in das Antwort-content eingebettet (umschlossen von <think>...</think>-Tags); um ihn in ein eigenes Feld auszulagern, verwenden Sie reasoning_split

Show child attributes

reasoning_split

boolean

Ob der Denkinhalt in ein separates Feld ausgelagert wird

false (Standard): Der Denkinhalt wird inline in content eingebettet, umschlossen von <think>...</think>-Tags
true: Der Denkinhalt wird in choices[].message.reasoning_content und reasoning_details ausgelagert

temperature

number

Standard:1

Sampling-Temperatur, steuert die Zufälligkeit der Ausgabe

Hinweise:

Niedrigere Werte (z. B. 0,2): Deterministischere, fokussiertere Ausgabe
Höhere Werte (z. B. 1,5): Zufälligere, kreativere Ausgabe
Bereich: [0, 2], Standard 1

Erforderlicher Bereich: 0 <= x <= 2

Beispiel:

1

top_p

number

Standard:0.95

Nucleus-Sampling-Parameter

Hinweise:

Steuert das Sampling aus Tokens mit kumulativer Wahrscheinlichkeit
z. B. 0,95 bedeutet die Auswahl aus Tokens, die 95 % kumulative Wahrscheinlichkeit erreichen
Bereich: [0, 1], MiniMax-M3 Standard 0,95

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0 <= x <= 1

Beispiel:

0.95

max_completion_tokens

integer

Obergrenze für die Länge des generierten Inhalts (in Tokens)

Hinweise:

MiniMax-M3 empfohlen 131.072 (128K), maximal 524.288 (512K)
Vom Nachdenken erzeugte Tokens zählen ebenfalls zu dieser Grenze
Wenn die Generierung aufgrund von length unterbrochen wird, versuchen Sie, diesen Wert zu erhöhen

Erforderlicher Bereich: 1 <= x <= 524288

Beispiel:

131072

stream

boolean

Standard:false

Ob die Antwort im Streaming-Modus zurückgegeben wird

true: Streaming-Antwort, gibt Inhalte in Echtzeit-Chunks über SSE (Server-Sent Events) zurück
false: Wartet auf die vollständige Antwort, bevor sie zurückgegeben wird (Standard)

Beispiel:

false

stream_options

object

Optionen für die Streaming-Antwort

Nur wirksam, wenn stream=true

Show child attributes

tools

object[]

Liste der Werkzeugdefinitionen für Function Calling

Jedes Werkzeug benötigt einen Namen, eine Beschreibung und ein Parameterschema

Show child attributes

max_tokens

integer

veraltet

Veralteter Parameter zur Begrenzung der Generierungslänge

Hinweis: Veraltet, bitte verwenden Sie stattdessen max_completion_tokens

Erforderlicher Bereich: x >= 1

Antwort

Chat-Vervollständigung erfolgreich

string

Eindeutige Kennung für die Chat-Vervollständigung

Beispiel:

"0668a381bdc3c0ded310e27c9a46d16e7"

model

string

Tatsächlich verwendeter Modellname

Beispiel:

"MiniMax-M3"

object

enum<string>

Antworttyp

Verfügbare Optionen:

chat.completion

Beispiel:

"chat.completion"

created

integer

Erstellungszeitstempel (Unix-Sekunden)

Beispiel:

1777026807

choices

object[]

Liste der Chat-Vervollständigungsoptionen

Show child attributes

usage

object

Token-Nutzungsstatistik

Show child attributes

input_sensitive

boolean

Ob der Eingabeinhalt einen Filter für sensible Wörter ausgelöst hat. Wenn die Eingabe schwerwiegend gegen die Richtlinien verstößt, gibt die API einen Inhaltsverstoßfehler mit leerem Antwortinhalt zurück

input_sensitive_type

integer

Art des durch die Eingabe ausgelösten sensiblen Worts (wird zurückgegeben, wenn input_sensitive true ist): 1 schwerer Verstoß; 2 Pornografie; 3 Werbung; 4 verbotener Inhalt; 5 beleidigende Sprache; 6 Gewalt/Terrorismus; 7 Sonstiges

output_sensitive

boolean

Ob der Ausgabeinhalt einen Filter für sensible Wörter ausgelöst hat

output_sensitive_type

integer

Art des durch die Ausgabe ausgelösten sensiblen Worts

base_resp

object

Statuscode und Fehlerdetails

Show child attributes

Bildserie

Videoserie

Audioserie

Textserie

Kontoverwaltung

Aufgabenverwaltung

Dateiverwaltung

MiniMax-M3 - OpenAI-kompatible API

Autorisierungen

Body

Antwort