curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "Preséntate, por favor"
    }
  ]
}
'

{
  "id": "066b36619b147e326d17053cccdef70f",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "<think>\nEl usuario pregunta por la capital de Francia, que es una pregunta de conocimiento general. La respuesta es París.\n</think>\nLa capital de Francia es **París**.",
        "role": "assistant",
        "name": "MiniMax AI",
        "audio_content": ""
      }
    }
  ],
  "created": 1777026807,
  "model": "MiniMax-M3",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 60,
    "total_characters": 0,
    "prompt_tokens": 7,
    "completion_tokens": 53,
    "prompt_tokens_details": {
      "cached_tokens": 0
    }
  },
  "input_sensitive": false,
  "output_sensitive": false,
  "input_sensitive_type": 0,
  "output_sensitive_type": 0,
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

Chat Completions API

MiniMax-M3 - API compatible con OpenAI

Utiliza el protocolo OpenAI Chat Completions para llamar al modelo MiniMax-M3
Conversación de múltiples turnos: admite diálogo contextual de un solo turno o de múltiples turnos
Indicaciones de sistema: personaliza el rol y el comportamiento de la IA mediante mensajes con role=system
Entrada multimodal: content admite texto + imagen / video combinados
Modo de pensamiento: se controla mediante thinking.type; el contenido de pensamiento se devuelve a través de reasoning_content
Salida en streaming: admite respuestas en streaming SSE
Llamada a herramientas: admite Function Calling

POST

chat

completions

curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "Preséntate, por favor"
    }
  ]
}
'

{
  "id": "066b36619b147e326d17053cccdef70f",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "<think>\nEl usuario pregunta por la capital de Francia, que es una pregunta de conocimiento general. La respuesta es París.\n</think>\nLa capital de Francia es **París**.",
        "role": "assistant",
        "name": "MiniMax AI",
        "audio_content": ""
      }
    }
  ],
  "created": 1777026807,
  "model": "MiniMax-M3",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 60,
    "total_characters": 0,
    "prompt_tokens": 7,
    "completion_tokens": 53,
    "prompt_tokens_details": {
      "cached_tokens": 0
    }
  },
  "input_sensitive": false,
  "output_sensitive": false,
  "input_sensitive_type": 0,
  "output_sensitive_type": 0,
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

BaseURL: La BaseURL predeterminada es https://direct.evolink.ai, que ofrece mejor compatibilidad con los modelos de texto y las conexiones de larga duración. https://api.evolink.ai es el endpoint principal para los servicios multimodales y sirve como dirección de respaldo para los modelos de texto.

Autorizaciones

Authorization

string

header

requerido

##Todas las API requieren autenticación con Bearer Token##

Obtener la API Key:

Visita la Página de gestión de API Keys para obtener tu API Key

Añadir al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json

model

enum<string>

requerido

Nombre del modelo de chat

Opciones disponibles:

MiniMax-M3

Ejemplo:

"MiniMax-M3"

messages

(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]

requerido

Lista de mensajes de la conversación, admite diálogo de múltiples turnos

Los mensajes con diferentes roles tienen distintas estructuras de campos; selecciona el rol correspondiente para verlas

Minimum array length: 1

System Message
User Message
Assistant Message
Tool Message

Show child attributes

thinking

object

Controla el pensamiento profundo

Notas:

Valor predeterminado adaptive: el modelo decide de forma adaptativa si realiza un pensamiento profundo según la dificultad del problema
De forma predeterminada, el contenido de pensamiento se integra en el content de la respuesta (envuelto en etiquetas <think>...</think>); para separarlo en un campo dedicado, usa reasoning_split

Show child attributes

reasoning_split

boolean

Si se debe separar el contenido de pensamiento en un campo independiente

false (predeterminado): el contenido de pensamiento se integra en content, envuelto en etiquetas <think>...</think>
true: el contenido de pensamiento se separa en choices[].message.reasoning_content y reasoning_details

temperature

number

predeterminado:1

Temperatura de muestreo, controla la aleatoriedad de la salida

Notas:

Valores más bajos (p. ej. 0.2): salida más determinista y enfocada
Valores más altos (p. ej. 1.5): salida más aleatoria y creativa
Rango: [0, 2], predeterminado 1

Rango requerido: 0 <= x <= 2

Ejemplo:

1

top_p

number

predeterminado:0.95

Parámetro de muestreo por núcleo (Nucleus Sampling)

Notas:

Controla el muestreo a partir de los tokens con probabilidad acumulada
Por ejemplo, 0.95 significa seleccionar entre los tokens que alcanzan el 95 % de probabilidad acumulada
Rango: [0, 1], MiniMax-M3 predeterminado 0.95

Recomendación: no ajustes temperature y top_p simultáneamente

Rango requerido: 0 <= x <= 1

Ejemplo:

0.95

max_completion_tokens

integer

Límite superior de la longitud del contenido generado (en tokens)

Notas:

MiniMax-M3 recomendado 131,072 (128K), máximo 524,288 (512K)
Los tokens generados por el pensamiento también cuentan para este límite
Si la generación se interrumpe por length, intenta aumentar este valor

Rango requerido: 1 <= x <= 524288

Ejemplo:

131072

stream

boolean

predeterminado:false

Si se debe devolver la respuesta en modo streaming

true: respuesta en streaming, devuelve el contenido en fragmentos en tiempo real mediante SSE (Server-Sent Events)
false: espera la respuesta completa antes de devolverla (predeterminado)

Ejemplo:

false

stream_options

object

Opciones de la respuesta en streaming

Solo tiene efecto cuando stream=true

Show child attributes

tools

object[]

Lista de definiciones de herramientas para Function Calling

Cada herramienta requiere un nombre, una descripción y un esquema de parámetros

Show child attributes

max_tokens

integer

obsoleto

Parámetro heredado de límite de longitud de generación

Nota: obsoleto, usa max_completion_tokens en su lugar

Rango requerido: x >= 1

Respuesta

Generación de chat exitosa

string

Identificador único de la generación de chat

Ejemplo:

"0668a381bdc3c0ded310e27c9a46d16e7"

model

string

Nombre del modelo realmente utilizado

Ejemplo:

"MiniMax-M3"

object

enum<string>

Tipo de respuesta

Opciones disponibles:

chat.completion

Ejemplo:

"chat.completion"

created

integer

Marca de tiempo de creación (segundos Unix)

Ejemplo:

1777026807

choices

object[]

Lista de opciones de generación de chat

Show child attributes

usage

object

Estadísticas de uso de tokens

Show child attributes

input_sensitive

boolean

Si el contenido de entrada activó un filtro de palabras sensibles. Si la entrada infringe gravemente las políticas, la API devolverá un error de violación de contenido con el contenido de respuesta vacío

input_sensitive_type

integer

Tipo de palabra sensible activada por la entrada (se devuelve cuando input_sensitive es true): 1 infracción grave; 2 pornografía; 3 publicidad; 4 contenido prohibido; 5 lenguaje abusivo; 6 violencia/terrorismo; 7 otros

output_sensitive

boolean

Si el contenido de salida activó un filtro de palabras sensibles

output_sensitive_type

integer

Tipo de palabra sensible activada por la salida

base_resp

object

Código de estado y detalles del error

Show child attributes

DeepSeek - Referencia completa de la API MiniMax-M3 - API compatible con Anthropic

Serie de imágenes

Serie de videos

Serie de audio

Serie de texto

Gestión de cuenta

Gestión de tareas

Gestión de archivos

MiniMax-M3 - API compatible con OpenAI

Autorizaciones

Cuerpo

Respuesta