Saltar al contenido principal
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "Preséntate, por favor"
    }
  ]
}
'
{
  "id": "066b36619b147e326d17053cccdef70f",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "<think>\nEl usuario pregunta por la capital de Francia, que es una pregunta de conocimiento general. La respuesta es París.\n</think>\nLa capital de Francia es **París**.",
        "role": "assistant",
        "name": "MiniMax AI",
        "audio_content": ""
      }
    }
  ],
  "created": 1777026807,
  "model": "MiniMax-M3",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 60,
    "total_characters": 0,
    "prompt_tokens": 7,
    "completion_tokens": 53,
    "prompt_tokens_details": {
      "cached_tokens": 0
    }
  },
  "input_sensitive": false,
  "output_sensitive": false,
  "input_sensitive_type": 0,
  "output_sensitive_type": 0,
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL: La BaseURL predeterminada es https://direct.evolink.ai, que ofrece mejor compatibilidad con los modelos de texto y las conexiones de larga duración. https://api.evolink.ai es el endpoint principal para los servicios multimodales y sirve como dirección de respaldo para los modelos de texto.

Autorizaciones

Authorization
string
header
requerido

##Todas las API requieren autenticación con Bearer Token##

Obtener la API Key:

Visita la Página de gestión de API Keys para obtener tu API Key

Añadir al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json
model
enum<string>
requerido

Nombre del modelo de chat

Opciones disponibles:
MiniMax-M3
Ejemplo:

"MiniMax-M3"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
requerido

Lista de mensajes de la conversación, admite diálogo de múltiples turnos

Los mensajes con diferentes roles tienen distintas estructuras de campos; selecciona el rol correspondiente para verlas

Minimum array length: 1
thinking
object

Controla el pensamiento profundo

Notas:

  • Valor predeterminado adaptive: el modelo decide de forma adaptativa si realiza un pensamiento profundo según la dificultad del problema
  • De forma predeterminada, el contenido de pensamiento se integra en el content de la respuesta (envuelto en etiquetas <think>...</think>); para separarlo en un campo dedicado, usa reasoning_split
reasoning_split
boolean

Si se debe separar el contenido de pensamiento en un campo independiente

  • false (predeterminado): el contenido de pensamiento se integra en content, envuelto en etiquetas <think>...</think>
  • true: el contenido de pensamiento se separa en choices[].message.reasoning_content y reasoning_details
temperature
number
predeterminado:1

Temperatura de muestreo, controla la aleatoriedad de la salida

Notas:

  • Valores más bajos (p. ej. 0.2): salida más determinista y enfocada
  • Valores más altos (p. ej. 1.5): salida más aleatoria y creativa
  • Rango: [0, 2], predeterminado 1
Rango requerido: 0 <= x <= 2
Ejemplo:

1

top_p
number
predeterminado:0.95

Parámetro de muestreo por núcleo (Nucleus Sampling)

Notas:

  • Controla el muestreo a partir de los tokens con probabilidad acumulada
  • Por ejemplo, 0.95 significa seleccionar entre los tokens que alcanzan el 95 % de probabilidad acumulada
  • Rango: [0, 1], MiniMax-M3 predeterminado 0.95

Recomendación: no ajustes temperature y top_p simultáneamente

Rango requerido: 0 <= x <= 1
Ejemplo:

0.95

max_completion_tokens
integer

Límite superior de la longitud del contenido generado (en tokens)

Notas:

  • MiniMax-M3 recomendado 131,072 (128K), máximo 524,288 (512K)
  • Los tokens generados por el pensamiento también cuentan para este límite
  • Si la generación se interrumpe por length, intenta aumentar este valor
Rango requerido: 1 <= x <= 524288
Ejemplo:

131072

stream
boolean
predeterminado:false

Si se debe devolver la respuesta en modo streaming

  • true: respuesta en streaming, devuelve el contenido en fragmentos en tiempo real mediante SSE (Server-Sent Events)
  • false: espera la respuesta completa antes de devolverla (predeterminado)
Ejemplo:

false

stream_options
object

Opciones de la respuesta en streaming

Solo tiene efecto cuando stream=true

tools
object[]

Lista de definiciones de herramientas para Function Calling

Cada herramienta requiere un nombre, una descripción y un esquema de parámetros

max_tokens
integer
obsoleto

Parámetro heredado de límite de longitud de generación

Nota: obsoleto, usa max_completion_tokens en su lugar

Rango requerido: x >= 1

Respuesta

Generación de chat exitosa

id
string

Identificador único de la generación de chat

Ejemplo:

"0668a381bdc3c0ded310e27c9a46d16e7"

model
string

Nombre del modelo realmente utilizado

Ejemplo:

"MiniMax-M3"

object
enum<string>

Tipo de respuesta

Opciones disponibles:
chat.completion
Ejemplo:

"chat.completion"

created
integer

Marca de tiempo de creación (segundos Unix)

Ejemplo:

1777026807

choices
object[]

Lista de opciones de generación de chat

usage
object

Estadísticas de uso de tokens

input_sensitive
boolean

Si el contenido de entrada activó un filtro de palabras sensibles. Si la entrada infringe gravemente las políticas, la API devolverá un error de violación de contenido con el contenido de respuesta vacío

input_sensitive_type
integer

Tipo de palabra sensible activada por la entrada (se devuelve cuando input_sensitive es true): 1 infracción grave; 2 pornografía; 3 publicidad; 4 contenido prohibido; 5 lenguaje abusivo; 6 violencia/terrorismo; 7 otros

output_sensitive
boolean

Si el contenido de salida activó un filtro de palabras sensibles

output_sensitive_type
integer

Tipo de palabra sensible activada por la salida

base_resp
object

Código de estado y detalles del error