Saltar al contenido principal
POST
/
v1
/
messages
curl --request POST \
  --url https://direct.evolink.ai/v1/messages \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "max_tokens": 1024,
  "messages": [
    {
      "role": "user",
      "content": "Hola, mundo"
    }
  ]
}
'
{
  "id": "066a381bdc3c0ded310e27c9a46d16e7",
  "type": "message",
  "role": "assistant",
  "model": "MiniMax-M3",
  "content": [
    {
      "type": "thinking",
      "thinking": "El usuario pregunta por la capital de Japón, que es una pregunta básica de geografía. La respuesta es Tokio, la puedo dar directamente.",
      "signature": "066a381bdc3c0ded310e27c9a46d16e7"
    },
    {
      "type": "text",
      "text": "La capital de Japón es **Tokio**."
    }
  ],
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 7,
    "output_tokens": 77,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL: La BaseURL predeterminada es https://direct.evolink.ai, que ofrece mejor compatibilidad con los modelos de texto y las conexiones de larga duración. https://api.evolink.ai es el endpoint principal para los servicios multimodales y sirve como dirección de respaldo para los modelos de texto.

Autorizaciones

Authorization
string
header
requerido

##Todas las API requieren autenticación con Bearer Token##

Obtener la API Key:

Visita la Página de gestión de API Keys para obtener tu API Key

Añadir al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Nota: EvoLink utiliza de forma uniforme la autenticación con Bearer Token para /v1/messages.

Cuerpo

application/json
model
enum<string>
requerido

Modelo a llamar

Opciones disponibles:
MiniMax-M3
Ejemplo:

"MiniMax-M3"

messages
object[]
requerido

Lista de mensajes de la conversación, alternando turnos de user / assistant

Notas:

  • Debe contener al menos 1 mensaje
  • El último mensaje normalmente es role=user
Minimum array length: 1
max_tokens
integer

Límite superior de la longitud del contenido generado (en tokens)

Notas:

  • MiniMax-M3 recomendado 131,072 (128K), máximo 524,288 (512K)
  • Los tokens generados por el pensamiento también cuentan para este límite
  • El contenido que supere el límite se truncará; si la generación se interrumpe por length, intenta aumentar este valor
Rango requerido: 1 <= x <= 524288
Ejemplo:

1024

system

Indicación de sistema, usada para definir el rol y el comportamiento de la IA

Notas:

  • Admite una cadena o un arreglo de cadenas
  • Se pasa mediante el campo system de nivel superior
Ejemplo:

"You are a helpful assistant."

temperature
number
predeterminado:1

Temperatura de muestreo

Notas:

  • Rango: [0, 2]
  • Predeterminado 1; los valores más altos producen una salida más divergente, los más bajos producen una salida más determinista
Rango requerido: 0 <= x <= 2
Ejemplo:

1

top_p
number
predeterminado:0.95

Umbral de muestreo por núcleo

Notas:

  • Rango: [0, 1], MiniMax-M3 predeterminado 0.95
  • Se recomienda no ajustar temperature y top_p simultáneamente
Rango requerido: 0 <= x <= 1
Ejemplo:

0.95

stream
boolean
predeterminado:false

Si se debe devolver mediante streaming SSE

  • true: respuesta en streaming Server-Sent Events
  • false: espera la respuesta completa antes de devolverla (predeterminado)
Ejemplo:

false

thinking
object

Controla el pensamiento profundo. Cuando el pensamiento está habilitado, los bloques de pensamiento deben devolverse sin modificaciones en las conversaciones de múltiples turnos

Notas:

  • Valor predeterminado adaptive: el modelo decide de forma adaptativa si realiza un pensamiento profundo según la dificultad del problema
  • Cuando está habilitado, el arreglo content de la respuesta incluirá un bloque de razonamiento type="thinking" (facturado como tokens de salida)
tools
object[]

Lista de definiciones de herramientas

Notas:

  • Sigue la especificación de definición de herramientas de Anthropic
  • input_schema usa un objeto JSON Schema
tool_choice
object

Estrategia de selección de herramientas. Solo se admiten auto y none

metadata
object

Metadatos de la solicitud

Respuesta

Objeto de mensaje

Respuesta de mensaje al estilo de Anthropic

id
string

ID único del mensaje

type
enum<string>

Tipo de objeto de respuesta

Opciones disponibles:
message
role
enum<string>
Opciones disponibles:
assistant
model
string

Modelo realmente utilizado

Ejemplo:

"MiniMax-M3"

content
object[]

Lista de bloques de contenido de la respuesta

Tipos de bloque posibles:

  • thinking: proceso de razonamiento (solo cuando el pensamiento está activo)
  • text: texto de la respuesta final
  • tool_use: llamada a herramienta iniciada por el modelo
stop_reason
enum<string>

Razón de parada

  • end_turn: finalización natural
  • max_tokens: se alcanzó el límite de max_tokens
  • tool_use: el modelo activó una llamada a herramienta
Opciones disponibles:
end_turn,
max_tokens,
tool_use
usage
object

Estadísticas de uso de tokens (especificación de Anthropic)