MiniMax-M3 - API compatible con OpenAI
- Utiliza el protocolo OpenAI Chat Completions para llamar al modelo MiniMax-M3
- Conversación de múltiples turnos: admite diálogo contextual de un solo turno o de múltiples turnos
- Indicaciones de sistema: personaliza el rol y el comportamiento de la IA mediante mensajes con
role=system - Entrada multimodal:
contentadmite texto + imagen / video combinados - Modo de pensamiento: se controla mediante
thinking.type; el contenido de pensamiento se devuelve a través dereasoning_content - Salida en streaming: admite respuestas en streaming SSE
- Llamada a herramientas: admite Function Calling
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://direct.evolink.ai, que ofrece mejor compatibilidad con los modelos de texto y las conexiones de larga duración. https://api.evolink.ai es el endpoint principal para los servicios multimodales y sirve como dirección de respaldo para los modelos de texto.Autorizaciones
##Todas las API requieren autenticación con Bearer Token##
Obtener la API Key:
Visita la Página de gestión de API Keys para obtener tu API Key
Añadir al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYCuerpo
Nombre del modelo de chat
MiniMax-M3 "MiniMax-M3"
Lista de mensajes de la conversación, admite diálogo de múltiples turnos
Los mensajes con diferentes roles tienen distintas estructuras de campos; selecciona el rol correspondiente para verlas
1- System Message
- User Message
- Assistant Message
- Tool Message
Controla el pensamiento profundo
Notas:
- Valor predeterminado
adaptive: el modelo decide de forma adaptativa si realiza un pensamiento profundo según la dificultad del problema - De forma predeterminada, el contenido de pensamiento se integra en el
contentde la respuesta (envuelto en etiquetas<think>...</think>); para separarlo en un campo dedicado, usareasoning_split
Si se debe separar el contenido de pensamiento en un campo independiente
false(predeterminado): el contenido de pensamiento se integra encontent, envuelto en etiquetas<think>...</think>true: el contenido de pensamiento se separa enchoices[].message.reasoning_contentyreasoning_details
Temperatura de muestreo, controla la aleatoriedad de la salida
Notas:
- Valores más bajos (p. ej. 0.2): salida más determinista y enfocada
- Valores más altos (p. ej. 1.5): salida más aleatoria y creativa
- Rango:
[0, 2], predeterminado 1
0 <= x <= 21
Parámetro de muestreo por núcleo (Nucleus Sampling)
Notas:
- Controla el muestreo a partir de los tokens con probabilidad acumulada
- Por ejemplo, 0.95 significa seleccionar entre los tokens que alcanzan el 95 % de probabilidad acumulada
- Rango:
[0, 1], MiniMax-M3 predeterminado 0.95
Recomendación: no ajustes temperature y top_p simultáneamente
0 <= x <= 10.95
Límite superior de la longitud del contenido generado (en tokens)
Notas:
- MiniMax-M3 recomendado 131,072 (128K), máximo 524,288 (512K)
- Los tokens generados por el pensamiento también cuentan para este límite
- Si la generación se interrumpe por
length, intenta aumentar este valor
1 <= x <= 524288131072
Si se debe devolver la respuesta en modo streaming
true: respuesta en streaming, devuelve el contenido en fragmentos en tiempo real mediante SSE (Server-Sent Events)false: espera la respuesta completa antes de devolverla (predeterminado)
false
Opciones de la respuesta en streaming
Solo tiene efecto cuando stream=true
Lista de definiciones de herramientas para Function Calling
Cada herramienta requiere un nombre, una descripción y un esquema de parámetros
Parámetro heredado de límite de longitud de generación
Nota: obsoleto, usa max_completion_tokens en su lugar
x >= 1Respuesta
Generación de chat exitosa
Identificador único de la generación de chat
"0668a381bdc3c0ded310e27c9a46d16e7"
Nombre del modelo realmente utilizado
"MiniMax-M3"
Tipo de respuesta
chat.completion "chat.completion"
Marca de tiempo de creación (segundos Unix)
1777026807
Lista de opciones de generación de chat
Estadísticas de uso de tokens
Si el contenido de entrada activó un filtro de palabras sensibles. Si la entrada infringe gravemente las políticas, la API devolverá un error de violación de contenido con el contenido de respuesta vacío
Tipo de palabra sensible activada por la entrada (se devuelve cuando input_sensitive es true): 1 infracción grave; 2 pornografía; 3 publicidad; 4 contenido prohibido; 5 lenguaje abusivo; 6 violencia/terrorismo; 7 otros
Si el contenido de salida activó un filtro de palabras sensibles
Tipo de palabra sensible activada por la salida
Código de estado y detalles del error