MiniMax-M3 - API compatible con Anthropic
- Utiliza el protocolo Anthropic Messages para llamar al modelo MiniMax-M3
- La estructura de solicitud / respuesta se alinea con la API de Anthropic
- Conversación multimodal:
contentadmite bloques de contenido de texto e imagen - Indicaciones de sistema: se pasan mediante el campo de nivel superior
system - Modo de pensamiento: se controla mediante el objeto
thinking; el contenido de pensamiento se devuelve a través del bloquecontent[type=thinking] - Salida en streaming: flujo de eventos SSE
- Llamada a herramientas: compatible con el flujo
tool_use/tool_resultde Anthropic
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://direct.evolink.ai, que ofrece mejor compatibilidad con los modelos de texto y las conexiones de larga duración. https://api.evolink.ai es el endpoint principal para los servicios multimodales y sirve como dirección de respaldo para los modelos de texto.Autorizaciones
##Todas las API requieren autenticación con Bearer Token##
Obtener la API Key:
Visita la Página de gestión de API Keys para obtener tu API Key
Añadir al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYNota: EvoLink utiliza de forma uniforme la autenticación con Bearer Token para /v1/messages.
Cuerpo
Modelo a llamar
MiniMax-M3 "MiniMax-M3"
Lista de mensajes de la conversación, alternando turnos de user / assistant
Notas:
- Debe contener al menos 1 mensaje
- El último mensaje normalmente es
role=user
1Límite superior de la longitud del contenido generado (en tokens)
Notas:
- MiniMax-M3 recomendado 131,072 (128K), máximo 524,288 (512K)
- Los tokens generados por el pensamiento también cuentan para este límite
- El contenido que supere el límite se truncará; si la generación se interrumpe por
length, intenta aumentar este valor
1 <= x <= 5242881024
Indicación de sistema, usada para definir el rol y el comportamiento de la IA
Notas:
- Admite una cadena o un arreglo de cadenas
- Se pasa mediante el campo
systemde nivel superior
"You are a helpful assistant."
Temperatura de muestreo
Notas:
- Rango:
[0, 2] - Predeterminado 1; los valores más altos producen una salida más divergente, los más bajos producen una salida más determinista
0 <= x <= 21
Umbral de muestreo por núcleo
Notas:
- Rango:
[0, 1], MiniMax-M3 predeterminado 0.95 - Se recomienda no ajustar temperature y top_p simultáneamente
0 <= x <= 10.95
Si se debe devolver mediante streaming SSE
true: respuesta en streaming Server-Sent Eventsfalse: espera la respuesta completa antes de devolverla (predeterminado)
false
Controla el pensamiento profundo. Cuando el pensamiento está habilitado, los bloques de pensamiento deben devolverse sin modificaciones en las conversaciones de múltiples turnos
Notas:
- Valor predeterminado
adaptive: el modelo decide de forma adaptativa si realiza un pensamiento profundo según la dificultad del problema - Cuando está habilitado, el arreglo
contentde la respuesta incluirá un bloque de razonamientotype="thinking"(facturado como tokens de salida)
Lista de definiciones de herramientas
Notas:
- Sigue la especificación de definición de herramientas de Anthropic
input_schemausa un objeto JSON Schema
Estrategia de selección de herramientas. Solo se admiten auto y none
Metadatos de la solicitud
Respuesta
Objeto de mensaje
Respuesta de mensaje al estilo de Anthropic
ID único del mensaje
Tipo de objeto de respuesta
message assistant Modelo realmente utilizado
"MiniMax-M3"
Lista de bloques de contenido de la respuesta
Tipos de bloque posibles:
thinking: proceso de razonamiento (solo cuando el pensamiento está activo)text: texto de la respuesta finaltool_use: llamada a herramienta iniciada por el modelo
Razón de parada
end_turn: finalización naturalmax_tokens: se alcanzó el límite de max_tokenstool_use: el modelo activó una llamada a herramienta
end_turn, max_tokens, tool_use Estadísticas de uso de tokens (especificación de Anthropic)