MiniMax-M3 - API compatible Anthropic
- Utilisez le protocole Anthropic Messages pour appeler le modèle MiniMax-M3
- La structure des requêtes / réponses s’aligne sur l’API Anthropic
- Conversation multimodale :
contentprend en charge les blocs de contenu texte et image - Invites système : transmises via le champ
systemde premier niveau - Mode réflexion : contrôlé via l’objet
thinking; le contenu de réflexion est renvoyé via un bloccontent[type=thinking] - Sortie en streaming : flux d’événements SSE
- Appel d’outils : compatible avec le flux Anthropic
tool_use/tool_result
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://direct.evolink.ai, qui offre une meilleure prise en charge des modèles textuels et des connexions de longue durée. https://api.evolink.ai est le point de terminaison principal pour les services multimodaux et sert d’adresse de repli pour les modèles textuels.Autorisations
##Toutes les API nécessitent une authentification par Bearer Token##
Obtenir une clé API :
Visitez la page de gestion des clés API pour obtenir votre clé API
Ajouter à l'en-tête de requête :
Authorization: Bearer YOUR_API_KEYRemarque : EvoLink utilise uniformément l'authentification par Bearer Token pour /v1/messages.
Corps
Modèle à appeler
MiniMax-M3 "MiniMax-M3"
Liste des messages de la conversation, en alternant les tours user / assistant
Remarques :
- Doit contenir au moins 1 message
- Le dernier message est généralement
role=user
1Limite supérieure de la longueur du contenu généré (en tokens)
Remarques :
- MiniMax-M3 recommandé 131 072 (128K), maximum 524 288 (512K)
- Les tokens générés par la réflexion comptent également dans cette limite
- Le contenu dépassant la limite sera tronqué ; si la génération est interrompue pour cause de
length, essayez d'augmenter cette valeur
1 <= x <= 5242881024
Invite système, utilisée pour définir le rôle et le comportement de l'IA
Remarques :
- Prend en charge une chaîne ou un tableau de chaînes
- Transmis via le champ
systemde premier niveau
"You are a helpful assistant."
Température d'échantillonnage
Remarques :
- Plage :
[0, 2] - Par défaut 1 ; les valeurs plus élevées produisent une sortie plus divergente, les valeurs plus basses produisent une sortie plus déterministe
0 <= x <= 21
Seuil d'échantillonnage par noyau
Remarques :
- Plage :
[0, 1], MiniMax-M3 par défaut 0.95 - Il est recommandé de ne pas ajuster simultanément temperature et top_p
0 <= x <= 10.95
Indique s'il faut renvoyer en streaming via SSE
true: réponse en streaming Server-Sent Eventsfalse: attend la réponse complète avant de la renvoyer (par défaut)
false
Contrôle la réflexion approfondie. Lorsque la réflexion est activée, les blocs de réflexion doivent être retransmis tels quels dans les conversations multi-tours
Remarques :
- Par défaut
adaptive: le modèle décide de manière adaptative s'il doit engager une réflexion approfondie en fonction de la difficulté du problème - Lorsqu'elle est activée, le tableau
contentde la réponse inclut un bloc de raisonnementtype="thinking"(facturé en tokens de sortie)
Liste de définitions d'outils
Remarques :
- Suit la spécification de définition d'outils d'Anthropic
input_schemautilise un objet JSON Schema
Stratégie de sélection d'outils. Seuls auto et none sont pris en charge
Métadonnées de la requête
Réponse
Objet message
Réponse de message de style Anthropic
ID unique du message
Type d'objet de réponse
message assistant Modèle réellement utilisé
"MiniMax-M3"
Liste des blocs de contenu de la réponse
Types de blocs possibles :
thinking: processus de raisonnement (uniquement lorsque la réflexion est active)text: texte de la réponse finaletool_use: appel d'outil initié par le modèle
Raison d'arrêt
end_turn: achèvement naturelmax_tokens: limite max_tokens atteintetool_use: le modèle a déclenché un appel d'outil
end_turn, max_tokens, tool_use Statistiques d'utilisation des tokens (spécification Anthropic)