Passer au contenu principal
POST
/
v1
/
messages
curl --request POST \
  --url https://direct.evolink.ai/v1/messages \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "max_tokens": 1024,
  "messages": [
    {
      "role": "user",
      "content": "Bonjour, le monde"
    }
  ]
}
'
{
  "id": "066a381bdc3c0ded310e27c9a46d16e7",
  "type": "message",
  "role": "assistant",
  "model": "MiniMax-M3",
  "content": [
    {
      "type": "thinking",
      "thinking": "L'utilisateur pose une question sur la capitale du Japon, ce qui relève d'une connaissance géographique de base. La réponse est Tokyo, je peux la donner directement.",
      "signature": "066a381bdc3c0ded310e27c9a46d16e7"
    },
    {
      "type": "text",
      "text": "La capitale du Japon est **Tokyo**."
    }
  ],
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 7,
    "output_tokens": 77,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL : la BaseURL par défaut est https://direct.evolink.ai, qui offre une meilleure prise en charge des modèles textuels et des connexions de longue durée. https://api.evolink.ai est le point de terminaison principal pour les services multimodaux et sert d’adresse de repli pour les modèles textuels.

Autorisations

Authorization
string
header
requis

##Toutes les API nécessitent une authentification par Bearer Token##

Obtenir une clé API :

Visitez la page de gestion des clés API pour obtenir votre clé API

Ajouter à l'en-tête de requête :

Authorization: Bearer YOUR_API_KEY

Remarque : EvoLink utilise uniformément l'authentification par Bearer Token pour /v1/messages.

Corps

application/json
model
enum<string>
requis

Modèle à appeler

Options disponibles:
MiniMax-M3
Exemple:

"MiniMax-M3"

messages
object[]
requis

Liste des messages de la conversation, en alternant les tours user / assistant

Remarques :

  • Doit contenir au moins 1 message
  • Le dernier message est généralement role=user
Minimum array length: 1
max_tokens
integer

Limite supérieure de la longueur du contenu généré (en tokens)

Remarques :

  • MiniMax-M3 recommandé 131 072 (128K), maximum 524 288 (512K)
  • Les tokens générés par la réflexion comptent également dans cette limite
  • Le contenu dépassant la limite sera tronqué ; si la génération est interrompue pour cause de length, essayez d'augmenter cette valeur
Plage requise: 1 <= x <= 524288
Exemple:

1024

system

Invite système, utilisée pour définir le rôle et le comportement de l'IA

Remarques :

  • Prend en charge une chaîne ou un tableau de chaînes
  • Transmis via le champ system de premier niveau
Exemple:

"You are a helpful assistant."

temperature
number
défaut:1

Température d'échantillonnage

Remarques :

  • Plage : [0, 2]
  • Par défaut 1 ; les valeurs plus élevées produisent une sortie plus divergente, les valeurs plus basses produisent une sortie plus déterministe
Plage requise: 0 <= x <= 2
Exemple:

1

top_p
number
défaut:0.95

Seuil d'échantillonnage par noyau

Remarques :

  • Plage : [0, 1], MiniMax-M3 par défaut 0.95
  • Il est recommandé de ne pas ajuster simultanément temperature et top_p
Plage requise: 0 <= x <= 1
Exemple:

0.95

stream
boolean
défaut:false

Indique s'il faut renvoyer en streaming via SSE

  • true : réponse en streaming Server-Sent Events
  • false : attend la réponse complète avant de la renvoyer (par défaut)
Exemple:

false

thinking
object

Contrôle la réflexion approfondie. Lorsque la réflexion est activée, les blocs de réflexion doivent être retransmis tels quels dans les conversations multi-tours

Remarques :

  • Par défaut adaptive : le modèle décide de manière adaptative s'il doit engager une réflexion approfondie en fonction de la difficulté du problème
  • Lorsqu'elle est activée, le tableau content de la réponse inclut un bloc de raisonnement type="thinking" (facturé en tokens de sortie)
tools
object[]

Liste de définitions d'outils

Remarques :

  • Suit la spécification de définition d'outils d'Anthropic
  • input_schema utilise un objet JSON Schema
tool_choice
object

Stratégie de sélection d'outils. Seuls auto et none sont pris en charge

metadata
object

Métadonnées de la requête

Réponse

Objet message

Réponse de message de style Anthropic

id
string

ID unique du message

type
enum<string>

Type d'objet de réponse

Options disponibles:
message
role
enum<string>
Options disponibles:
assistant
model
string

Modèle réellement utilisé

Exemple:

"MiniMax-M3"

content
object[]

Liste des blocs de contenu de la réponse

Types de blocs possibles :

  • thinking : processus de raisonnement (uniquement lorsque la réflexion est active)
  • text : texte de la réponse finale
  • tool_use : appel d'outil initié par le modèle
stop_reason
enum<string>

Raison d'arrêt

  • end_turn : achèvement naturel
  • max_tokens : limite max_tokens atteinte
  • tool_use : le modèle a déclenché un appel d'outil
Options disponibles:
end_turn,
max_tokens,
tool_use
usage
object

Statistiques d'utilisation des tokens (spécification Anthropic)