DeepSeek V4 - API compatible Anthropic
- Appeler les modèles DeepSeek V4 via le protocole Anthropic Messages
- Prend en charge
deepseek-v4-flash/deepseek-v4-pro - Les structures de requête / réponse sont alignées sur l’API Anthropic
- Conversation textuelle (les types de contenu image / document ne sont pas pris en charge)
- Prompts système : transmis via le champ
systemau niveau supérieur - Mode de réflexion : commutateur via l’objet
thinking; le contenu de réflexion est retourné via un blockcontent[type=thinking] - Sortie en streaming : flux d’événements SSE
- Appel d’outils : compatible avec le flux
tool_use/tool_resultd’Anthropic
https://direct.evolink.ai, qui offre une meilleure prise en charge des modèles de texte et des connexions persistantes. https://api.evolink.ai est le point d’accès principal pour les services multimodaux et sert d’adresse de secours pour les modèles de texte.Autorisations
##Toutes les API nécessitent une authentification Bearer Token##
Obtenir une clé API :
Visitez la Page de gestion des clés API pour obtenir votre clé API
Ajouter à l'en-tête de requête :
Authorization: Bearer YOUR_API_KEYRemarque : Bien que l'API native Anthropic utilise l'en-tête x-api-key, EvoLink adopte uniformément l'authentification Bearer Token pour /v1/messages.
Corps
Modèle à appeler
deepseek-v4-flash: rapide et généralistedeepseek-v4-pro: raisonnement approfondi
Astuce : Les deux modèles ont thinking activé par défaut, la réponse contient toujours un content block type="thinking" ; pour le désactiver, définissez explicitement thinking.type="disabled". Un model non spécifié ou non pris en charge sera automatiquement mappé à deepseek-v4-flash.
deepseek-v4-flash, deepseek-v4-pro "deepseek-v4-flash"
Nombre maximum de tokens à générer (obligatoire)
Remarque :
- La série V4 peut atteindre 384 000
- Les tokens produits par thinking sont également comptés dans la limite max_tokens
1 <= x <= 3840001024
Liste des messages de conversation, alternant user / assistant par tour
Remarque :
- Contient au moins 1 message
- Le dernier message est généralement
role=user - Les types de contenu
image/documentne sont pas pris en charge
1Prompt système, utilisé pour définir le rôle et le comportement de l'IA
Remarque :
- Prend en charge une chaîne ou un tableau de chaînes
- Contrairement au message
systemde l'endpoint OpenAI, l'endpoint Anthropic utilise le champsystemau niveau supérieur
"You are a helpful assistant."
Température d'échantillonnage
Remarque :
- Plage
[0.0, 2.0] - Par défaut 1 ; plus la valeur est élevée, plus la sortie est divergente, plus elle est basse, plus elle est déterministe
0 <= x <= 21
Seuil d'échantillonnage nucleus
Remarque :
- Plage
[0, 1] - Il est recommandé de ne pas ajuster simultanément temperature et top_p
0 <= x <= 11
Séquences d'arrêt personnalisées
Remarque :
- Le modèle arrête la génération dès qu'il rencontre l'une des chaînes
- Jusqu'à 4 (selon la spécification Anthropic)
4Retourner ou non en streaming SSE
true: retour en streaming Server-Sent Eventsfalse: retour en une seule fois après la réponse complète (par défaut)
false
Contrôle du mode de réflexion (V4)
Remarque :
- Activé par défaut pour les deux modèles (
type=enabled) - Une fois activé, le tableau
contentde la réponse contiendra un block de processus de raisonnementtype="thinking"(facturé au tarif des tokens de sortie) - Attention : l'API ignore le champ natif Anthropic
budget_tokens, utilisezoutput_config.effortpour contrôler la profondeur - Dans les conversations multi-tours, il suffit de replacer le thinking block de la réponse précédente tel quel dans le tableau
contentde l'assistant (le style du protocole Anthropic est plus indulgent, l'absence de thinking ne provoque pas d'erreur, mais conserver signature aide à la cohérence du contexte)
Configuration de sortie (extension V4)
Remarque : Deepseek ne prend en charge que le champ effort
Liste des définitions d'outils
Remarque :
- Suit la spécification de définition d'outil Anthropic
input_schemautilise un objet JSON Schema
Contrôle le comportement d'appel des outils
type possibles :
auto: le modèle décide automatiquement (par défaut lorsque tools est fourni)any: doit appeler un outil (sans spécifier lequel)tool: doit appeler lenamespécifiénone: interdire l'appel d'outils
Réponse
Objet message
Réponse de message au style Anthropic
ID unique du message
Type de l'objet de réponse
message assistant Modèle réellement utilisé
"deepseek-v4-pro"
Liste des blocks de contenu de la réponse
Types de block possibles :
thinking: processus de raisonnement (uniquement lorsque thinking est activé)text: texte de la réponse finaletool_use: appel d'outil initié par le modèle
Raison de l'arrêt
end_turn: fin naturellemax_tokens: limite max_tokens atteintestop_sequence: hit d'une stop_sequencestool_use: le modèle a déclenché un appel d'outil
end_turn, max_tokens, stop_sequence, tool_use Séquence spécifique touchée lorsque stop_reason=stop_sequence, sinon null
Statistiques d'utilisation des tokens (spécification Anthropic)