EvoLink Auto - Routage Intelligent de Modèles
Le système sélectionne automatiquement le modèle le plus adapté pour traiter la requête
Routage Intelligent de Modèles
EvoLink Auto est une fonctionnalité de routage intelligent de modèles qui sélectionne automatiquement un modèle d’IA approprié en fonction du contenu de votre requête, sans spécification manuelle du modèle.Avantages Clés
- Correspondance Intelligente: Analyse automatiquement le contenu de la requête et sélectionne un modèle approprié
- Optimisation des Coûts: Priorise les modèles rentables tout en maintenant la qualité
- Équilibrage de Charge: Distribue automatiquement les requêtes entre plusieurs modèles pour une stabilité améliorée
- Transparence: Renvoie le nom du modèle réellement utilisé dans la réponse pour le suivi et l’optimisation
Fonctionnement
Le système sélectionne le modèle le mieux adapté du pool de modèles en fonction de la complexité, de la longueur et du type de requête.Modèles Supportés
EvoLink Auto route intelligemment entre les principaux modèles d’IA, notamment GPT-4, GPT-3.5, Claude, Gemini et plus encore.Limitations
- Non adapté aux scénarios nécessitant des capacités de modèle spécifiques (par exemple, fonctionnalités de vision GPT-4)
- Ne garantit pas le même modèle pour chaque requête
Cas d’Usage
Idéal pour les scénarios où vous ne savez pas quel modèle utiliser, ou souhaitez que le système optimise automatiquement la sélection du modèle.model sur evolink/auto, et le système sélectionnera automatiquement un modèle approprié pour vous.https://direct.evolink.ai, qui offre une meilleure prise en charge des modèles de texte et des connexions persistantes. https://api.evolink.ai est le point d’accès principal pour les services multimodaux et sert d’adresse de secours pour les modèles de texte.Autorisations
Toutes les interfaces nécessitent une authentification par Bearer Token
Obtenir une clé API :
Rendez-vous sur la page de gestion des clés API pour obtenir votre clé API
Ajoutez dans l'en-tête de la requête :
Authorization: Bearer YOUR_API_KEYCorps
Utiliser le routage intelligent
evolink/auto "evolink/auto"
Liste des messages de conversation
1[
{
"role": "user",
"content": "Présentez l'histoire du développement de l'intelligence artificielle"
}
]Température d'échantillonnage, contrôle le caractère aléatoire de la sortie
Description :
- Valeur basse (ex. 0.2) : sortie plus déterministe et plus ciblée
- Valeur haute (ex. 1.5) : sortie plus aléatoire et plus créative
0 <= x <= 20.7
Paramètre d'échantillonnage par noyau (Nucleus Sampling)
Description :
- Contrôle l'échantillonnage parmi les tokens dont la probabilité cumulée atteint un certain seuil
- Par exemple, 0.9 signifie sélectionner parmi les tokens dont la probabilité cumulée atteint 90 %
- Valeur par défaut : 1.0 (tous les tokens sont pris en compte)
Recommandation : ne pas ajuster temperature et top_p simultanément
0 <= x <= 10.9
Paramètre d'échantillonnage Top-K
Description :
- Par exemple, 10 signifie que seuls les 10 tokens les plus probables sont considérés à chaque échantillonnage
- Une valeur plus petite rend la sortie plus ciblée
- Non limité par défaut
x >= 140
Indique si la réponse doit être retournée en mode streaming
true: retour en streaming, le contenu est envoyé progressivement en temps réelfalse: attendre la réponse complète avant de la retourner en une seule fois
false
Réponse
Requête réussie
Identifiant unique de la complétion de conversation
"chatcmpl-20260308112637503180122ABCD1234"
Nom du modèle effectivement utilisé
"gpt-5.4"
Type de réponse
chat.completion "chat.completion"
Horodatage de création
1741428397
Liste des choix générés par la conversation
Statistiques d'utilisation des tokens