EvoLink Auto - Enrutamiento Inteligente de Modelos
El sistema selecciona automaticamente el modelo mas adecuado para procesar la solicitud
Enrutamiento Inteligente de Modelos
EvoLink Auto es una función de enrutamiento inteligente de modelos que selecciona automáticamente un modelo de IA adecuado según el contenido de su solicitud, sin especificación manual del modelo.Ventajas Clave
- Coincidencia Inteligente: Analiza automáticamente el contenido de la solicitud y selecciona un modelo apropiado
- Optimización de Costos: Prioriza modelos rentables mientras mantiene la calidad
- Balanceo de Carga: Distribuye automáticamente las solicitudes entre múltiples modelos para mejorar la estabilidad
- Transparencia: Devuelve el nombre del modelo realmente utilizado en la respuesta para seguimiento y optimización
Cómo Funciona
El sistema selecciona el modelo más adecuado del conjunto de modelos según la complejidad, longitud y tipo de solicitud.Modelos Soportados
EvoLink Auto enruta inteligentemente entre modelos de IA principales incluyendo GPT-4, GPT-3.5, Claude, Gemini y más.Limitaciones
- No es adecuado para escenarios que requieren capacidades específicas del modelo (por ejemplo, funciones de visión de GPT-4)
- No garantiza el mismo modelo para cada solicitud
Casos de Uso
Ideal para escenarios donde no está seguro de qué modelo usar, o desea que el sistema optimice automáticamente la selección del modelo.model en evolink/auto, y el sistema seleccionará automáticamente un modelo adecuado para usted.https://direct.evolink.ai, que ofrece mejor compatibilidad con modelos de texto y admite conexiones persistentes. https://api.evolink.ai es el endpoint principal para servicios multimodales y actúa como dirección de respaldo para los modelos de texto.Autorizaciones
Todas las APIs requieren autenticacion Bearer Token
Obtener API Key:
Visita la Pagina de gestion de API Key para obtener tu API Key
Agregar al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYCuerpo
Usar enrutamiento inteligente
evolink/auto "evolink/auto"
Lista de mensajes de la conversacion
1[
{
"role": "user",
"content": "Presenta la historia del desarrollo de la inteligencia artificial"
}
]Temperatura de muestreo, controla la aleatoriedad de la salida
Descripcion:
- Valores mas bajos (ej. 0.2): salida mas determinista y enfocada
- Valores mas altos (ej. 1.5): salida mas aleatoria y creativa
0 <= x <= 20.7
Parametro de muestreo nuclear (Nucleus Sampling)
Descripcion:
- Controla el muestreo de los tokens con mayor probabilidad acumulada
- Por ejemplo, 0.9 significa seleccionar entre los tokens cuya probabilidad acumulada alcanza el 90%
- Valor por defecto: 1.0 (considerar todos los tokens)
Recomendacion: No ajustar temperature y top_p simultaneamente
0 <= x <= 10.9
Parametro de muestreo Top-K
Descripcion:
- Por ejemplo, 10 significa limitar el muestreo a los 10 tokens con mayor probabilidad
- Valores mas pequenos hacen la salida mas enfocada
- Sin limite por defecto
x >= 140
Si se devuelve la respuesta en modo streaming
true: Respuesta en streaming, devuelve el contenido en tiempo real por fragmentosfalse: Espera la respuesta completa y la devuelve de una sola vez
false
Respuesta
Solicitud exitosa
Identificador unico para el completado de la conversacion
"chatcmpl-20260308112637503180122ABCD1234"
Nombre del modelo realmente utilizado
"gpt-5.4"
Tipo de respuesta
chat.completion "chat.completion"
Marca de tiempo de creacion
1741428397
Lista de opciones generadas en la conversacion
Estadisticas de uso de tokens