EvoLink Auto - Enrutamiento Inteligente de Modelos

Enrutamiento inteligente de modelos

curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "evolink/auto",
  "messages": [
    {
      "role": "user",
      "content": "Presenta la historia del desarrollo de la inteligencia artificial"
    }
  ],
  "temperature": 0.7,
  "top_p": 0.9,
  "top_k": 40,
  "stream": false
}
'

{
  "id": "chatcmpl-20260308112637503180122ABCD1234",
  "model": "gpt-5.4",
  "object": "chat.completion",
  "created": 1741428397,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "La historia del desarrollo de la inteligencia artificial se remonta a la decada de 1950..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 120,
    "total_tokens": 135
  }
}

POST

chat

completions

Enrutamiento inteligente de modelos

curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "evolink/auto",
  "messages": [
    {
      "role": "user",
      "content": "Presenta la historia del desarrollo de la inteligencia artificial"
    }
  ],
  "temperature": 0.7,
  "top_p": 0.9,
  "top_k": 40,
  "stream": false
}
'

{
  "id": "chatcmpl-20260308112637503180122ABCD1234",
  "model": "gpt-5.4",
  "object": "chat.completion",
  "created": 1741428397,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "La historia del desarrollo de la inteligencia artificial se remonta a la decada de 1950..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 120,
    "total_tokens": 135
  }
}

Enrutamiento Inteligente de Modelos

EvoLink Auto es una función de enrutamiento inteligente de modelos que selecciona automáticamente un modelo de IA adecuado según el contenido de su solicitud, sin especificación manual del modelo.

Ventajas Clave

Coincidencia Inteligente: Analiza automáticamente el contenido de la solicitud y selecciona un modelo apropiado
Optimización de Costos: Prioriza modelos rentables mientras mantiene la calidad
Balanceo de Carga: Distribuye automáticamente las solicitudes entre múltiples modelos para mejorar la estabilidad
Transparencia: Devuelve el nombre del modelo realmente utilizado en la respuesta para seguimiento y optimización

Cómo Funciona

El sistema selecciona el modelo más adecuado del conjunto de modelos según la complejidad, longitud y tipo de solicitud.

Modelos Soportados

EvoLink Auto enruta inteligentemente entre modelos de IA principales incluyendo GPT-4, GPT-3.5, Claude, Gemini y más.

Limitaciones

No es adecuado para escenarios que requieren capacidades específicas del modelo (por ejemplo, funciones de visión de GPT-4)
No garantiza el mismo modelo para cada solicitud

Casos de Uso

Ideal para escenarios donde no está seguro de qué modelo usar, o desea que el sistema optimice automáticamente la selección del modelo.

Simplemente establezca el parámetro model en evolink/auto, y el sistema seleccionará automáticamente un modelo adecuado para usted.

BaseURL: La BaseURL predeterminada es https://direct.evolink.ai, que ofrece mejor compatibilidad con modelos de texto y admite conexiones persistentes. https://api.evolink.ai es el endpoint principal para servicios multimodales y actúa como dirección de respaldo para los modelos de texto.

Autorizaciones

Authorization

string

header

requerido

Todas las APIs requieren autenticacion Bearer Token

Obtener API Key:

Visita la Pagina de gestion de API Key para obtener tu API Key

Agregar al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json

model

enum<string>

predeterminado:evolink/auto

requerido

Usar enrutamiento inteligente

Opciones disponibles:

evolink/auto

Ejemplo:

"evolink/auto"

messages

object[]

requerido

Lista de mensajes de la conversacion

Minimum array length: 1

Show child attributes

Ejemplo:

[
  {
    "role": "user",
    "content": "Presenta la historia del desarrollo de la inteligencia artificial"
  }
]

temperature

number

Temperatura de muestreo, controla la aleatoriedad de la salida

Descripcion:

Valores mas bajos (ej. 0.2): salida mas determinista y enfocada
Valores mas altos (ej. 1.5): salida mas aleatoria y creativa

Rango requerido: 0 <= x <= 2

Ejemplo:

0.7

top_p

number

Parametro de muestreo nuclear (Nucleus Sampling)

Descripcion:

Controla el muestreo de los tokens con mayor probabilidad acumulada
Por ejemplo, 0.9 significa seleccionar entre los tokens cuya probabilidad acumulada alcanza el 90%
Valor por defecto: 1.0 (considerar todos los tokens)

Recomendacion: No ajustar temperature y top_p simultaneamente

Rango requerido: 0 <= x <= 1

Ejemplo:

0.9

top_k

integer

Parametro de muestreo Top-K

Descripcion:

Por ejemplo, 10 significa limitar el muestreo a los 10 tokens con mayor probabilidad
Valores mas pequenos hacen la salida mas enfocada
Sin limite por defecto

Rango requerido: x >= 1

Ejemplo:

40

stream

boolean

predeterminado:false

Si se devuelve la respuesta en modo streaming

true: Respuesta en streaming, devuelve el contenido en tiempo real por fragmentos
false: Espera la respuesta completa y la devuelve de una sola vez

Ejemplo:

false

Respuesta

Solicitud exitosa

string

Identificador unico para el completado de la conversacion

Ejemplo:

"chatcmpl-20260308112637503180122ABCD1234"

model

string

Nombre del modelo realmente utilizado

Ejemplo:

"gpt-5.4"

object

enum<string>

Tipo de respuesta

Opciones disponibles:

chat.completion

Ejemplo:

"chat.completion"

created

integer

Marca de tiempo de creacion

Ejemplo:

1741428397

choices

object[]

Lista de opciones generadas en la conversacion

Show child attributes

usage

object

Estadisticas de uso de tokens

Show child attributes

Qwen3 TTS VD EvoLink Auto - Formato Claude

​Enrutamiento Inteligente de Modelos

​Ventajas Clave

​Cómo Funciona

​Modelos Soportados

​Limitaciones

​Casos de Uso

Autorizaciones

Todas las APIs requieren autenticacion Bearer Token

Cuerpo

Respuesta

Enrutamiento Inteligente de Modelos

Ventajas Clave

Cómo Funciona

Modelos Soportados

Limitaciones

Casos de Uso