EvoLink Auto - Intelligentes Modell-Routing

curl --request POST \ --url https://direct.evolink.ai/v1/chat/completions \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "evolink/auto", "messages": [ { "role": "user", "content": "Stellen Sie die Entwicklungsgeschichte der künstlichen Intelligenz vor" } ], "temperature": 0.7, "top_p": 0.9, "top_k": 40, "stream": false } '

{ "id": "chatcmpl-20260308112637503180122ABCD1234", "model": "gpt-5.4", "object": "chat.completion", "created": 1741428397, "choices": [ { "index": 0, "message": { "role": "assistant", "content": "Die Entwicklungsgeschichte der künstlichen Intelligenz reicht bis in die 1950er Jahre zurück..." }, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 15, "completion_tokens": 120, "total_tokens": 135 } }

Intelligentes Modell-Routing

EvoLink Auto ist eine intelligente Modell-Routing-Funktion, die automatisch ein geeignetes KI-Modell basierend auf Ihrem Anforderungsinhalt auswählt, ohne manuelle Modellspezifikation.

Hauptvorteile

Intelligentes Matching: Analysiert automatisch den Anforderungsinhalt und wählt ein geeignetes Modell aus

Kostenoptimierung: Priorisiert kosteneffiziente Modelle bei gleichzeitiger Qualitätserhaltung

Lastverteilung: Verteilt Anfragen automatisch auf mehrere Modelle für verbesserte Stabilität

Transparenz: Gibt den tatsächlich verwendeten Modellnamen in der Antwort zurück für Tracking und Optimierung

Funktionsweise

Das System wählt das am besten passende Modell aus dem Modellpool basierend auf Komplexität, Länge und Typ der Anfrage aus.

Unterstützte Modelle

EvoLink Auto routet intelligent zwischen führenden KI-Modellen wie GPT-4, GPT-3.5, Claude, Gemini und mehr.

Einschränkungen

Nicht geeignet für Szenarien, die spezifische Modellfähigkeiten erfordern (z.B. GPT-4 Vision-Funktionen)

Garantiert nicht dasselbe Modell für jede Anfrage

Anwendungsfälle

Ideal für Szenarien, in denen Sie unsicher sind, welches Modell Sie verwenden sollen, oder wenn das System die Modellauswahl automatisch optimieren soll.

Setzen Sie einfach den model-Parameter auf evolink/auto, und das System wählt automatisch ein geeignetes Modell für Sie aus.

BaseURL: Die Standard-BaseURL ist https://direct.evolink.ai und bietet bessere Unterstützung für Textmodelle sowie persistente Verbindungen. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient bei Textmodellen als Ausweichadresse.

Autorisierungen

Authorization

string

header

erforderlich

Alle APIs erfordern Bearer-Token-Authentifizierung

API-Schlüssel erhalten:

Besuchen Sie die API-Schlüssel-Verwaltungsseite, um Ihren API-Schlüssel zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Body

application/json

model

enum<string>

Standard:evolink/auto

erforderlich

Intelligentes Routing verwenden

Verfügbare Optionen:

evolink/auto

Beispiel:

"evolink/auto"

messages

object[]

erforderlich

Liste der Gesprächsnachrichten

Minimum array length: 1

Show child attributes

Beispiel:

[
  {
    "role": "user",
    "content": "Stellen Sie die Entwicklungsgeschichte der künstlichen Intelligenz vor"
  }
]

temperature

number

Sampling-Temperatur, steuert die Zufälligkeit der Ausgabe

Hinweis:

Niedrigere Werte (z.B. 0.2): Bestimmtere, fokussiertere Ausgabe
Höhere Werte (z.B. 1.5): Zufälligere, kreativere Ausgabe

Erforderlicher Bereich: 0 <= x <= 2

Beispiel:

0.7

top_p

number

Nucleus-Sampling-Parameter

Hinweis:

Steuert, aus wie vielen Tokens mit kumulierter Wahrscheinlichkeit gesampelt wird
Z.B. bedeutet 0.9, dass aus Tokens mit einer kumulierten Wahrscheinlichkeit von 90% ausgewählt wird
Standardwert: 1.0 (alle Tokens berücksichtigen)

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0 <= x <= 1

Beispiel:

0.9

top_k

integer

Top-K-Sampling-Parameter

Hinweis:

Z.B. bedeutet 10, dass beim Sampling nur die 10 wahrscheinlichsten Tokens berücksichtigt werden
Kleinere Werte erzeugen fokussiertere Ausgaben
Standardmäßig unbegrenzt

Erforderlicher Bereich: x >= 1

Beispiel:

40

stream

boolean

Standard:false

Ob die Antwort als Stream zurückgegeben werden soll

true: Streaming-Rückgabe, Inhalt wird blockweise in Echtzeit zurückgegeben
false: Warten auf die vollständige Antwort und einmalige Rückgabe

Beispiel:

false

Antwort

Anfrage erfolgreich

string

Eindeutiger Bezeichner für die Chat-Vervollständigung

Beispiel:

"chatcmpl-20260308112637503180122ABCD1234"

model

string

Name des tatsächlich verwendeten Modells

Beispiel:

"gpt-5.4"

object

enum<string>

Antworttyp

Verfügbare Optionen:

chat.completion

Beispiel:

"chat.completion"

created

integer

Erstellungszeitstempel

Beispiel:

1741428397

choices

object[]

Liste der generierten Vervollständigungsoptionen

Show child attributes

usage

object

Token-Nutzungsstatistiken

Show child attributes

Bildserie

Videoserie

Audioserie

Textserie

Kontoverwaltung

Aufgabenverwaltung

Dateiverwaltung

EvoLink Auto - Intelligentes Modell-Routing

Intelligentes Modell-Routing

Hauptvorteile

Funktionsweise

Unterstützte Modelle

Einschränkungen

Anwendungsfälle

Autorisierungen

Alle APIs erfordern Bearer-Token-Authentifizierung

Body

Antwort

Bildserie

Videoserie

Audioserie

Textserie

Kontoverwaltung

Aufgabenverwaltung

Dateiverwaltung

​Intelligentes Modell-Routing

​Hauptvorteile

​Funktionsweise

​Unterstützte Modelle

​Einschränkungen

​Anwendungsfälle

Autorisierungen

Alle APIs erfordern Bearer-Token-Authentifizierung

Body

Antwort

Intelligentes Modell-Routing

Hauptvorteile

Funktionsweise

Unterstützte Modelle

Einschränkungen

Anwendungsfälle