EvoLink Auto - Intelligentes Modell-Routing
Das System wählt automatisch das am besten geeignete Modell zur Verarbeitung der Anfrage aus
Intelligentes Modell-Routing
EvoLink Auto ist eine intelligente Modell-Routing-Funktion, die automatisch ein geeignetes KI-Modell basierend auf Ihrem Anforderungsinhalt auswählt, ohne manuelle Modellspezifikation.Hauptvorteile
- Intelligentes Matching: Analysiert automatisch den Anforderungsinhalt und wählt ein geeignetes Modell aus
- Kostenoptimierung: Priorisiert kosteneffiziente Modelle bei gleichzeitiger Qualitätserhaltung
- Lastverteilung: Verteilt Anfragen automatisch auf mehrere Modelle für verbesserte Stabilität
- Transparenz: Gibt den tatsächlich verwendeten Modellnamen in der Antwort zurück für Tracking und Optimierung
Funktionsweise
Das System wählt das am besten passende Modell aus dem Modellpool basierend auf Komplexität, Länge und Typ der Anfrage aus.Unterstützte Modelle
EvoLink Auto routet intelligent zwischen führenden KI-Modellen wie GPT-4, GPT-3.5, Claude, Gemini und mehr.Einschränkungen
- Nicht geeignet für Szenarien, die spezifische Modellfähigkeiten erfordern (z.B. GPT-4 Vision-Funktionen)
- Garantiert nicht dasselbe Modell für jede Anfrage
Anwendungsfälle
Ideal für Szenarien, in denen Sie unsicher sind, welches Modell Sie verwenden sollen, oder wenn das System die Modellauswahl automatisch optimieren soll.model-Parameter auf evolink/auto, und das System wählt automatisch ein geeignetes Modell für Sie aus.https://direct.evolink.ai und bietet bessere Unterstützung für Textmodelle sowie persistente Verbindungen. https://api.evolink.ai ist der primäre Endpunkt für multimodale Dienste und dient bei Textmodellen als Ausweichadresse.Autorisierungen
Alle APIs erfordern Bearer-Token-Authentifizierung
API-Schlüssel erhalten:
Besuchen Sie die API-Schlüssel-Verwaltungsseite, um Ihren API-Schlüssel zu erhalten
Zum Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYBody
Intelligentes Routing verwenden
evolink/auto "evolink/auto"
Liste der Gesprächsnachrichten
1[
{
"role": "user",
"content": "Stellen Sie die Entwicklungsgeschichte der künstlichen Intelligenz vor"
}
]Sampling-Temperatur, steuert die Zufälligkeit der Ausgabe
Hinweis:
- Niedrigere Werte (z.B. 0.2): Bestimmtere, fokussiertere Ausgabe
- Höhere Werte (z.B. 1.5): Zufälligere, kreativere Ausgabe
0 <= x <= 20.7
Nucleus-Sampling-Parameter
Hinweis:
- Steuert, aus wie vielen Tokens mit kumulierter Wahrscheinlichkeit gesampelt wird
- Z.B. bedeutet 0.9, dass aus Tokens mit einer kumulierten Wahrscheinlichkeit von 90% ausgewählt wird
- Standardwert: 1.0 (alle Tokens berücksichtigen)
Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an
0 <= x <= 10.9
Top-K-Sampling-Parameter
Hinweis:
- Z.B. bedeutet 10, dass beim Sampling nur die 10 wahrscheinlichsten Tokens berücksichtigt werden
- Kleinere Werte erzeugen fokussiertere Ausgaben
- Standardmäßig unbegrenzt
x >= 140
Ob die Antwort als Stream zurückgegeben werden soll
true: Streaming-Rückgabe, Inhalt wird blockweise in Echtzeit zurückgegebenfalse: Warten auf die vollständige Antwort und einmalige Rückgabe
false
Antwort
Anfrage erfolgreich
Eindeutiger Bezeichner für die Chat-Vervollständigung
"chatcmpl-20260308112637503180122ABCD1234"
Name des tatsächlich verwendeten Modells
"gpt-5.4"
Antworttyp
chat.completion "chat.completion"
Erstellungszeitstempel
1741428397
Liste der generierten Vervollständigungsoptionen
Token-Nutzungsstatistiken