Zum Hauptinhalt springen
POST
/
v1
/
chat
/
completions
Intelligentes Modell-Routing
curl --request POST \
  --url https://api.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "evolink/auto",
  "messages": [
    {
      "role": "user",
      "content": "Stellen Sie die Entwicklungsgeschichte der künstlichen Intelligenz vor"
    }
  ],
  "temperature": 0.7,
  "top_p": 0.9,
  "top_k": 40,
  "stream": false
}
'
{
  "id": "chatcmpl-20260308112637503180122ABCD1234",
  "model": "gpt-5.4",
  "object": "chat.completion",
  "created": 1741428397,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Die Entwicklungsgeschichte der künstlichen Intelligenz reicht bis in die 1950er Jahre zurück..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 120,
    "total_tokens": 135
  }
}

Funktionsübersicht

EvoLink Auto ist eine intelligente Modell-Routing-Funktion, die automatisch das am besten geeignete KI-Modell basierend auf Ihrem Anforderungsinhalt auswählt, ohne manuelle Modellspezifikation.

Hauptvorteile

  • Intelligentes Matching: Analysiert automatisch den Anforderungsinhalt und wählt das am besten geeignete Modell aus
  • Kostenoptimierung: Priorisiert kosteneffiziente Modelle bei gleichzeitiger Qualitätserhaltung
  • Lastverteilung: Verteilt Anfragen automatisch auf mehrere Modelle für verbesserte Stabilität
  • Transparenz: Gibt den tatsächlich verwendeten Modellnamen in der Antwort zurück für Tracking und Optimierung

Anwendungsfälle

Ideal für Szenarien, in denen Sie unsicher sind, welches Modell Sie verwenden sollen, oder wenn das System die Modellauswahl automatisch optimieren soll.
Setzen Sie einfach den model-Parameter auf evolink/auto, und das System wählt automatisch das am besten geeignete Modell für Sie aus.

Autorisierungen

Authorization
string
header
erforderlich

Alle APIs erfordern Bearer-Token-Authentifizierung

API-Schlüssel erhalten:

Besuchen Sie die API-Schlüssel-Verwaltungsseite, um Ihren API-Schlüssel zu erhalten

Zum Anfrage-Header hinzufügen:

Authorization: Bearer YOUR_API_KEY

Body

application/json
model
enum<string>
Standard:evolink/auto
erforderlich

Intelligentes Routing verwenden

Verfügbare Optionen:
evolink/auto
Beispiel:

"evolink/auto"

messages
object[]
erforderlich

Liste der Gesprächsnachrichten

Minimum array length: 1
Beispiel:
[
{
"role": "user",
"content": "Stellen Sie die Entwicklungsgeschichte der künstlichen Intelligenz vor"
}
]
temperature
number

Sampling-Temperatur, steuert die Zufälligkeit der Ausgabe

Hinweis:

  • Niedrigere Werte (z.B. 0.2): Bestimmtere, fokussiertere Ausgabe
  • Höhere Werte (z.B. 1.5): Zufälligere, kreativere Ausgabe
Erforderlicher Bereich: 0 <= x <= 2
Beispiel:

0.7

top_p
number

Nucleus-Sampling-Parameter

Hinweis:

  • Steuert, aus wie vielen Tokens mit kumulierter Wahrscheinlichkeit gesampelt wird
  • Z.B. bedeutet 0.9, dass aus Tokens mit einer kumulierten Wahrscheinlichkeit von 90% ausgewählt wird
  • Standardwert: 1.0 (alle Tokens berücksichtigen)

Empfehlung: Passen Sie temperature und top_p nicht gleichzeitig an

Erforderlicher Bereich: 0 <= x <= 1
Beispiel:

0.9

top_k
integer

Top-K-Sampling-Parameter

Hinweis:

  • Z.B. bedeutet 10, dass beim Sampling nur die 10 wahrscheinlichsten Tokens berücksichtigt werden
  • Kleinere Werte erzeugen fokussiertere Ausgaben
  • Standardmäßig unbegrenzt
Erforderlicher Bereich: x >= 1
Beispiel:

40

stream
boolean
Standard:false

Ob die Antwort als Stream zurückgegeben werden soll

  • true: Streaming-Rückgabe, Inhalt wird blockweise in Echtzeit zurückgegeben
  • false: Warten auf die vollständige Antwort und einmalige Rückgabe
Beispiel:

false

Antwort

Anfrage erfolgreich

id
string

Eindeutiger Bezeichner für die Chat-Vervollständigung

Beispiel:

"chatcmpl-20260308112637503180122ABCD1234"

model
string

Name des tatsächlich verwendeten Modells

Beispiel:

"gpt-5.4"

object
enum<string>

Antworttyp

Verfügbare Optionen:
chat.completion
Beispiel:

"chat.completion"

created
integer

Erstellungszeitstempel

Beispiel:

1741428397

choices
object[]

Liste der generierten Vervollständigungsoptionen

usage
object

Token-Nutzungsstatistiken