Zum Hauptinhalt springen
POST
/
v1
/
audios
/
generations
curl --request POST \
  --url https://api.evolink.ai/v1/audios/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "qwen3-tts-vd",
  "prompt": "Guten Abend, liebe Zuhörerinnen und Zuhörer. Willkommen zur Abendnachricht.",
  "voice": "qwen-tts-vd-announcer-voice-20260402-a1b2"
}
'
{
  "created": 1775122733,
  "id": "task-unified-1775122733-lozyt2i5",
  "model": "qwen3-tts-vd",
  "object": "audio.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 10,
    "audio_type": "tts"
  },
  "type": "audio",
  "usage": {
    "credits_reserved": 0.32
  }
}

Autorisierungen

Authorization
string
header
erforderlich

##Alle Endpunkte erfordern eine Bearer-Token-Authentifizierung##

API-Schlüssel abrufen:

Besuchen Sie die API-Schlüsselverwaltungsseite, um Ihren API-Schlüssel zu erhalten

Fügen Sie folgenden Header zu jeder Anfrage hinzu:

Authorization: Bearer YOUR_API_KEY

Body

application/json
model
enum<string>
Standard:qwen3-tts-vd
erforderlich

Modellname

Verfügbare Optionen:
qwen3-tts-vd
Beispiel:

"qwen3-tts-vd"

prompt
string
erforderlich

Zu synthetisierender Text

Einschränkungen:

  • Maximal 600 Zeichen
Maximum string length: 600
Beispiel:

"Guten Abend, liebe Zuhörerinnen und Zuhörer. Willkommen zur Abendnachricht."

voice
string
erforderlich

Stimmname

  • Muss zuerst eine Stimme über Qwen Voice Design erstellen
  • Den Wert aus result_data.voice im Voice Design-Aufgabenergebnis entnehmen
  • Systeminterne Stimmen werden nicht unterstützt
Beispiel:

"qwen-tts-vd-announcer-voice-20260402-a1b2"

language_type
enum<string>

Sprachhinweis, der dem Modell hilft, Ausspracheregeln auszuwählen

Wird automatisch erkannt, wenn nicht angegeben

Verfügbare Optionen:
Auto,
Chinese,
English,
Japanese,
Korean,
French,
German,
Spanish,
Italian,
Russian,
Portuguese
Beispiel:

"Auto"

callback_url
string<uri>

HTTPS-Callback-URL, die nach Abschluss der Aufgabe aufgerufen wird

Auslösebedingungen:

  • Wird ausgelöst, wenn die Aufgabe abgeschlossen, fehlgeschlagen oder abgebrochen wurde
  • Wird nach Abrechnungsbestätigung gesendet

Sicherheitsbeschränkungen:

  • Nur HTTPS
  • Interne IP-Adressen werden blockiert (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x usw.)
  • URL-Länge darf 2048 Zeichen nicht überschreiten

Callback-Verhalten:

  • Timeout: 10 Sekunden
  • Bis zu 3 Wiederholungsversuche nach Fehlern (nach 1s / 2s / 4s)
  • Antwortformat entspricht der Aufgaben-Abfrage-API
  • HTTP-2xx-Statuscode gilt als Erfolg; andere Codes lösen einen Wiederholungsversuch aus
Beispiel:

"https://your-domain.com/webhooks/tts-completed"

Antwort

Sprachsynthese-Aufgabe erfolgreich erstellt

created
integer

Zeitstempel der Aufgabenerstellung

Beispiel:

1775122733

id
string

Aufgaben-ID

Beispiel:

"task-unified-1775122733-lozyt2i5"

model
string

Tatsächlich verwendeter Modellname

Beispiel:

"qwen3-tts-vd"

object
enum<string>

Spezifischer Aufgabentyp

Verfügbare Optionen:
audio.generation.task
progress
integer

Aufgabenfortschritt in Prozent (0–100)

Erforderlicher Bereich: 0 <= x <= 100
Beispiel:

0

status
enum<string>

Aufgabenstatus

Verfügbare Optionen:
pending,
processing,
completed,
failed
Beispiel:

"pending"

task_info
object

Details zur Audioaufgabe

type
enum<string>

Ausgabetyp der Aufgabe

Verfügbare Optionen:
audio
Beispiel:

"audio"

usage
object

Nutzungs- und Abrechnungsinformationen