> ## Documentation Index
> Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Qwen Voice Design

> - Erstellt ein benutzerdefiniertes Stimmprofil aus einer Textbeschreibung und gibt den Stimmnamen sowie eine Vorschau-Audiodatei zurück
- [Qwen3 TTS VD](/de/api-manual/audio-series/qwen-tts/qwen3-tts-vd) Sprachsynthese **muss eine über diese API erstellte Stimme verwenden** – systeminterne Stimmen werden nicht unterstützt
- Asynchroner Verarbeitungsmodus; verwenden Sie die zurückgegebene Aufgaben-ID, um das [Ergebnis abzufragen](/de/api-manual/task-management/get-task-detail)
- Generierte Audiolinks sind 24 Stunden gültig – bitte rechtzeitig speichern

**Arbeitsablauf:**
1. Diese API aufrufen, um eine Stimme zu erstellen
2. Aufgabenergebnis abfragen und `result_data.voice` (Stimmname) abrufen
3. [Qwen3 TTS VD](/de/api-manual/audio-series/qwen-tts/qwen3-tts-vd) mit dem `voice`-Parameter für die Sprachsynthese aufrufen


## OpenAPI

````yaml de/api-manual/audio-series/qwen-tts/qwen-voice-design.json POST /v1/audios/generations
openapi: 3.1.0
info:
  title: Qwen Voice Design API
  description: >-
    Erstellt benutzerdefinierte Stimmprofile aus Textbeschreibungen. Gibt den
    Stimmnamen und eine Vorschau-Audiodatei zurück. Das
    qwen3-tts-vd-Sprachsynthese-Modell erfordert Stimmen, die über diese API
    erstellt wurden – systeminterne Stimmen werden nicht unterstützt.
  license:
    name: MIT
  version: 1.0.0
servers:
  - url: https://api.evolink.ai
    description: Produktionsumgebung
security:
  - bearerAuth: []
tags:
  - name: Stimmdesign
    description: Qwen Voice Design API-Endpunkte
paths:
  /v1/audios/generations:
    post:
      tags:
        - Stimmdesign
      summary: Qwen Voice Design
      description: >-
        - Erstellt ein benutzerdefiniertes Stimmprofil aus einer
        Textbeschreibung und gibt den Stimmnamen sowie eine Vorschau-Audiodatei
        zurück

        - [Qwen3 TTS VD](/de/api-manual/audio-series/qwen-tts/qwen3-tts-vd)
        Sprachsynthese **muss eine über diese API erstellte Stimme verwenden** –
        systeminterne Stimmen werden nicht unterstützt

        - Asynchroner Verarbeitungsmodus; verwenden Sie die zurückgegebene
        Aufgaben-ID, um das [Ergebnis
        abzufragen](/de/api-manual/task-management/get-task-detail)

        - Generierte Audiolinks sind 24 Stunden gültig – bitte rechtzeitig
        speichern


        **Arbeitsablauf:**

        1. Diese API aufrufen, um eine Stimme zu erstellen

        2. Aufgabenergebnis abfragen und `result_data.voice` (Stimmname) abrufen

        3. [Qwen3 TTS VD](/de/api-manual/audio-series/qwen-tts/qwen3-tts-vd) mit
        dem `voice`-Parameter für die Sprachsynthese aufrufen
      operationId: createQwenVoiceDesign
      requestBody:
        required: true
        content:
          application/json:
            schema:
              $ref: '#/components/schemas/QwenVoiceDesignRequest'
            examples:
              minimal:
                summary: Minimaler Aufruf
                value:
                  model: qwen-voice-design
                  voice_prompt: >-
                    Ein ruhiger männlicher Nachrichtensprecher mittleren Alters
                    mit tiefer, resonanter Stimme, reich an Magnetismus,
                    gleichmäßigem Tempo und klarer Artikulation
                  preview_text: >-
                    Guten Abend, liebe Zuhörerinnen und Zuhörer. Willkommen zur
                    Abendnachricht.
                  preferred_name: announcer
              full_params:
                summary: Vollständige Parameter
                value:
                  model: qwen-voice-design
                  voice_prompt: >-
                    Eine junge, energiegeladene weibliche Stimme mit schnellem
                    Tempo und deutlich aufsteigender Intonation, geeignet für
                    die Vorstellung von Modeprodukten
                  preview_text: Hi everyone, welcome to today's fashion review!
                  preferred_name: fashion_host
                  language: de
                  sample_rate: 48000
                  response_format: mp3
      responses:
        '200':
          description: Stimmdesign-Aufgabe erfolgreich erstellt
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/QwenVoiceDesignResponse'
        '400':
          description: Ungültige Anfrageparameter
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: invalid_parameter
                  message: 'Missing required parameter: voice_prompt or preview_text'
                  type: invalid_request_error
        '401':
          description: Nicht authentifiziert, ungültiges oder abgelaufenes Token
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: unauthorized
                  message: Invalid or expired token
                  type: authentication_error
        '402':
          description: Unzureichendes Guthaben, Aufladung erforderlich
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: insufficient_quota
                  message: Insufficient quota. Please top up your account.
                  type: insufficient_quota
        '403':
          description: Zugriff verweigert
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: model_access_denied
                  message: 'Token does not have access to model: qwen-voice-design'
                  type: invalid_request_error
        '429':
          description: Anfragelimit überschritten
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: rate_limit_exceeded
                  message: Too many requests, please try again later
                  type: rate_limit_error
        '500':
          description: Interner Serverfehler
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: internal_error
                  message: Internal server error
                  type: api_error
components:
  schemas:
    QwenVoiceDesignRequest:
      type: object
      required:
        - model
        - voice_prompt
        - preview_text
        - preferred_name
      properties:
        model:
          type: string
          description: Modellname
          enum:
            - qwen-voice-design
          default: qwen-voice-design
          example: qwen-voice-design
        voice_prompt:
          type: string
          description: >-
            Textbeschreibung der Stimmmerkmale zur Definition des Stimmprofils


            **Einschränkungen:**

            - Maximal `2048` Zeichen

            - Unterstützt nur Chinesisch und Englisch


            **Empfohlene Beschreibungsdimensionen:**

            - Geschlecht: männlich, weiblich, neutral

            - Alter: Kind (5–12), Teenager (13–18), junger Erwachsener (19–35),
            mittleres Alter (36–55), Senior (55+)

            - Tonlage: hoch, mittel, tief

            - Sprechtempo: schnell, moderat, langsam

            - Emotion: fröhlich, ruhig, sanft, ernst, lebhaft, gefasst

            - Charakter: magnetisch, klar, rau, weich, süß, tief

            - Verwendungszweck: Nachrichtensprecher, Werbung, Hörbuch,
            Animationsfigur, Sprachassistent


            **Beispielbeschreibungen:**

            - `Ein ruhiger Mann mittleren Alters mit langsamem Sprechtempo und
            tiefer magnetischer Stimme, geeignet für Nachrichten oder
            Dokumentarerzählungen`

            - `Eine niedliche Kinderstimme, ca. 8-jähriges Mädchen, leicht
            kindliche Aussprache, geeignet für Animationssynchronisation`

            - `Eine sanfte und intellektuelle Frau, etwa 30 Jahre alt, ruhige
            Tonlage, geeignet für Hörbücher`
          maxLength: 2048
          example: >-
            Ein ruhiger männlicher Nachrichtensprecher mittleren Alters mit
            tiefer, resonanter Stimme, reich an Magnetismus, gleichmäßigem Tempo
            und klarer Artikulation
        preview_text:
          type: string
          description: >-
            Vorschautext zur Erzeugung einer Beispiel-Audiodatei


            **Einschränkungen:**

            - Maximal `1024` Zeichen

            - Unterstützt 10 Sprachen: Chinesisch, Englisch, Japanisch,
            Koreanisch, Deutsch, Französisch, Italienisch, Russisch,
            Portugiesisch, Spanisch

            - Empfohlen, mit dem `language`-Feld übereinzustimmen
          maxLength: 1024
          example: >-
            Guten Abend, liebe Zuhörerinnen und Zuhörer. Willkommen zur
            Abendnachricht.
        preferred_name:
          type: string
          description: >-
            Stimmnamen-Präfix


            **Einschränkungen:**

            - Nur Ziffern, englische Buchstaben und Unterstriche

            - Maximal `16` Zeichen


            Format des generierten vollständigen Stimmnamens:
            `qwen-tts-vd-{preferred_name}-voice-{timestamp}`


            Beispielsweise ergibt die Eingabe von `announcer` einen Stimmnamen
            wie: `qwen-tts-vd-announcer-voice-20260402-a1b2`
          maxLength: 16
          pattern: ^[a-zA-Z0-9_]+$
          example: announcer
        language:
          type: string
          description: >-
            Sprachpräferenz für das Stimmprofil; empfohlen, mit `preview_text`
            übereinzustimmen


            Standardmäßig `zh`, wenn nicht angegeben
          enum:
            - zh
            - en
            - ja
            - ko
            - de
            - fr
            - it
            - ru
            - pt
            - es
          example: de
        sample_rate:
          type: integer
          description: |-
            Abtastrate der Vorschau-Audiodatei (Hz)

            Standardmäßig `24000`, wenn nicht angegeben
          enum:
            - 8000
            - 16000
            - 24000
            - 48000
          example: 24000
        response_format:
          type: string
          description: |-
            Format der Vorschau-Audiodatei

            Standardmäßig `wav`, wenn nicht angegeben
          enum:
            - pcm
            - wav
            - mp3
            - opus
          example: wav
        target_model:
          type: string
          description: >-
            Das TTS-Modell, das die erstellte Stimme antreibt


            **Wichtig:** Das beim Erstellen der Stimme angegebene `target_model`
            muss mit dem bei der anschließenden Sprachsynthese verwendeten
            Modell übereinstimmen, sonst schlägt die Synthese fehl


            | Wert | Beschreibung |

            |-----|------|

            | `qwen3-tts-vd-2026-01-26` | Qwen3-TTS-VD nicht-streaming
            (Standard) |

            | `qwen3-tts-vd-realtime-2026-01-15` | Qwen3-TTS-VD-Realtime
            bidirektionales Streaming (neu) |

            | `qwen3-tts-vd-realtime-2025-12-16` | Qwen3-TTS-VD-Realtime
            bidirektionales Streaming (alt) |


            > Derzeit unterstützt diese Plattform `qwen3-tts-vd-2026-01-26`
            (nicht-streaming); Realtime-Modelle sind noch nicht integriert, aber
            Stimmen können vorab erstellt werden
          enum:
            - qwen3-tts-vd-2026-01-26
            - qwen3-tts-vd-realtime-2026-01-15
            - qwen3-tts-vd-realtime-2025-12-16
          default: qwen3-tts-vd-2026-01-26
          example: qwen3-tts-vd-2026-01-26
        callback_url:
          type: string
          description: >-
            HTTPS-Callback-URL, die nach Abschluss der Aufgabe aufgerufen wird


            **Auslösebedingungen:**

            - Wird ausgelöst, wenn die Aufgabe abgeschlossen, fehlgeschlagen
            oder abgebrochen wurde

            - Wird nach Abrechnungsbestätigung gesendet


            **Sicherheitsbeschränkungen:**

            - Nur HTTPS

            - Interne IP-Adressen werden blockiert (127.0.0.1, 10.x.x.x,
            172.16-31.x.x, 192.168.x.x usw.)

            - URL-Länge darf `2048` Zeichen nicht überschreiten


            **Callback-Verhalten:**

            - Timeout: `10` Sekunden

            - Bis zu `3` Wiederholungsversuche nach Fehlern (nach 1s / 2s / 4s)

            - Antwortformat entspricht der Aufgaben-Abfrage-API

            - HTTP-2xx-Statuscode gilt als Erfolg; andere Codes lösen einen
            Wiederholungsversuch aus
          format: uri
          example: https://your-domain.com/webhooks/voice-design-completed
    QwenVoiceDesignResponse:
      type: object
      properties:
        created:
          type: integer
          description: Zeitstempel der Aufgabenerstellung
          example: 1775123456
        id:
          type: string
          description: Aufgaben-ID
          example: task-unified-1775123456-abcd1234
        model:
          type: string
          description: Tatsächlich verwendeter Modellname
          example: qwen-voice-design
        object:
          type: string
          enum:
            - audio.generation.task
          description: Spezifischer Aufgabentyp
        progress:
          type: integer
          description: Aufgabenfortschritt in Prozent (0–100)
          minimum: 0
          maximum: 100
          example: 0
        status:
          type: string
          description: Aufgabenstatus
          enum:
            - pending
            - processing
            - completed
            - failed
          example: pending
        task_info:
          $ref: '#/components/schemas/AudioTaskInfo'
          description: Details zur Audioaufgabe
        type:
          type: string
          enum:
            - audio
          description: Ausgabetyp der Aufgabe
          example: audio
        usage:
          $ref: '#/components/schemas/AudioUsage'
          description: Nutzungs- und Abrechnungsinformationen
    ErrorResponse:
      type: object
      properties:
        error:
          type: object
          properties:
            code:
              type: string
              description: Fehlercodekennung
            message:
              type: string
              description: Fehlerbeschreibung
            type:
              type: string
              description: Fehlertyp
    AudioTaskInfo:
      type: object
      properties:
        can_cancel:
          type: boolean
          description: Gibt an, ob die Aufgabe abgebrochen werden kann
          example: true
        estimated_time:
          type: integer
          description: Geschätzte Abschlusszeit (Sekunden)
          minimum: 0
          example: 15
        audio_type:
          type: string
          description: Typ der Audioaufgabe
          example: voice_design
    AudioUsage:
      type: object
      description: Nutzungsinformationen
      properties:
        credits_reserved:
          type: number
          description: Geschätzte zu verbrauchende Credits
          minimum: 0
          example: 2
  securitySchemes:
    bearerAuth:
      type: http
      scheme: bearer
      description: >-
        ##Alle Endpunkte erfordern eine Bearer-Token-Authentifizierung##


        **API-Schlüssel abrufen:**


        Besuchen Sie die
        [API-Schlüsselverwaltungsseite](https://evolink.ai/dashboard/keys), um
        Ihren API-Schlüssel zu erhalten


        **Fügen Sie folgenden Header zu jeder Anfrage hinzu:**

        ```

        Authorization: Bearer YOUR_API_KEY

        ```

````