> ## Documentation Index
> Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Seed-Audio 1.0 Audio-Generierung

> - Multimodale Audio-Generierung mit drei Modi: **Text-zu-Audio**, **Referenzaudio (Stimmklonung)** und **Referenzbild**
- Bis zu `120` Sekunden Audio pro Anfrage
- Asynchroner Modus – verwenden Sie die zurückgegebene Task-ID, um [das Ergebnis abzufragen](/de/api-manual/task-management/get-task-detail)
- Die erzeugten Audio-Links sind 24 Stunden gültig, bitte speichern Sie sie zeitnah


## OpenAPI

````yaml de/api-manual/audio-series/doubao-seed-audio/doubao-seed-audio-1-0.json POST /v1/audios/generations
openapi: 3.1.0
info:
  title: Seed-Audio 1.0 Audio-Generierungs-API
  description: >-
    Multimodale Audio-Generierungs-API für Seed-Audio 1.0. Unterstützt drei Modi
    – Text-zu-Audio, Referenzaudio (Stimmklonung) und Referenzbild-Generierung –
    und erzeugt pro Anfrage bis zu 120 Sekunden Audio. Ideal für Hörbücher,
    Synchronisation, Spiele und mehr.
  license:
    name: MIT
  version: 1.0.0
servers:
  - url: https://api.evolink.ai
    description: Produktion
security:
  - bearerAuth: []
tags:
  - name: Audio-Generierung
    description: Endpunkte zur Audio-Generierung mit Seed-Audio 1.0
paths:
  /v1/audios/generations:
    post:
      tags:
        - Audio-Generierung
      summary: Seed-Audio 1.0 Audio-Generierung
      description: >-
        - Multimodale Audio-Generierung mit drei Modi: **Text-zu-Audio**,
        **Referenzaudio (Stimmklonung)** und **Referenzbild**

        - Bis zu `120` Sekunden Audio pro Anfrage

        - Asynchroner Modus – verwenden Sie die zurückgegebene Task-ID, um [das
        Ergebnis abzufragen](/de/api-manual/task-management/get-task-detail)

        - Die erzeugten Audio-Links sind 24 Stunden gültig, bitte speichern Sie
        sie zeitnah
      operationId: createSeedAudio10
      requestBody:
        required: true
        content:
          application/json:
            schema:
              $ref: '#/components/schemas/SeedAudioRequest'
            examples:
              basic:
                summary: Text-zu-Audio
                value:
                  model: doubao-seed-audio-1-0
                  prompt: >-
                    Willkommen zum Audio-Generierungsdienst. Das Wetter ist
                    heute herrlich.
                  format: mp3
              with_voice:
                summary: Generierung mit einer angegebenen Stimme
                value:
                  model: doubao-seed-audio-1-0
                  prompt: >-
                    Guten Abend, alle zusammen, und willkommen zur
                    Abendnachrichtensendung.
                  audio_references:
                    - zh_female_vv_uranus_bigtts
                  speech_rate: 1.25
              voice_clone:
                summary: Referenzaudio-Generierung (Stimmklonung)
                value:
                  model: doubao-seed-audio-1-0
                  prompt: '@Audio1 Hallo, schön Sie kennenzulernen.'
                  audio_references:
                    - https://example.com/ref-voice.mp3
              multi_voice:
                summary: Gemischte Stimmen (Stimm-ID + Audio-URL)
                value:
                  model: doubao-seed-audio-1-0
                  prompt: '@Audio1 Hallo! @Audio2 Wie läuft Ihr Tag?'
                  audio_references:
                    - zh_female_vv_uranus_bigtts
                    - https://example.com/ref-voice.mp3
              image_ref:
                summary: Referenzbild-Generierung
                value:
                  model: doubao-seed-audio-1-0
                  prompt: >-
                    Erzeuge eine Sprachausgabe, die zur Stimmung des Bildes
                    passt.
                  image_urls:
                    - https://example.com/scene.jpg
      responses:
        '200':
          description: Audio-Generierungstask erfolgreich erstellt
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/SeedAudioResponse'
        '400':
          description: Ungültige Anfrageparameter
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: missing_text
                  message: 'Fehlender erforderlicher Parameter: prompt'
                  type: invalid_request_error
        '401':
          description: Nicht authentifiziert; Token ungültig oder abgelaufen
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: unauthorized
                  message: Ungültiger oder abgelaufener Token
                  type: authentication_error
        '402':
          description: Unzureichendes Kontingent; Aufladung erforderlich
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: insufficient_quota
                  message: Unzureichendes Kontingent. Bitte laden Sie Ihr Konto auf.
                  type: insufficient_quota
        '403':
          description: Keine Zugriffsberechtigung
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: model_access_denied
                  message: >-
                    Token hat keinen Zugriff auf das Modell:
                    doubao-seed-audio-1-0
                  type: invalid_request_error
        '429':
          description: Ratenlimit überschritten
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: rate_limit_exceeded
                  message: Zu viele Anfragen, bitte versuchen Sie es später erneut
                  type: rate_limit_error
        '500':
          description: Interner Serverfehler
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: internal_error
                  message: Interner Serverfehler
                  type: api_error
components:
  schemas:
    SeedAudioRequest:
      type: object
      required:
        - model
        - prompt
      properties:
        model:
          type: string
          description: Modellname
          enum:
            - doubao-seed-audio-1-0
          default: doubao-seed-audio-1-0
          example: doubao-seed-audio-1-0
        prompt:
          type: string
          description: >-
            Der Prompt oder Text, der in Audio synthetisiert werden soll


            **Drei Generierungsmodi (automatisch erkannt anhand der übergebenen
            Referenzressourcen):**

            - **Text-zu-Audio**: Übergeben Sie nur `prompt`, um Audio direkt aus
            dem Prompt zu generieren

            - **Referenzaudio (Stimmklonung)**: Kombinieren Sie mit
            `audio_references`; verwenden Sie die wörtliche Markierung
            `@AudioN`, um auf das N-te Element zu verweisen (nummeriert ab `1`,
            in Array-Reihenfolge)

            - **Referenzbild**: Kombinieren Sie mit `image_urls`; `prompt` muss
            nur den zu synthetisierenden Text enthalten


            > Audio-Referenzen (`audio_references`) und Bild-Referenzen
            (`image_urls`) **schließen sich gegenseitig aus** – pro Anfrage darf
            nur eine davon verwendet werden.


            **Einschränkungen:**

            - Bis zu `1500` Zeichen
          maxLength: 1500
          example: >-
            Willkommen zum Audio-Generierungsdienst. Das Wetter ist heute
            herrlich.
        audio_references:
          type: array
          description: >-
            Liste der Referenzressourcen. Jedes Element kann eine **Stimm-ID**
            oder eine **Referenzaudio-URL** sein, und beide dürfen innerhalb
            desselben Arrays **gemischt** werden


            - **Stimm-ID**: der `voice_type` einer vordefinierten Stimme – die
            vollständige Liste finden Sie unter [Seed-Audio 1.0
            Stimmenliste](/de/api-manual/audio-series/doubao-seed-audio/doubao-seed-audio-1-0-voices)

            - **Audio-URL**: Laden Sie einen Referenzaudio-Clip für die
            Stimmklonung hoch

            - **Schließt sich mit `image_urls` gegenseitig aus**: Referenzaudio
            und Referenzbild sind entweder/oder; sie können nicht zusammen in
            einer Anfrage gesendet werden

            - Verwenden Sie die wörtliche Markierung `@AudioN` im `prompt`, um
            auf das N-te Element zu verweisen (nummeriert ab `1`, in
            Array-Reihenfolge)

            - Wenn nicht angegeben, generiert das Modell frei eine Stimme
            basierend auf `prompt`


            **Mengenbegrenzung:**

            - Insgesamt bis zu `3` Elemente im Array (Stimm-IDs und Audio-URLs
            zusammen)


            **Einschränkungen für Audio-URLs:**

            - Jeder Referenz-Clip ≤ `30` Sekunden und ≤ `10 MB`

            - Formate: `wav` / `mp3` / `pcm` / `ogg_opus`
          items:
            type: string
          maxItems: 3
          example:
            - zh_female_vv_uranus_bigtts
        image_urls:
          type: array
          description: >-
            Liste der Referenzbild-URLs; erzeugt Audio, das zur Stimmung des
            Bildes passt


            - Bei Verwendung einer Bild-Referenz muss `prompt` nur den zu
            synthetisierenden Text enthalten

            - **Schließt sich mit `audio_references` gegenseitig aus**:
            Referenzbild und Referenzaudio sind entweder/oder; sie können nicht
            zusammen in einer Anfrage gesendet werden


            **Einschränkungen:**

            - Derzeit nur `1` Bild, ≤ `10 MB`

            - Formate: `jpeg` / `png` / `webp`
          items:
            type: string
            format: uri
          maxItems: 1
          example:
            - https://example.com/scene.jpg
        format:
          type: string
          description: Format der Audio-Ausgabe
          enum:
            - wav
            - mp3
            - pcm
            - ogg_opus
          default: wav
          example: mp3
        sample_rate:
          type: integer
          description: Abtastrate der Ausgabe (Hz)
          enum:
            - 8000
            - 16000
            - 24000
            - 32000
            - 44100
            - 48000
          default: 24000
          example: 24000
        speech_rate:
          type: number
          description: >-
            Geschwindigkeitsmultiplikator der Sprache (unterstützt zwei
            Dezimalstellen)


            - `1.0`: normale Geschwindigkeit (Standard)

            - `2.0`: 2-fache Geschwindigkeit; `0.5`: halbe Geschwindigkeit


            Bereich `0.5` bis `2.0`
          minimum: 0.5
          maximum: 2
          multipleOf: 0.01
          default: 1
          example: 1.25
        loudness_rate:
          type: number
          description: |-
            Lautstärkemultiplikator (unterstützt zwei Dezimalstellen)

            - `1.0`: normale Lautstärke (Standard)
            - `2.0`: doppelte Lautstärke; `0.5`: halbe Lautstärke

            Bereich `0.5` bis `2.0`
          minimum: 0.5
          maximum: 2
          multipleOf: 0.01
          default: 1
          example: 0.85
        pitch_rate:
          type: integer
          description: >-
            Tonhöhenanpassung, in **Halbtönen**


            - `0`: Standard-Tonhöhe (keine Änderung)

            - **Positive Werte heben die Tonhöhe an**: Je größer der Wert, desto
            höher und schärfer die Stimme; `12` hebt sie um eine Oktave

            - **Negative Werte senken die Tonhöhe**: Je kleiner der Wert, desto
            tiefer und voller die Stimme; `-12` senkt sie um eine Oktave


            Bereich `-12` bis `12`
          minimum: -12
          maximum: 12
          default: 0
          example: 0
        callback_url:
          type: string
          description: >-
            HTTPS-Callback-URL, die nach Abschluss des Tasks aufgerufen wird


            **Wann sie ausgelöst wird:**

            - Wird ausgelöst, wenn der Task abgeschlossen, fehlgeschlagen oder
            abgebrochen wird

            - Wird nach Finalisierung der Abrechnung gesendet


            **Sicherheitsbeschränkungen:**

            - Nur HTTPS

            - Callbacks an interne IP-Adressen sind verboten (127.0.0.1,
            10.x.x.x, 172.16-31.x.x, 192.168.x.x usw.)

            - Die URL-Länge darf `2048` Zeichen nicht überschreiten


            **Callback-Mechanismus:**

            - Timeout: `10` Sekunden

            - Bis zu `3` Wiederholungen bei Fehlschlag (jeweils `1` / `2` / `4`
            Sekunden nach jedem Fehlschlag)

            - Der Callback-Body hat dasselbe Format wie die Antwort der
            Task-Abfrage

            - Eine 2xx-Antwort wird als Erfolg gewertet; andere Statuscodes
            lösen eine Wiederholung aus
          format: uri
          example: https://your-domain.com/webhooks/audio-completed
    SeedAudioResponse:
      type: object
      properties:
        created:
          type: integer
          description: Zeitstempel der Task-Erstellung
          example: 1775200000
        id:
          type: string
          description: Task-ID
          example: task-unified-1775200000-abcd1234
        model:
          type: string
          description: Das tatsächlich verwendete Modell
          example: doubao-seed-audio-1-0
        object:
          type: string
          enum:
            - audio.generation.task
          description: Spezifischer Task-Typ
        progress:
          type: integer
          description: Task-Fortschritt in Prozent (0-100)
          minimum: 0
          maximum: 100
          example: 0
        status:
          type: string
          description: Task-Status
          enum:
            - pending
            - processing
            - completed
            - failed
          example: pending
        task_info:
          $ref: '#/components/schemas/AudioTaskInfo'
          description: Detaillierte Informationen zum Audio-Task
        type:
          type: string
          enum:
            - audio
          description: Typ der Task-Ausgabe
          example: audio
        usage:
          $ref: '#/components/schemas/AudioUsage'
          description: Nutzungs- und Abrechnungsinformationen
    ErrorResponse:
      type: object
      properties:
        error:
          type: object
          properties:
            code:
              type: string
              description: Bezeichner des Fehlercodes
            message:
              type: string
              description: Fehlerbeschreibung
            type:
              type: string
              description: Fehlertyp
    AudioTaskInfo:
      type: object
      properties:
        can_cancel:
          type: boolean
          description: Ob der Task abgebrochen werden kann
          example: true
        estimated_time:
          type: integer
          description: Geschätzte Zeit bis zur Fertigstellung (Sekunden)
          minimum: 0
          example: 15
        audio_type:
          type: string
          description: Typ des Audio-Tasks
          example: audio_generation
    AudioUsage:
      type: object
      description: Nutzungsinformationen
      properties:
        credits_reserved:
          type: number
          description: >-
            Geschätzte zu verbrauchende Credits (durch die maximale Dauer
            reserviert, bei Task-Abschluss nach tatsächlicher Dauer abgerechnet)
          minimum: 0
          example: 9.6
  securitySchemes:
    bearerAuth:
      type: http
      scheme: bearer
      description: >-
        ##Alle Endpunkte erfordern eine Bearer-Token-Authentifizierung##


        **API-Schlüssel erhalten:**


        Besuchen Sie die
        [API-Schlüssel-Verwaltungsseite](https://evolink.ai/dashboard/keys), um
        Ihren API-Schlüssel zu erhalten


        **Fügen Sie ihn dem Anfrage-Header hinzu:**

        ```

        Authorization: Bearer YOUR_API_KEY

        ```

````