> ## Documentation Index
> Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Seed-Audio 1.0 Generacion de Audio

> - Generacion de audio multimodal con tres modos: **texto a audio**, **audio de referencia (clonacion de voz)** e **imagen de referencia**
- Hasta `120` segundos de audio por solicitud
- Modo asincronico — use el ID de tarea devuelto para [consultar el resultado](/es/api-manual/task-management/get-task-detail)
- Los enlaces de audio generados son validos durante 24 horas, guardelos a tiempo


## OpenAPI

````yaml es/api-manual/audio-series/doubao-seed-audio/doubao-seed-audio-1-0.json POST /v1/audios/generations
openapi: 3.1.0
info:
  title: API de Generacion de Audio Seed-Audio 1.0
  description: >-
    API multimodal de generacion de audio Seed-Audio 1.0. Admite tres modos —
    texto a audio, audio de referencia (clonacion de voz) y generacion con
    imagen de referencia — produciendo hasta 120 segundos de audio por
    solicitud. Ideal para audiolibros, doblaje, videojuegos y mas.
  license:
    name: MIT
  version: 1.0.0
servers:
  - url: https://api.evolink.ai
    description: Produccion
security:
  - bearerAuth: []
tags:
  - name: Generacion de Audio
    description: Endpoints de generacion de audio de Seed-Audio 1.0
paths:
  /v1/audios/generations:
    post:
      tags:
        - Generacion de Audio
      summary: Generacion de Audio Seed-Audio 1.0
      description: >-
        - Generacion de audio multimodal con tres modos: **texto a audio**,
        **audio de referencia (clonacion de voz)** e **imagen de referencia**

        - Hasta `120` segundos de audio por solicitud

        - Modo asincronico — use el ID de tarea devuelto para [consultar el
        resultado](/es/api-manual/task-management/get-task-detail)

        - Los enlaces de audio generados son validos durante 24 horas, guardelos
        a tiempo
      operationId: createSeedAudio10
      requestBody:
        required: true
        content:
          application/json:
            schema:
              $ref: '#/components/schemas/SeedAudioRequest'
            examples:
              basic:
                summary: Texto a audio
                value:
                  model: doubao-seed-audio-1-0
                  prompt: >-
                    Bienvenido al servicio de generacion de audio. El clima esta
                    encantador hoy.
                  format: mp3
              with_voice:
                summary: Generar con una voz especificada
                value:
                  model: doubao-seed-audio-1-0
                  prompt: >-
                    Buenas noches a todos y bienvenidos a las noticias de la
                    tarde.
                  audio_references:
                    - zh_female_vv_uranus_bigtts
                  speech_rate: 1.25
              voice_clone:
                summary: Generacion con audio de referencia (clonacion de voz)
                value:
                  model: doubao-seed-audio-1-0
                  prompt: '@audio1 Hola, encantado de conocerte.'
                  audio_references:
                    - https://example.com/ref-voice.mp3
              multi_voice:
                summary: Voces mixtas (ID de voz + URL de audio)
                value:
                  model: doubao-seed-audio-1-0
                  prompt: '@audio1 Hola! @audio2 Como va tu dia?'
                  audio_references:
                    - zh_female_vv_uranus_bigtts
                    - https://example.com/ref-voice.mp3
              image_ref:
                summary: Generacion con imagen de referencia
                value:
                  model: doubao-seed-audio-1-0
                  prompt: >-
                    Sintetiza una narracion que coincida con el ambiente de la
                    imagen.
                  image_urls:
                    - https://example.com/scene.jpg
      responses:
        '200':
          description: Tarea de generacion de audio creada con exito
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/SeedAudioResponse'
        '400':
          description: Parametros de solicitud no validos
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: missing_text
                  message: 'Falta el parametro obligatorio: prompt'
                  type: invalid_request_error
        '401':
          description: No autenticado; token no valido o caducado
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: unauthorized
                  message: Token no valido o caducado
                  type: authentication_error
        '402':
          description: Cuota insuficiente; se requiere recarga
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: insufficient_quota
                  message: Cuota insuficiente. Por favor recargue su cuenta.
                  type: insufficient_quota
        '403':
          description: Sin permiso de acceso
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: model_access_denied
                  message: 'El token no tiene acceso al modelo: doubao-seed-audio-1-0'
                  type: invalid_request_error
        '429':
          description: Limite de tasa excedido
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: rate_limit_exceeded
                  message: Demasiadas solicitudes, intentelo de nuevo mas tarde
                  type: rate_limit_error
        '500':
          description: Error interno del servidor
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: internal_error
                  message: Error interno del servidor
                  type: api_error
components:
  schemas:
    SeedAudioRequest:
      type: object
      required:
        - model
        - prompt
      properties:
        model:
          type: string
          description: Nombre del modelo
          enum:
            - doubao-seed-audio-1-0
          default: doubao-seed-audio-1-0
          example: doubao-seed-audio-1-0
        prompt:
          type: string
          description: >-
            El prompt o texto a sintetizar en audio


            **Tres modos de generacion (detectados automaticamente segun los
            recursos de referencia que envia):**

            - **Texto a audio**: envie solo `prompt` para generar audio
            directamente desde el texto

            - **Audio de referencia (clonacion de voz)**: combine con
            `audio_references`; use el marcador literal `@audioN` para hacer
            referencia al N-esimo elemento (numerado desde `1`, en el orden del
            arreglo)

            - **Imagen de referencia**: combine con `image_urls`; `prompt` solo
            necesita el texto a sintetizar


            > Las referencias de audio (`audio_references`) y las referencias de
            imagen (`image_urls`) son **mutuamente excluyentes** — solo puede
            usarse una por solicitud.


            **Restricciones:**

            - Hasta `1500` caracteres
          maxLength: 1500
          example: >-
            Bienvenido al servicio de generacion de audio. El clima esta
            encantador hoy.
        audio_references:
          type: array
          description: >-
            Lista de recursos de referencia. Cada elemento puede ser un **ID de
            voz** o una **URL de audio de referencia**, y ambos pueden
            **mezclarse** dentro del mismo arreglo


            - **ID de voz**: el `voice_type` de una voz predefinida — vea la
            lista completa en [Lista de voces de Seed-Audio
            1.0](/es/api-manual/audio-series/doubao-seed-audio/doubao-seed-audio-1-0-voices)

            - **URL de audio**: cargue un clip de audio de referencia para
            clonacion de voz

            - **Mutuamente excluyente con `image_urls`**: el audio de referencia
            y la imagen de referencia se excluyen mutuamente; no pueden enviarse
            juntos en una sola solicitud

            - Use el marcador literal `@audioN` en `prompt` para hacer
            referencia al N-esimo elemento (numerado desde `1`, en el orden del
            arreglo)

            - Si se omite, el modelo genera una voz libremente segun `prompt`


            **Limite de cantidad:**

            - Hasta `3` elementos en total en el arreglo (combinando IDs de voz
            y URLs de audio)


            **Restricciones de URL de audio:**

            - Cada clip de referencia ≤ `30` segundos y ≤ `10 MB`

            - Formatos: `wav` / `mp3` / `pcm` / `ogg_opus`
          items:
            type: string
          maxItems: 3
          example:
            - zh_female_vv_uranus_bigtts
        image_urls:
          type: array
          description: >-
            Lista de URLs de imagenes de referencia; genera audio que coincide
            con el ambiente de la imagen


            - Al usar una referencia de imagen, `prompt` solo necesita el texto
            a sintetizar

            - **Mutuamente excluyente con `audio_references`**: la imagen de
            referencia y el audio de referencia se excluyen mutuamente; no
            pueden enviarse juntos en una sola solicitud


            **Restricciones:**

            - Actualmente solo `1` imagen, ≤ `10 MB`

            - Formatos: `jpeg` / `png` / `webp`
          items:
            type: string
            format: uri
          maxItems: 1
          example:
            - https://example.com/scene.jpg
        format:
          type: string
          description: Formato del audio de salida
          enum:
            - wav
            - mp3
            - pcm
            - ogg_opus
          default: wav
          example: mp3
        sample_rate:
          type: integer
          description: Frecuencia de muestreo de salida (Hz)
          enum:
            - 8000
            - 16000
            - 24000
            - 32000
            - 44100
            - 48000
          default: 24000
          example: 24000
        speech_rate:
          type: number
          description: |-
            Multiplicador de velocidad del habla (admite dos decimales)

            - `1.0`: velocidad normal (predeterminado)
            - `2.0`: velocidad 2x; `0.5`: media velocidad

            Rango `0.5` a `2.0`
          minimum: 0.5
          maximum: 2
          multipleOf: 0.01
          default: 1
          example: 1.25
        loudness_rate:
          type: number
          description: |-
            Multiplicador de volumen (admite dos decimales)

            - `1.0`: volumen normal (predeterminado)
            - `2.0`: volumen 2x; `0.5`: medio volumen

            Rango `0.5` a `2.0`
          minimum: 0.5
          maximum: 2
          multipleOf: 0.01
          default: 1
          example: 0.85
        pitch_rate:
          type: integer
          description: >-
            Ajuste de tono, en **semitonos**


            - `0`: tono predeterminado (sin cambio)

            - **Valores positivos suben el tono**: cuanto mayor sea el valor,
            mas aguda y nitida sera la voz; `12` la sube una octava

            - **Valores negativos bajan el tono**: cuanto menor sea el valor,
            mas grave y profunda sera la voz; `-12` la baja una octava


            Rango `-12` a `12`
          minimum: -12
          maximum: 12
          default: 0
          example: 0
        callback_url:
          type: string
          description: >-
            URL de callback HTTPS invocada cuando finaliza la tarea


            **Cuando se dispara:**

            - Se activa cuando la tarea se completa, falla o se cancela

            - Se envia despues de finalizar la facturacion


            **Restricciones de seguridad:**

            - Solo HTTPS

            - Los callbacks a direcciones IP internas estan prohibidos
            (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)

            - La longitud de la URL no debe superar los `2048` caracteres


            **Mecanismo de callback:**

            - Tiempo de espera: `10` segundos

            - Hasta `3` reintentos en caso de fallo (a los `1` / `2` / `4`
            segundos despues de cada fallo)

            - El cuerpo del callback tiene el mismo formato que la respuesta de
            consulta de tarea

            - Una respuesta 2xx se considera exito; otros codigos de estado
            activan un reintento
          format: uri
          example: https://your-domain.com/webhooks/audio-completed
    SeedAudioResponse:
      type: object
      properties:
        created:
          type: integer
          description: Marca de tiempo de creacion de la tarea
          example: 1775200000
        id:
          type: string
          description: ID de tarea
          example: task-unified-1775200000-abcd1234
        model:
          type: string
          description: El modelo realmente utilizado
          example: doubao-seed-audio-1-0
        object:
          type: string
          enum:
            - audio.generation.task
          description: Tipo especifico de tarea
        progress:
          type: integer
          description: Porcentaje de progreso de la tarea (0-100)
          minimum: 0
          maximum: 100
          example: 0
        status:
          type: string
          description: Estado de la tarea
          enum:
            - pending
            - processing
            - completed
            - failed
          example: pending
        task_info:
          $ref: '#/components/schemas/AudioTaskInfo'
          description: Informacion detallada de la tarea de audio
        type:
          type: string
          enum:
            - audio
          description: Tipo de salida de la tarea
          example: audio
        usage:
          $ref: '#/components/schemas/AudioUsage'
          description: Informacion de uso y facturacion
    ErrorResponse:
      type: object
      properties:
        error:
          type: object
          properties:
            code:
              type: string
              description: Identificador del codigo de error
            message:
              type: string
              description: Descripcion del error
            type:
              type: string
              description: Tipo de error
    AudioTaskInfo:
      type: object
      properties:
        can_cancel:
          type: boolean
          description: Si la tarea puede cancelarse
          example: true
        estimated_time:
          type: integer
          description: Tiempo estimado hasta la finalizacion (segundos)
          minimum: 0
          example: 15
        audio_type:
          type: string
          description: Tipo de tarea de audio
          example: audio_generation
    AudioUsage:
      type: object
      description: Informacion de uso
      properties:
        credits_reserved:
          type: number
          description: >-
            Creditos estimados a consumir (reservados segun la duracion maxima,
            liquidados segun la duracion real cuando finaliza la tarea)
          minimum: 0
          example: 9.6
  securitySchemes:
    bearerAuth:
      type: http
      scheme: bearer
      description: >-
        ##Todos los endpoints requieren autenticacion con Bearer Token##


        **Obtenga su API Key:**


        Visite la [pagina de gestion de API
        Keys](https://evolink.ai/dashboard/keys) para obtener su API Key


        **Agreguela al encabezado de la solicitud:**

        ```

        Authorization: Bearer YOUR_API_KEY

        ```

````