Saltar al contenido principal
POST
/
v1
/
audios
/
generations
curl --request POST \
  --url https://api.evolink.ai/v1/audios/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "qwen3-tts-vd",
  "prompt": "Estimados oyentes, buenas noches y bienvenidos al noticiero nocturno.",
  "voice": "qwen-tts-vd-announcer-voice-20260402-a1b2"
}
'
{
  "created": 1775122733,
  "id": "task-unified-1775122733-lozyt2i5",
  "model": "qwen3-tts-vd",
  "object": "audio.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 10,
    "audio_type": "tts"
  },
  "type": "audio",
  "usage": {
    "credits_reserved": 0.32
  }
}

Autorizaciones

Authorization
string
header
requerido

##Todas las interfaces requieren autenticación con Bearer Token##

Obtener API Key:

Visita la página de administración de API Key para obtener tu API Key

Agrégalo en el encabezado de solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json
model
enum<string>
predeterminado:qwen3-tts-vd
requerido

Nombre del modelo

Opciones disponibles:
qwen3-tts-vd
Ejemplo:

"qwen3-tts-vd"

prompt
string
requerido

Texto a sintetizar

Restricciones:

  • Máximo 600 caracteres
Maximum string length: 600
Ejemplo:

"Estimados oyentes, buenas noches y bienvenidos al noticiero nocturno."

voice
string
requerido

Nombre del timbre

  • Primero debe crear un timbre a través de Qwen Voice Design
  • Obtenido de result_data.voice en los resultados de la tarea de Voice Design
  • No se admiten timbres del sistema
Ejemplo:

"qwen-tts-vd-announcer-voice-20260402-a1b2"

language_type
enum<string>

Pista de idioma para ayudar al modelo a seleccionar las reglas de pronunciación

Si no se envía, se detecta automáticamente

Opciones disponibles:
Auto,
Chinese,
English,
Japanese,
Korean,
French,
German,
Spanish,
Italian,
Russian,
Portuguese
Ejemplo:

"Auto"

callback_url
string<uri>

Dirección de callback HTTPS tras completar la tarea

Momento del callback:

  • Se activa cuando la tarea se completa (completed), falla (failed) o se cancela (cancelled)
  • Se envía tras confirmar la facturación

Restricciones de seguridad:

  • Solo se admite el protocolo HTTPS
  • Prohibido hacer callback a direcciones IP internas (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
  • La URL no debe superar los 2048 caracteres

Mecanismo de callback:

  • Tiempo de espera: 10 segundos
  • Máximo 3 reintentos tras fallo (respectivamente 1/2/4 segundos después del fallo)
  • El formato del cuerpo de respuesta del callback es igual al formato de retorno de la interfaz de consulta de tareas
  • Si la dirección de callback devuelve código de estado 2xx se considera exitoso; otros códigos activan reintentos
Ejemplo:

"https://your-domain.com/webhooks/tts-completed"

Respuesta

Tarea de síntesis de voz creada con éxito

created
integer

Marca de tiempo de creación de la tarea

Ejemplo:

1775122733

id
string

ID de tarea

Ejemplo:

"task-unified-1775122733-lozyt2i5"

model
string

Nombre del modelo realmente utilizado

Ejemplo:

"qwen3-tts-vd"

object
enum<string>

Tipo específico de la tarea

Opciones disponibles:
audio.generation.task
progress
integer

Porcentaje de progreso de la tarea (0-100)

Rango requerido: 0 <= x <= 100
Ejemplo:

0

status
enum<string>

Estado de la tarea

Opciones disponibles:
pending,
processing,
completed,
failed
Ejemplo:

"pending"

task_info
object

Información detallada de la tarea de audio

type
enum<string>

Tipo de salida de la tarea

Opciones disponibles:
audio
Ejemplo:

"audio"

usage
object

Información de uso y facturación