Qwen3 TTS VD
- Convierte texto en audio de voz; debe utilizarse el timbre personalizado creado con Qwen Voice Design; no se admiten timbres del sistema
- Flujo de uso: llamar a
qwen-voice-designpara crear el timbre → obtener el nombre delvoice→ pasarlo al parámetrovoicede esta interfaz - Modo de procesamiento asíncrono, use el ID de tarea devuelto para consultar
- Los enlaces de audio generados son válidos por 24 horas, guárdelos cuanto antes
Autorizaciones
##Todas las interfaces requieren autenticación con Bearer Token##
Obtener API Key:
Visita la página de administración de API Key para obtener tu API Key
Agrégalo en el encabezado de solicitud:
Authorization: Bearer YOUR_API_KEYCuerpo
Nombre del modelo
qwen3-tts-vd "qwen3-tts-vd"
Texto a sintetizar
Restricciones:
- Máximo
600caracteres
600"Estimados oyentes, buenas noches y bienvenidos al noticiero nocturno."
Nombre del timbre
- Primero debe crear un timbre a través de Qwen Voice Design
- Obtenido de
result_data.voiceen los resultados de la tarea de Voice Design - No se admiten timbres del sistema
"qwen-tts-vd-announcer-voice-20260402-a1b2"
Pista de idioma para ayudar al modelo a seleccionar las reglas de pronunciación
Si no se envía, se detecta automáticamente
Auto, Chinese, English, Japanese, Korean, French, German, Spanish, Italian, Russian, Portuguese "Auto"
Dirección de callback HTTPS tras completar la tarea
Momento del callback:
- Se activa cuando la tarea se completa (completed), falla (failed) o se cancela (cancelled)
- Se envía tras confirmar la facturación
Restricciones de seguridad:
- Solo se admite el protocolo HTTPS
- Prohibido hacer callback a direcciones IP internas (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La URL no debe superar los
2048caracteres
Mecanismo de callback:
- Tiempo de espera:
10segundos - Máximo
3reintentos tras fallo (respectivamente1/2/4segundos después del fallo) - El formato del cuerpo de respuesta del callback es igual al formato de retorno de la interfaz de consulta de tareas
- Si la dirección de callback devuelve código de estado 2xx se considera exitoso; otros códigos activan reintentos
"https://your-domain.com/webhooks/tts-completed"
Respuesta
Tarea de síntesis de voz creada con éxito
Marca de tiempo de creación de la tarea
1775122733
ID de tarea
"task-unified-1775122733-lozyt2i5"
Nombre del modelo realmente utilizado
"qwen3-tts-vd"
Tipo específico de la tarea
audio.generation.task Porcentaje de progreso de la tarea (0-100)
0 <= x <= 1000
Estado de la tarea
pending, processing, completed, failed "pending"
Información detallada de la tarea de audio
Tipo de salida de la tarea
audio "audio"
Información de uso y facturación