使用流程:
result_data.voice(音色名称)voice 参数进行语音合成##所有接口均需要使用Bearer Token进行认证##
获取 API Key:
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY模型名称
qwen-voice-design "qwen-voice-design"
声音特征描述,用于定义音色
约束:
2048 字符描述维度建议:
推荐写法示例:
沉稳的中年男性,语速缓慢,音色低沉有磁性,适合朗读新闻或纪录片解说可爱的儿童声音,大约8岁女孩,说话略带稚气,适合动画角色配音温柔知性的女性,30岁左右,语调平和,适合有声书朗读2048"沉稳的中年男性播音员,音色低沉浑厚,富有磁性,语速平稳,吐字清晰"
预览文本,用于生成试听音频
约束:
1024 字符language 语种一致1024"各位听众朋友,大家好,欢迎收听晚间新闻。"
音色名称前缀
约束:
16 字符生成的完整音色名格式:qwen-tts-vd-{preferred_name}-voice-{timestamp}
如传入 announcer,最终音色名类似:qwen-tts-vd-announcer-voice-20260402-a1b2
16^[a-zA-Z0-9_]+$"announcer"
音色的语言倾向,建议与 preview_text 语种一致
不传时由上游使用默认值 zh
zh, en, ja, ko, de, fr, it, ru, pt, es "zh"
预览音频采样率(Hz)
不传时由上游使用默认值 24000
8000, 16000, 24000, 48000 24000
预览音频格式
不传时由上游使用默认值 wav
pcm, wav, mp3, opus "wav"
创建的音色将由哪个 TTS 模型驱动
重要: 创建音色时指定的 target_model 必须与后续语音合成时使用的模型一致,否则合成会失败
| 值 | 说明 |
|---|---|
qwen3-tts-vd-2026-01-26 | 千问3-TTS-VD 非流式(默认) |
qwen3-tts-vd-realtime-2026-01-15 | 千问3-TTS-VD-Realtime 双向流式(新版) |
qwen3-tts-vd-realtime-2025-12-16 | 千问3-TTS-VD-Realtime 双向流式(旧版) |
目前本平台已接入
qwen3-tts-vd-2026-01-26(非流式),realtime 模型暂未接入但可预创建音色
qwen3-tts-vd-2026-01-26, qwen3-tts-vd-realtime-2026-01-15, qwen3-tts-vd-realtime-2025-12-16 "qwen3-tts-vd-2026-01-26"
任务完成后的HTTPS回调地址
回调时机:
安全限制:
2048字符回调机制:
10秒3次(会分别在失败的1秒/2秒/4秒后进行重试)"https://your-domain.com/webhooks/voice-design-completed"
声音设计任务创建成功
任务创建时间戳
1775123456
任务ID
"task-unified-1775123456-abcd1234"
实际使用的模型名称
"qwen-voice-design"
任务的具体类型
audio.generation.task 任务进度百分比 (0-100)
0 <= x <= 1000
任务状态
pending, processing, completed, failed "pending"
音频任务详细信息
任务的输出类型
audio "audio"
使用量和计费信息