Qwen TTS
Qwen3 TTS VD
- テキストを音声に変換します。Qwen Voice Design で作成したカスタム音声を必ず使用してください。システム内蔵音声はサポートしていません
- 利用フロー:まず
qwen-voice-designを呼び出して音声を作成 →voice名を取得 → 本インターフェースのvoiceパラメータに渡す - 非同期処理モード:返却されたタスクIDを使って結果を照会してください
- 生成された音声リンクの有効期間は24時間です。速やかに保存してください
POST
承認
##すべてのインターフェースは Bearer Token による認証が必要です##
API キーの取得:
API キー管理ページ にアクセスして API キーを取得してください
リクエストヘッダーに以下を追加してください:
Authorization: Bearer YOUR_API_KEY
ボディ
application/json
モデル名
利用可能なオプション:
qwen3-tts-vd 例:
"qwen3-tts-vd"
合成するテキスト
制約:
- 最大
600文字
Maximum string length:
600例:
"リスナーの皆さん、こんばんは。夜のニュースをお届けします。"
音声名
- まず Qwen Voice Design で音声を作成する必要があります
- Voice Design タスク結果の
result_data.voiceから取得します - システム内蔵音声はサポートしていません
例:
"qwen-tts-vd-announcer-voice-20260402-a1b2"
言語ヒント(モデルが発音ルールを選択するのを補助)
指定しない場合は自動検出
利用可能なオプション:
Auto, Chinese, English, Japanese, Korean, French, German, Spanish, Italian, Russian, Portuguese 例:
"Japanese"
タスク完了後の HTTPS コールバック URL
コールバックのタイミング:
- タスクが完了(completed)、失敗(failed)、またはキャンセル(cancelled)した際にトリガー
- 課金確認後に送信
セキュリティ制限:
- HTTPS プロトコルのみサポート
- 内部 IP アドレスへのコールバックは禁止(127.0.0.1、10.x.x.x、172.16-31.x.x、192.168.x.x など)
- URL の長さは
2048文字以内
コールバックの仕組み:
- タイムアウト:
10秒 - 失敗時は最大
3回リトライ(失敗後それぞれ1秒 /2秒 /4秒後にリトライ) - コールバックのレスポンスボディ形式はタスク照会インターフェースの返却形式と同一
- コールバック URL が 2xx ステータスコードを返した場合は成功とみなし、それ以外はリトライをトリガー
例:
"https://your-domain.com/webhooks/tts-completed"
レスポンス
音声合成タスクの作成に成功
タスク作成タイムスタンプ
例:
1775122733
タスク ID
例:
"task-unified-1775122733-lozyt2i5"
実際に使用されたモデル名
例:
"qwen3-tts-vd"
タスクの具体的なタイプ
利用可能なオプション:
audio.generation.task タスクの進捗率 (0-100)
必須範囲:
0 <= x <= 100例:
0
タスクのステータス
利用可能なオプション:
pending, processing, completed, failed 例:
"pending"
音声タスクの詳細情報
タスクの出力タイプ
利用可能なオプション:
audio 例:
"audio"
使用量と課金情報