メインコンテンツへスキップ
POST
/
v1
/
audios
/
generations
curl --request POST \
  --url https://api.evolink.ai/v1/audios/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "qwen3-tts-vd",
  "prompt": "リスナーの皆さん、こんばんは。夜のニュースをお届けします。",
  "voice": "qwen-tts-vd-announcer-voice-20260402-a1b2"
}
'
{
  "created": 1775122733,
  "id": "task-unified-1775122733-lozyt2i5",
  "model": "qwen3-tts-vd",
  "object": "audio.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 10,
    "audio_type": "tts"
  },
  "type": "audio",
  "usage": {
    "credits_reserved": 0.32
  }
}

承認

Authorization
string
header
必須

##すべてのインターフェースは Bearer Token による認証が必要です##

API キーの取得:

API キー管理ページ にアクセスして API キーを取得してください

リクエストヘッダーに以下を追加してください:

Authorization: Bearer YOUR_API_KEY

ボディ

application/json
model
enum<string>
デフォルト:qwen3-tts-vd
必須

モデル名

利用可能なオプション:
qwen3-tts-vd
:

"qwen3-tts-vd"

prompt
string
必須

合成するテキスト

制約:

  • 最大 600 文字
Maximum string length: 600
:

"リスナーの皆さん、こんばんは。夜のニュースをお届けします。"

voice
string
必須

音声名

  • まず Qwen Voice Design で音声を作成する必要があります
  • Voice Design タスク結果の result_data.voice から取得します
  • システム内蔵音声はサポートしていません
:

"qwen-tts-vd-announcer-voice-20260402-a1b2"

language_type
enum<string>

言語ヒント(モデルが発音ルールを選択するのを補助)

指定しない場合は自動検出

利用可能なオプション:
Auto,
Chinese,
English,
Japanese,
Korean,
French,
German,
Spanish,
Italian,
Russian,
Portuguese
:

"Japanese"

callback_url
string<uri>

タスク完了後の HTTPS コールバック URL

コールバックのタイミング:

  • タスクが完了(completed)、失敗(failed)、またはキャンセル(cancelled)した際にトリガー
  • 課金確認後に送信

セキュリティ制限:

  • HTTPS プロトコルのみサポート
  • 内部 IP アドレスへのコールバックは禁止(127.0.0.1、10.x.x.x、172.16-31.x.x、192.168.x.x など)
  • URL の長さは 2048 文字以内

コールバックの仕組み:

  • タイムアウト:10
  • 失敗時は最大 3 回リトライ(失敗後それぞれ 1 秒 / 2 秒 / 4 秒後にリトライ)
  • コールバックのレスポンスボディ形式はタスク照会インターフェースの返却形式と同一
  • コールバック URL が 2xx ステータスコードを返した場合は成功とみなし、それ以外はリトライをトリガー
:

"https://your-domain.com/webhooks/tts-completed"

レスポンス

音声合成タスクの作成に成功

created
integer

タスク作成タイムスタンプ

:

1775122733

id
string

タスク ID

:

"task-unified-1775122733-lozyt2i5"

model
string

実際に使用されたモデル名

:

"qwen3-tts-vd"

object
enum<string>

タスクの具体的なタイプ

利用可能なオプション:
audio.generation.task
progress
integer

タスクの進捗率 (0-100)

必須範囲: 0 <= x <= 100
:

0

status
enum<string>

タスクのステータス

利用可能なオプション:
pending,
processing,
completed,
failed
:

"pending"

task_info
object

音声タスクの詳細情報

type
enum<string>

タスクの出力タイプ

利用可能なオプション:
audio
:

"audio"

usage
object

使用量と課金情報