Qwen TTS
Qwen3 TTS VD
- 텍스트를 음성 오디오로 변환하며, Qwen Voice Design으로 생성된 커스텀 음색을 반드시 사용해야 하며, 시스템 기본 음색은 지원하지 않습니다
- 사용 흐름:
qwen-voice-design호출하여 음색 생성 →voice이름 획득 → 본 인터페이스의voice파라미터에 전달 - 비동기 처리 모드이며, 반환된 작업 ID로 조회할 수 있습니다
- 생성된 오디오 링크의 유효 기간은 24시간이므로 빠르게 저장하십시오
POST
인증
##모든 인터페이스는 Bearer Token 인증이 필요합니다##
API Key 발급:
API Key 관리 페이지에서 API Key를 발급받으세요
요청 헤더에 다음을 추가하세요:
Authorization: Bearer YOUR_API_KEY본문
application/json
모델 이름
사용 가능한 옵션:
qwen3-tts-vd 예시:
"qwen3-tts-vd"
합성할 텍스트
제약:
- 최대
600자
Maximum string length:
600예시:
"청취자 여러분, 안녕하세요. 저녁 뉴스를 시청해 주셔서 감사합니다."
음색 이름
- 먼저 Qwen Voice Design을 통해 음색을 생성해야 합니다
- Voice Design 작업 결과의
result_data.voice에서 획득 - 시스템 기본 음색은 지원하지 않음
예시:
"qwen-tts-vd-announcer-voice-20260402-a1b2"
언어 힌트, 모델이 발음 규칙을 선택하는 데 도움
미전달 시 자동 감지
사용 가능한 옵션:
Auto, Chinese, English, Japanese, Korean, French, German, Spanish, Italian, Russian, Portuguese 예시:
"Auto"
작업 완료 후 HTTPS 콜백 주소
콜백 시점:
- 작업 완료(completed), 실패(failed) 또는 취소(cancelled) 시 트리거
- 과금 확인 완료 후 발송
보안 제한:
- HTTPS 프로토콜만 지원
- 내부 IP 주소로의 콜백 금지(127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x 등)
- URL 길이
2048자 이하
콜백 메커니즘:
- 타임아웃:
10초 - 실패 후 최대
3회 재시도(각각 실패 후1초/2초/4초 후 재시도) - 콜백 응답 본문 형식은 작업 조회 인터페이스 반환 형식과 동일
- 콜백 주소가 2xx 상태 코드를 반환하면 성공으로 간주, 그 외 상태 코드는 재시도 트리거
예시:
"https://your-domain.com/webhooks/tts-completed"
응답
음성 합성 작업 생성 성공
작업 생성 타임스탬프
예시:
1775122733
작업 ID
예시:
"task-unified-1775122733-lozyt2i5"
실제 사용된 모델 이름
예시:
"qwen3-tts-vd"
작업의 구체적인 유형
사용 가능한 옵션:
audio.generation.task 작업 진행률 (0-100)
필수 범위:
0 <= x <= 100예시:
0
작업 상태
사용 가능한 옵션:
pending, processing, completed, failed 예시:
"pending"
오디오 작업 상세 정보
작업의 출력 유형
사용 가능한 옵션:
audio 예시:
"audio"
사용량 및 과금 정보