메인 콘텐츠로 건너뛰기
POST
/
v1
/
audios
/
generations
curl --request POST \
  --url https://api.evolink.ai/v1/audios/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "qwen3-tts-vd",
  "prompt": "청취자 여러분, 안녕하세요. 저녁 뉴스를 시청해 주셔서 감사합니다.",
  "voice": "qwen-tts-vd-announcer-voice-20260402-a1b2"
}
'
{
  "created": 1775122733,
  "id": "task-unified-1775122733-lozyt2i5",
  "model": "qwen3-tts-vd",
  "object": "audio.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 10,
    "audio_type": "tts"
  },
  "type": "audio",
  "usage": {
    "credits_reserved": 0.32
  }
}

인증

Authorization
string
header
필수

##모든 인터페이스는 Bearer Token 인증이 필요합니다##

API Key 발급:

API Key 관리 페이지에서 API Key를 발급받으세요

요청 헤더에 다음을 추가하세요:

Authorization: Bearer YOUR_API_KEY

본문

application/json
model
enum<string>
기본값:qwen3-tts-vd
필수

모델 이름

사용 가능한 옵션:
qwen3-tts-vd
예시:

"qwen3-tts-vd"

prompt
string
필수

합성할 텍스트

제약:

  • 최대 600
Maximum string length: 600
예시:

"청취자 여러분, 안녕하세요. 저녁 뉴스를 시청해 주셔서 감사합니다."

voice
string
필수

음색 이름

  • 먼저 Qwen Voice Design을 통해 음색을 생성해야 합니다
  • Voice Design 작업 결과의 result_data.voice에서 획득
  • 시스템 기본 음색은 지원하지 않음
예시:

"qwen-tts-vd-announcer-voice-20260402-a1b2"

language_type
enum<string>

언어 힌트, 모델이 발음 규칙을 선택하는 데 도움

미전달 시 자동 감지

사용 가능한 옵션:
Auto,
Chinese,
English,
Japanese,
Korean,
French,
German,
Spanish,
Italian,
Russian,
Portuguese
예시:

"Auto"

callback_url
string<uri>

작업 완료 후 HTTPS 콜백 주소

콜백 시점:

  • 작업 완료(completed), 실패(failed) 또는 취소(cancelled) 시 트리거
  • 과금 확인 완료 후 발송

보안 제한:

  • HTTPS 프로토콜만 지원
  • 내부 IP 주소로의 콜백 금지(127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x 등)
  • URL 길이 2048자 이하

콜백 메커니즘:

  • 타임아웃: 10
  • 실패 후 최대 3회 재시도(각각 실패 후 1초/2초/4초 후 재시도)
  • 콜백 응답 본문 형식은 작업 조회 인터페이스 반환 형식과 동일
  • 콜백 주소가 2xx 상태 코드를 반환하면 성공으로 간주, 그 외 상태 코드는 재시도 트리거
예시:

"https://your-domain.com/webhooks/tts-completed"

응답

음성 합성 작업 생성 성공

created
integer

작업 생성 타임스탬프

예시:

1775122733

id
string

작업 ID

예시:

"task-unified-1775122733-lozyt2i5"

model
string

실제 사용된 모델 이름

예시:

"qwen3-tts-vd"

object
enum<string>

작업의 구체적인 유형

사용 가능한 옵션:
audio.generation.task
progress
integer

작업 진행률 (0-100)

필수 범위: 0 <= x <= 100
예시:

0

status
enum<string>

작업 상태

사용 가능한 옵션:
pending,
processing,
completed,
failed
예시:

"pending"

task_info
object

오디오 작업 상세 정보

type
enum<string>

작업의 출력 유형

사용 가능한 옵션:
audio
예시:

"audio"

usage
object

사용량 및 과금 정보