image_start), 다수의 참조 이미지(image_urls), 다수의 참조 동영상(video_urls), 캐릭터별 보이스 바인딩image_urls) 또는 참조 동영상(video_urls)이 필요합니다. image_start만으로는 요건을 충족하지 않습니다. image_urls + video_urls 합계 ≤ 5image_urls / video_urls 배열 순서에 1-based로 대응. 이미지와 동영상은 별도로 카운트되어 “Image 1”과 “Video 1”이 공존 가능model_params.voice_bindings(정밀 바인딩) 사용 권장. 레거시 필드 audio_urls(위치 정렬)도 지원Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
API Key 받기:
API Key 관리 페이지에서 API Key를 받으세요
요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY모델명, wan2.7-reference-video 고정
wan2.7-reference-video "wan2.7-reference-video"
동영상 생성용 텍스트 프롬프트. 중국어와 영어 지원, 각 글자 / 문자 / 문장부호를 1자로 카운트하며 초과분은 자동으로 잘립니다. 최대 5000자
캐릭터 인덱싱 규칙:
image_urls / video_urls 배열 순서에 1-based로 대응다중 그리드 이미지(스토리보드): 다중 그리드 이미지 1장을 전달하는 경우, 프롬프트는 다중 분할 형식으로 핵심 화면을 기술. 모델이 그리드 레이아웃을 인식하고 전환을 자동 보완합니다
5000"Video 1이 Image 3을 안고 Image 4의 의자에서 부드러운 컨트리 포크를 연주함"
동영상에 나타나지 않기를 원하는 내용을 기술하는 네거티브 프롬프트. 중국어와 영어 지원, 최대 500자, 초과분은 자동으로 잘립니다
500"흐림, 저품질"
시작 프레임 이미지 URL. 동영상의 시작 화면으로 사용. image_urls + video_urls ≤ 5의 참조 미디어 상한에 카운트되지 않음. 보이스 바인딩을 받지 않음(시작 프레임 자체는 다중 캐릭터 보이스 할당에 참여하지 않음)
활용 시나리오:
이미지 제한:
[240, 8000] 픽셀20MB 이하"https://example.com/first_frame.jpg"
참조 이미지 URL 배열. 주체 캐릭터(인물/동물/사물) 또는 장면 배경 제공 가능. 주체 포함 시 각 이미지에 단일 캐릭터만 포함 권장
수량 제한:
image_urls + video_urls 합계 ≤ 5video_urls와 함께 둘 중 하나 이상 필수(image_start만으로는 요건을 충족하지 않음)이미지 제한:
[240, 8000] 픽셀20MB 이하[
"https://example.com/ref1.jpg",
"https://example.com/ref2.jpg"
]참조 동영상 URL 배열. 동영상 내용에는 주체(인물/동물/사물) 포함을 권장하며, 빈 샷이나 순수 배경 동영상은 비권장. 주체 포함 시 각 동영상에 단일 캐릭터만 포함 권장. 동영상에 음성이 있으면 보이스 참조로 활용 가능
수량 제한:
image_urls + video_urls 합계 ≤ 5image_urls와 함께 둘 중 하나 이상 필수동영상 제한:
1 ~ 30초[240, 4096] 픽셀100MB 이하참고: 요청에 video_urls를 전달하면 duration 상한이 10초로 제한됩니다
["https://example.com/reference.mp4"][호환성 필드 — model_params.voice_bindings 사용 권장]
참조 보이스 음성 URL 배열. 참조 소재에 위치 순서대로 바인딩됩니다 — 먼저 video_urls 배열, 그다음 image_urls 배열의 순으로 출현 순서에 1대1 정렬. 최대 5개 요소
우선순위:
model_params.voice_bindings와 audio_urls를 동시에 전달한 경우 voice_bindings만 사용되며 본 필드는 무시됩니다video_urls의 동영상에 음성이 있고 보이스 바인딩이 미지정인 경우 원본 음성을 사용합니다. 명시적 보이스 바인딩 지정 시 원본을 덮어씁니다음성 제한:
wav, mp31 ~ 10초15MB 이하5[
"https://example.com/voice1.mp3",
"https://example.com/voice2.mp3"
]고급 파라미터 컨테이너(권장)
동영상 품질, 기본값 720p
옵션:
720p: 표준 화질, 표준 가격(기본)1080p: 고화질, 가격 상승720p, 1080p "720p"
동영상 종횡비, 기본값 16:9
동작:
image_start 미전달: 지정한 aspect_ratio로 동영상 생성image_start 전달: 본 필드는 무시되며, 시작 프레임 이미지의 종횡비에 가까운 비율로 생성품질 등급별 출력 해상도:
| 품질 | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
동영상 길이(초, 정수)
범위:
video_urls 미전달: 2 ~ 15, 기본값 5video_urls 전달: 2 ~ 10(10초로 제한)청구: 실제 생성된 동영상 길이 기준
2 <= x <= 155
랜덤 시드, 기본값은 랜덤
설명:
1 ~ 21474836471 <= x <= 214748364742
프롬프트 지능 재작성 활성화 여부. 활성화 시 대형 모델이 프롬프트를 최적화하여 단순하거나 설명이 부족한 프롬프트의 결과를 크게 개선합니다.
참고: 기본값은 false입니다. 필드를 생략하거나 false를 보내면 재작성이 발생하지 않습니다. 활성화하려면 명시적으로 true를 보내세요.
false
작업 완료 시의 HTTPS 콜백 URL
콜백 시점:
보안 제약:
2048자 이하콜백 메커니즘:
10초3회 재시도(실패 후 1/2/4초 시점)"https://your-domain.com/webhooks/video-task-completed"
동영상 작업 생성 성공
작업 생성 타임스탬프
1757169743
작업 ID
"task-unified-1757169743-7cvnl5zw"
실제로 사용한 모델명
"wan2.7-reference-video"
작업의 구체적인 종류
video.generation.task 작업 진행률 (0-100)
0 <= x <= 1000
작업 상태
pending, processing, completed, failed "pending"
동영상 작업 상세 정보
작업 출력 유형
text, image, audio, video "video"
사용량 및 청구 정보