Wan2.7 참조 비디오
- WAN2.7 (wan2.7-reference-video) 모델은 참조→동영상 생성을 지원하며, 사람이나 사물을 주인공으로 단일 캐릭터 연기 또는 다중 캐릭터 인터랙션 동영상을 생성할 수 있습니다
- 멀티모달 입력: 시작 프레임 이미지(
image_start), 다수의 참조 이미지(image_urls), 다수의 참조 동영상(video_urls), 캐릭터별 보이스 바인딩 - 최소 1개의 참조 이미지(
image_urls) 또는 참조 동영상(video_urls)이 필요합니다.image_start만으로는 요건을 충족하지 않습니다.image_urls+video_urls합계 ≤ 5 - 프롬프트 내 캐릭터 인덱싱: 중국어는 “图1, 图2 / 视频1, 视频2”, 영어는 “Image 1”, “Video 1” 사용 —
image_urls/video_urls배열 순서에 1-based로 대응. 이미지와 동영상은 별도로 카운트되어 “Image 1”과 “Video 1”이 공존 가능 - 다중 캐릭터 보이스 바인딩:
model_params.voice_bindings(정밀 바인딩) 사용 권장. 레거시 필드audio_urls(위치 정렬)도 지원 - 비동기 처리 모드, 반환된 작업 ID로 상태 조회
- 생성된 동영상 링크는 24시간 유효합니다. 가능한 한 빨리 저장하세요
- 청구: “입력 동영상 길이 + 출력 동영상 길이” 기준으로 청구. 생성 성공 시에만 청구되며 실패는 무료
인증
모든 API는 Bearer Token 인증이 필요합니다
API Key 받기:
API Key 관리 페이지에서 API Key를 받으세요
요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY본문
모델명, wan2.7-reference-video 고정
wan2.7-reference-video "wan2.7-reference-video"
동영상 생성용 텍스트 프롬프트. 중국어와 영어 지원, 각 글자 / 문자 / 문장부호를 1자로 카운트하며 초과분은 자동으로 잘립니다. 최대 5000자
캐릭터 인덱싱 규칙:
- 중국어: "图1, 图2 / 视频1, 视频2" 사용 —
image_urls/video_urls배열 순서에 1-based로 대응 - 영어: "Image 1", "Video 1" 사용(첫 글자 대문자, 단어와 숫자 사이 공백)
- 이미지와 동영상은 별도로 카운트되어 "Image 1"과 "Video 1"이 공존 가능
- 참조 이미지나 참조 동영상이 1개뿐인 경우 "the reference image"나 "the reference video"로 간단히 표기 가능
다중 그리드 이미지(스토리보드): 다중 그리드 이미지 1장을 전달하는 경우, 프롬프트는 다중 분할 형식으로 핵심 화면을 기술. 모델이 그리드 레이아웃을 인식하고 전환을 자동 보완합니다
5000"Video 1이 Image 3을 안고 Image 4의 의자에서 부드러운 컨트리 포크를 연주함"
동영상에 나타나지 않기를 원하는 내용을 기술하는 네거티브 프롬프트. 중국어와 영어 지원, 최대 500자, 초과분은 자동으로 잘립니다
500"흐림, 저품질"
시작 프레임 이미지 URL. 동영상의 시작 화면으로 사용. image_urls + video_urls ≤ 5의 참조 미디어 상한에 카운트되지 않음. 보이스 바인딩을 받지 않음(시작 프레임 자체는 다중 캐릭터 보이스 할당에 참여하지 않음)
활용 시나리오:
- 시작 프레임에 참조 대상이 이미 등장: 참조 소재와 결합하여 주체 일관성 강화
- 시작 프레임에 참조 대상이 없음: 참조 소재로 동영상 진행 중 등장하는 새 주체 정의
이미지 제한:
- 포맷: JPEG, JPG, PNG(투명도 미지원), BMP, WEBP
- 해상도: 가로/세로가
[240, 8000]픽셀 - 종횡비: 1:8 ~ 8:1
- 파일 크기:
20MB이하
"https://example.com/first_frame.jpg"
참조 이미지 URL 배열. 주체 캐릭터(인물/동물/사물) 또는 장면 배경 제공 가능. 주체 포함 시 각 이미지에 단일 캐릭터만 포함 권장
수량 제한:
image_urls+video_urls합계 ≤ 5video_urls와 함께 둘 중 하나 이상 필수(image_start만으로는 요건을 충족하지 않음)
이미지 제한:
- 포맷: JPEG, JPG, PNG(투명도 미지원), BMP, WEBP
- 해상도: 가로/세로가
[240, 8000]픽셀 - 종횡비: 1:8 ~ 8:1
- 파일 크기:
20MB이하
[
"https://example.com/ref1.jpg",
"https://example.com/ref2.jpg"
]참조 동영상 URL 배열. 동영상 내용에는 주체(인물/동물/사물) 포함을 권장하며, 빈 샷이나 순수 배경 동영상은 비권장. 주체 포함 시 각 동영상에 단일 캐릭터만 포함 권장. 동영상에 음성이 있으면 보이스 참조로 활용 가능
수량 제한:
image_urls+video_urls합계 ≤ 5image_urls와 함께 둘 중 하나 이상 필수
동영상 제한:
- 포맷: mp4, mov
- 길이:
1 ~ 30초 - 해상도: 가로/세로가
[240, 4096]픽셀 - 종횡비: 1:8 ~ 8:1
- 파일 크기:
100MB이하
참고: 요청에 video_urls를 전달하면 duration 상한이 10초로 제한됩니다
["https://example.com/reference.mp4"][호환성 필드 — model_params.voice_bindings 사용 권장]
참조 보이스 음성 URL 배열. 참조 소재에 위치 순서대로 바인딩됩니다 — 먼저 video_urls 배열, 그다음 image_urls 배열의 순으로 출현 순서에 1대1 정렬. 최대 5개 요소
우선순위:
model_params.voice_bindings와audio_urls를 동시에 전달한 경우voice_bindings만 사용되며 본 필드는 무시됩니다video_urls의 동영상에 음성이 있고 보이스 바인딩이 미지정인 경우 원본 음성을 사용합니다. 명시적 보이스 바인딩 지정 시 원본을 덮어씁니다
음성 제한:
- 지원 포맷:
wav,mp3 - 길이:
1 ~ 10초 - 파일 크기:
15MB이하
5[
"https://example.com/voice1.mp3",
"https://example.com/voice2.mp3"
]고급 파라미터 컨테이너(권장)
동영상 품질, 기본값 720p
옵션:
720p: 표준 화질, 표준 가격(기본)1080p: 고화질, 가격 상승
720p, 1080p "720p"
동영상 종횡비, 기본값 16:9
동작:
image_start미전달: 지정한aspect_ratio로 동영상 생성image_start전달: 본 필드는 무시되며, 시작 프레임 이미지의 종횡비에 가까운 비율로 생성
품질 등급별 출력 해상도:
| 품질 | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
동영상 길이(초, 정수)
범위:
video_urls미전달:2 ~ 15, 기본값5video_urls전달:2 ~ 10(10초로 제한)
청구: 실제 생성된 동영상 길이 기준
2 <= x <= 155
랜덤 시드, 기본값은 랜덤
설명:
- 범위:
1~2147483647 - 시드를 고정하면 프롬프트 반복 시 변동을 줄이고 재현성을 높입니다
1 <= x <= 214748364742
프롬프트 지능 재작성 활성화 여부. 활성화 시 대형 모델이 프롬프트를 최적화하여 단순하거나 설명이 부족한 프롬프트의 결과를 크게 개선합니다.
참고: 기본값은 false입니다. 필드를 생략하거나 false를 보내면 재작성이 발생하지 않습니다. 활성화하려면 명시적으로 true를 보내세요.
false
작업 완료 시의 HTTPS 콜백 URL
콜백 시점:
- 작업 완료(completed), 실패(failed), 취소(cancelled) 시 트리거
- 청구 확정 후 전송
보안 제약:
- HTTPS만 지원
- 내부 IP 주소(127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x 등)로의 콜백 금지
- URL 길이는
2048자 이하
콜백 메커니즘:
- 타임아웃:
10초 - 실패 시 최대
3회 재시도(실패 후1/2/4초 시점) - 콜백 응답 형식은 작업 조회 API와 동일
- 2xx 상태 코드는 성공으로 간주, 그 외는 재시도 트리거
"https://your-domain.com/webhooks/video-task-completed"
응답
동영상 작업 생성 성공
작업 생성 타임스탬프
1757169743
작업 ID
"task-unified-1757169743-7cvnl5zw"
실제로 사용한 모델명
"wan2.7-reference-video"
작업의 구체적인 종류
video.generation.task 작업 진행률 (0-100)
0 <= x <= 1000
작업 상태
pending, processing, completed, failed "pending"
동영상 작업 상세 정보
작업 출력 유형
text, image, audio, video "video"
사용량 및 청구 정보