Wan2.7 Video de referencia
- El modelo WAN2.7 (wan2.7-reference-video) admite generación de referencia a video, usando personas u objetos como protagonistas para producir actuaciones de un solo personaje o interacciones multipersonaje
- Entradas multimodales: fotograma inicial (
image_start), múltiples imágenes de referencia (image_urls), múltiples videos de referencia (video_urls) y vínculos de voz por personaje - Al menos uno de imagen de referencia (
image_urls) o video de referencia (video_urls) debe proporcionarse; pasar soloimage_startno es suficiente. El total deimage_urls+video_urlsdebe ser ≤ 5 - Indexación de personajes en el prompt: en chino use “图1, 图2 / 视频1, 视频2”; en inglés use “Image 1”, “Video 1” — corresponden 1-based al orden de
image_urls/video_urls. Imágenes y videos se cuentan por separado, así que pueden coexistir “Image 1” y “Video 1” - Vinculación de voz multipersonaje: se prefiere
model_params.voice_bindings(vinculación precisa); también se admite el campo legadoaudio_urls(alineación posicional) - Modo de procesamiento asíncrono, use el ID de tarea devuelto para consultar el estado
- Los enlaces de video generados son válidos durante 24 horas, guárdelos cuanto antes
- Facturación: se cobra según “duración del video de entrada + duración del video de salida”; solo se facturan generaciones exitosas, las tareas fallidas son gratuitas
Autorizaciones
Todas las APIs requieren autenticación con Bearer Token
Obtenga su API Key:
Visite la página de gestión de API Keys para obtener su API Key
Añada al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYCuerpo
Nombre del modelo, debe ser wan2.7-reference-video
wan2.7-reference-video "wan2.7-reference-video"
Prompt textual para la generación de video. Admite chino e inglés; cada carácter / letra / signo de puntuación cuenta como 1, el exceso se trunca automáticamente. Longitud máxima 5000 caracteres
Reglas de indexación de personajes:
- Chino: use "图1, 图2 / 视频1, 视频2" — corresponden 1-based al orden de
image_urls/video_urls - Inglés: use "Image 1", "Video 1" (mayúscula inicial, espacio entre palabra y dígito)
- Imágenes y videos se cuentan por separado, así que pueden coexistir "Image 1" y "Video 1"
- Si solo se proporciona una imagen o un video de referencia, también puede escribir "la imagen de referencia" o "el video de referencia"
Imagen multi-cuadrícula (storyboard): cuando se proporciona una imagen multi-cuadrícula, describa los planos clave en forma de storyboard; el modelo reconoce el diseño de la cuadrícula y completa las transiciones
5000"Video 1 sostiene Image 3 y toca un suave folk country en la silla de Image 4"
Prompt negativo que describe lo que no debe aparecer en el video. Admite chino e inglés. Longitud máxima 500 caracteres; el exceso se trunca automáticamente
500"Borroso, baja calidad"
URL de la imagen del fotograma inicial, usada como primer fotograma del video generado. No cuenta para el límite image_urls + video_urls ≤ 5. No acepta vinculación de voz (el fotograma inicial no participa en la asignación de voces multipersonaje)
Casos de uso:
- El sujeto ya aparece en el fotograma inicial: combine con materiales de referencia para reforzar la consistencia de identidad
- El sujeto no está en el fotograma inicial: los materiales de referencia definen nuevos sujetos que aparecen al avanzar el video
Límites de imagen:
- Formatos: JPEG, JPG, PNG (sin transparencia), BMP, WEBP
- Resolución: ancho y alto en
[240, 8000]píxeles - Relación de aspecto: 1:8 ~ 8:1
- Tamaño de archivo: hasta
20MB
"https://example.com/first_frame.jpg"
Lista de URLs de imágenes de referencia. Puede aportar sujetos (personas / animales / objetos) o fondos de escena; cuando incluya un sujeto, cada imagen debería contener un único personaje
Límites de cantidad:
image_urls+video_urlstotal ≤ 5- Al menos uno de
image_urls/video_urlsdebe proporcionarse (pasar soloimage_startno es suficiente)
Límites de imagen:
- Formatos: JPEG, JPG, PNG (sin transparencia), BMP, WEBP
- Resolución: ancho y alto en
[240, 8000]píxeles - Relación de aspecto: 1:8 ~ 8:1
- Tamaño de archivo: hasta
20MB
[
"https://example.com/ref1.jpg",
"https://example.com/ref2.jpg"
]Lista de URLs de videos de referencia. El video debería contener un sujeto (persona / animal / objeto); no se recomiendan tomas vacías o de fondo puro. Cuando incluya un sujeto, cada video debería contener un único personaje. El audio del video puede usarse como referencia de voz
Límites de cantidad:
image_urls+video_urlstotal ≤ 5- Al menos uno de
image_urls/video_urlsdebe proporcionarse
Límites de video:
- Formatos: mp4, mov
- Duración:
1 ~ 30segundos - Resolución: ancho y alto en
[240, 4096]píxeles - Relación de aspecto: 1:8 ~ 8:1
- Tamaño de archivo: hasta
100MB
Nota: cuando se proporciona video_urls, duration se limita a 10 segundos
["https://example.com/reference.mp4"][Campo de compatibilidad — preferir model_params.voice_bindings]
Lista de URLs de voces de referencia. Se vinculan posicionalmente a los materiales de referencia en este orden: primero contra video_urls, luego contra image_urls (en el orden de sus listas, uno a uno). Hasta 5 elementos
Prioridad:
- Cuando se proporcionan tanto
model_params.voice_bindingscomoaudio_urls, solo se usavoice_bindingsy este campo se ignora - Si un video en
video_urlslleva audio y no se establece vinculación de voz, se usa el audio original; una vinculación de voz explícita anula el audio original
Límites de audio:
- Formatos admitidos:
wav,mp3 - Duración:
1 ~ 10segundos - Tamaño de archivo: hasta
15MB
5[
"https://example.com/voice1.mp3",
"https://example.com/voice2.mp3"
]Contenedor de parámetros avanzados (recomendado)
Calidad del video, predeterminada 720p
Opciones:
720p: Definición estándar, precio estándar (predeterminado)1080p: Alta definición, precio mayor
720p, 1080p "720p"
Relación de aspecto del video, predeterminada 16:9
Comportamiento:
image_startno proporcionado: el video se genera con elaspect_ratioespecificadoimage_startproporcionado: este campo se ignora; el video usa una relación de aspecto cercana a la imagen del fotograma inicial
Resolución de salida por nivel de calidad:
| Calidad | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
Duración del video en segundos (entero)
Rango:
- Sin
video_urls:2 ~ 15, predeterminado5 - Con
video_urls:2 ~ 10(limitado a 10 segundos)
Facturación: basada en la duración real del video generado
2 <= x <= 155
Semilla aleatoria, aleatoria por defecto
Notas:
- Rango:
1~2147483647 - Fijar la semilla reduce la variación al iterar prompts y mejora la reproducibilidad
1 <= x <= 214748364742
Si activar la reescritura inteligente del prompt. Cuando se activa, un modelo grande optimiza el prompt, mejorando notablemente los resultados con prompts simples o poco descriptivos.
Nota: El valor predeterminado es false. Omitir el campo o enviar false no activará la reescritura; envíe true explícitamente para habilitarla.
false
URL de callback HTTPS para la finalización de la tarea
Momento del callback:
- Se dispara cuando la tarea se completa, falla o se cancela
- Se envía tras la confirmación de facturación
Restricciones de seguridad:
- Solo se admite HTTPS
- Los callbacks a direcciones IP internas están prohibidos (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La URL no debe superar
2048caracteres
Mecanismo de callback:
- Tiempo de espera:
10segundos - Hasta
3reintentos tras fallo (a1/2/4segundos) - El formato de respuesta del callback es idéntico al de la API de consulta de tareas
- Códigos 2xx se consideran exitosos; otros códigos disparan reintentos
"https://your-domain.com/webhooks/video-task-completed"
Respuesta
Tarea de video creada con éxito
Marca de tiempo de creación de la tarea
1757169743
ID de la tarea
"task-unified-1757169743-7cvnl5zw"
Nombre del modelo realmente usado
"wan2.7-reference-video"
Tipo específico de tarea
video.generation.task Progreso de la tarea en porcentaje (0-100)
0 <= x <= 1000
Estado de la tarea
pending, processing, completed, failed "pending"
Información detallada de la tarea de video
Tipo de salida de la tarea
text, image, audio, video "video"
Información de uso y facturación