Wan2.7 Video de referencia

Autorizaciones

Authorization

string

header

requerido

Todas las APIs requieren autenticación con Bearer Token

Obtenga su API Key:

Visite la página de gestión de API Keys para obtener su API Key

Añada al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json

model

enum<string>

requerido

Nombre del modelo, debe ser wan2.7-reference-video

Opciones disponibles:

wan2.7-reference-video

Ejemplo:

"wan2.7-reference-video"

prompt

string

requerido

Prompt textual para la generación de video. Admite chino e inglés; cada carácter / letra / signo de puntuación cuenta como 1, el exceso se trunca automáticamente. Longitud máxima 5000 caracteres

Reglas de indexación de personajes:

Chino: use "图1, 图2 / 视频1, 视频2" — corresponden 1-based al orden de image_urls / video_urls
Inglés: use "Image 1", "Video 1" (mayúscula inicial, espacio entre palabra y dígito)
Imágenes y videos se cuentan por separado, así que pueden coexistir "Image 1" y "Video 1"
Si solo se proporciona una imagen o un video de referencia, también puede escribir "la imagen de referencia" o "el video de referencia"

Imagen multi-cuadrícula (storyboard): cuando se proporciona una imagen multi-cuadrícula, describa los planos clave en forma de storyboard; el modelo reconoce el diseño de la cuadrícula y completa las transiciones

Maximum string length: 5000

Ejemplo:

"Video 1 sostiene Image 3 y toca un suave folk country en la silla de Image 4"

negative_prompt

string

Prompt negativo que describe lo que no debe aparecer en el video. Admite chino e inglés. Longitud máxima 500 caracteres; el exceso se trunca automáticamente

Maximum string length: 500

Ejemplo:

"Borroso, baja calidad"

image_start

string<uri>

URL de la imagen del fotograma inicial, usada como primer fotograma del video generado. No cuenta para el límite image_urls + video_urls ≤ 5. No acepta vinculación de voz (el fotograma inicial no participa en la asignación de voces multipersonaje)

Casos de uso:

El sujeto ya aparece en el fotograma inicial: combine con materiales de referencia para reforzar la consistencia de identidad
El sujeto no está en el fotograma inicial: los materiales de referencia definen nuevos sujetos que aparecen al avanzar el video

Límites de imagen:

Formatos: JPEG, JPG, PNG (sin transparencia), BMP, WEBP
Resolución: ancho y alto en [240, 8000] píxeles
Relación de aspecto: 1:8 ~ 8:1
Tamaño de archivo: hasta 20MB

Ejemplo:

"https://example.com/first_frame.jpg"

image_urls

string<uri>[]

Lista de URLs de imágenes de referencia. Puede aportar sujetos (personas / animales / objetos) o fondos de escena; cuando incluya un sujeto, cada imagen debería contener un único personaje

Límites de cantidad:

image_urls + video_urls total ≤ 5
Al menos uno de image_urls / video_urls debe proporcionarse (pasar solo image_start no es suficiente)

Límites de imagen:

Formatos: JPEG, JPG, PNG (sin transparencia), BMP, WEBP
Resolución: ancho y alto en [240, 8000] píxeles
Relación de aspecto: 1:8 ~ 8:1
Tamaño de archivo: hasta 20MB

Ejemplo:

[
  "https://example.com/ref1.jpg",
  "https://example.com/ref2.jpg"
]

video_urls

string<uri>[]

Lista de URLs de videos de referencia. El video debería contener un sujeto (persona / animal / objeto); no se recomiendan tomas vacías o de fondo puro. Cuando incluya un sujeto, cada video debería contener un único personaje. El audio del video puede usarse como referencia de voz

Límites de cantidad:

image_urls + video_urls total ≤ 5
Al menos uno de image_urls / video_urls debe proporcionarse

Límites de video:

Formatos: mp4, mov
Duración: 1 ~ 30 segundos
Resolución: ancho y alto en [240, 4096] píxeles
Relación de aspecto: 1:8 ~ 8:1
Tamaño de archivo: hasta 100MB

Nota: cuando se proporciona video_urls, duration se limita a 10 segundos

Ejemplo:

["https://example.com/reference.mp4"]

audio_urls

string<uri>[]

[Campo de compatibilidad — preferir model_params.voice_bindings]

Lista de URLs de voces de referencia. Se vinculan posicionalmente a los materiales de referencia en este orden: primero contra video_urls, luego contra image_urls (en el orden de sus listas, uno a uno). Hasta 5 elementos

Prioridad:

Cuando se proporcionan tanto model_params.voice_bindings como audio_urls, solo se usa voice_bindings y este campo se ignora
Si un video en video_urls lleva audio y no se establece vinculación de voz, se usa el audio original; una vinculación de voz explícita anula el audio original

Límites de audio:

Formatos admitidos: wav, mp3
Duración: 1 ~ 10 segundos
Tamaño de archivo: hasta 15MB

Maximum array length: 5

Ejemplo:

[
  "https://example.com/voice1.mp3",
  "https://example.com/voice2.mp3"
]

model_params

object

Contenedor de parámetros avanzados (recomendado)

Show child attributes

quality

enum<string>

predeterminado:720p

Calidad del video, predeterminada 720p

Opciones:

720p: Definición estándar, precio estándar (predeterminado)
1080p: Alta definición, precio mayor

Opciones disponibles:

720p,

1080p

Ejemplo:

"720p"

aspect_ratio

enum<string>

predeterminado:16:9

Relación de aspecto del video, predeterminada 16:9

Comportamiento:

image_start no proporcionado: el video se genera con el aspect_ratio especificado
image_start proporcionado: este campo se ignora; el video usa una relación de aspecto cercana a la imagen del fotograma inicial

Resolución de salida por nivel de calidad:

Calidad	16:9	9:16	1:1	4:3	3:4
720p	1280×720	720×1280	960×960	1104×832	832×1104
1080p	1920×1080	1080×1920	1440×1440	1648×1248	1248×1648

Opciones disponibles:

16:9,

9:16,

1:1,

4:3,

3:4

Ejemplo:

"16:9"

duration

number

predeterminado:5

Duración del video en segundos (entero)

Rango:

Sin video_urls: 2 ~ 15, predeterminado 5
Con video_urls: 2 ~ 10 (limitado a 10 segundos)

Facturación: basada en la duración real del video generado

Rango requerido: 2 <= x <= 15

Ejemplo:

5

seed

integer

Semilla aleatoria, aleatoria por defecto

Notas:

Rango: 1 ~ 2147483647
Fijar la semilla reduce la variación al iterar prompts y mejora la reproducibilidad

Rango requerido: 1 <= x <= 2147483647

Ejemplo:

42

prompt_extend

boolean

predeterminado:false

Si activar la reescritura inteligente del prompt. Cuando se activa, un modelo grande optimiza el prompt, mejorando notablemente los resultados con prompts simples o poco descriptivos.

Nota: El valor predeterminado es false. Omitir el campo o enviar false no activará la reescritura; envíe true explícitamente para habilitarla.

Ejemplo:

false

callback_url

string<uri>

URL de callback HTTPS para la finalización de la tarea

Momento del callback:

Se dispara cuando la tarea se completa, falla o se cancela
Se envía tras la confirmación de facturación

Restricciones de seguridad:

Solo se admite HTTPS
Los callbacks a direcciones IP internas están prohibidos (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
La URL no debe superar 2048 caracteres

Mecanismo de callback:

Tiempo de espera: 10 segundos
Hasta 3 reintentos tras fallo (a 1/2/4 segundos)
El formato de respuesta del callback es idéntico al de la API de consulta de tareas
Códigos 2xx se consideran exitosos; otros códigos disparan reintentos

Ejemplo:

"https://your-domain.com/webhooks/video-task-completed"

Respuesta

Tarea de video creada con éxito

created

integer

Marca de tiempo de creación de la tarea

Ejemplo:

1757169743

string

ID de la tarea

Ejemplo:

"task-unified-1757169743-7cvnl5zw"

model

string

Nombre del modelo realmente usado

Ejemplo:

"wan2.7-reference-video"

object

enum<string>

Tipo específico de tarea

Opciones disponibles:

video.generation.task

progress

integer

Progreso de la tarea en porcentaje (0-100)

Rango requerido: 0 <= x <= 100

Ejemplo:

0

status

enum<string>

Estado de la tarea

Opciones disponibles:

pending,

processing,

completed,

failed

Ejemplo:

"pending"

task_info

object

Información detallada de la tarea de video

Show child attributes

type

enum<string>

Tipo de salida de la tarea

Opciones disponibles:

text,

image,

audio,

video

Ejemplo:

"video"

usage

object

Información de uso y facturación

Show child attributes

Serie de imágenes

Serie de videos

Serie de audio

Serie de texto

Gestión de cuenta

Gestión de tareas

Gestión de archivos

Wan2.7 Video de referencia

Autorizaciones

Todas las APIs requieren autenticación con Bearer Token

Cuerpo

Respuesta

Serie de imágenes

Serie de videos

Serie de audio

Serie de texto

Gestión de cuenta

Gestión de tareas

Gestión de archivos

Documentation Index

Autorizaciones

Todas las APIs requieren autenticación con Bearer Token

Cuerpo

Respuesta