image_start), múltiples imágenes de referencia (image_urls), múltiples videos de referencia (video_urls) y vínculos de voz por personajeimage_urls) o video de referencia (video_urls) debe proporcionarse; pasar solo image_start no es suficiente. El total de image_urls + video_urls debe ser ≤ 5image_urls / video_urls. Imágenes y videos se cuentan por separado, así que pueden coexistir “Image 1” y “Video 1”model_params.voice_bindings (vinculación precisa); también se admite el campo legado audio_urls (alineación posicional)Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
Obtenga su API Key:
Visite la página de gestión de API Keys para obtener su API Key
Añada al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYNombre del modelo, debe ser wan2.7-reference-video
wan2.7-reference-video "wan2.7-reference-video"
Prompt textual para la generación de video. Admite chino e inglés; cada carácter / letra / signo de puntuación cuenta como 1, el exceso se trunca automáticamente. Longitud máxima 5000 caracteres
Reglas de indexación de personajes:
image_urls / video_urlsImagen multi-cuadrícula (storyboard): cuando se proporciona una imagen multi-cuadrícula, describa los planos clave en forma de storyboard; el modelo reconoce el diseño de la cuadrícula y completa las transiciones
5000"Video 1 sostiene Image 3 y toca un suave folk country en la silla de Image 4"
Prompt negativo que describe lo que no debe aparecer en el video. Admite chino e inglés. Longitud máxima 500 caracteres; el exceso se trunca automáticamente
500"Borroso, baja calidad"
URL de la imagen del fotograma inicial, usada como primer fotograma del video generado. No cuenta para el límite image_urls + video_urls ≤ 5. No acepta vinculación de voz (el fotograma inicial no participa en la asignación de voces multipersonaje)
Casos de uso:
Límites de imagen:
[240, 8000] píxeles20MB"https://example.com/first_frame.jpg"
Lista de URLs de imágenes de referencia. Puede aportar sujetos (personas / animales / objetos) o fondos de escena; cuando incluya un sujeto, cada imagen debería contener un único personaje
Límites de cantidad:
image_urls + video_urls total ≤ 5image_urls / video_urls debe proporcionarse (pasar solo image_start no es suficiente)Límites de imagen:
[240, 8000] píxeles20MB[
"https://example.com/ref1.jpg",
"https://example.com/ref2.jpg"
]Lista de URLs de videos de referencia. El video debería contener un sujeto (persona / animal / objeto); no se recomiendan tomas vacías o de fondo puro. Cuando incluya un sujeto, cada video debería contener un único personaje. El audio del video puede usarse como referencia de voz
Límites de cantidad:
image_urls + video_urls total ≤ 5image_urls / video_urls debe proporcionarseLímites de video:
1 ~ 30 segundos[240, 4096] píxeles100MBNota: cuando se proporciona video_urls, duration se limita a 10 segundos
["https://example.com/reference.mp4"][Campo de compatibilidad — preferir model_params.voice_bindings]
Lista de URLs de voces de referencia. Se vinculan posicionalmente a los materiales de referencia en este orden: primero contra video_urls, luego contra image_urls (en el orden de sus listas, uno a uno). Hasta 5 elementos
Prioridad:
model_params.voice_bindings como audio_urls, solo se usa voice_bindings y este campo se ignoravideo_urls lleva audio y no se establece vinculación de voz, se usa el audio original; una vinculación de voz explícita anula el audio originalLímites de audio:
wav, mp31 ~ 10 segundos15MB5[
"https://example.com/voice1.mp3",
"https://example.com/voice2.mp3"
]Contenedor de parámetros avanzados (recomendado)
Calidad del video, predeterminada 720p
Opciones:
720p: Definición estándar, precio estándar (predeterminado)1080p: Alta definición, precio mayor720p, 1080p "720p"
Relación de aspecto del video, predeterminada 16:9
Comportamiento:
image_start no proporcionado: el video se genera con el aspect_ratio especificadoimage_start proporcionado: este campo se ignora; el video usa una relación de aspecto cercana a la imagen del fotograma inicialResolución de salida por nivel de calidad:
| Calidad | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
Duración del video en segundos (entero)
Rango:
video_urls: 2 ~ 15, predeterminado 5video_urls: 2 ~ 10 (limitado a 10 segundos)Facturación: basada en la duración real del video generado
2 <= x <= 155
Semilla aleatoria, aleatoria por defecto
Notas:
1 ~ 21474836471 <= x <= 214748364742
Si activar la reescritura inteligente del prompt. Cuando se activa, un modelo grande optimiza el prompt, mejorando notablemente los resultados con prompts simples o poco descriptivos.
Nota: El valor predeterminado es false. Omitir el campo o enviar false no activará la reescritura; envíe true explícitamente para habilitarla.
false
URL de callback HTTPS para la finalización de la tarea
Momento del callback:
Restricciones de seguridad:
2048 caracteresMecanismo de callback:
10 segundos3 reintentos tras fallo (a 1/2/4 segundos)"https://your-domain.com/webhooks/video-task-completed"
Tarea de video creada con éxito
Marca de tiempo de creación de la tarea
1757169743
ID de la tarea
"task-unified-1757169743-7cvnl5zw"
Nombre del modelo realmente usado
"wan2.7-reference-video"
Tipo específico de tarea
video.generation.task Progreso de la tarea en porcentaje (0-100)
0 <= x <= 1000
Estado de la tarea
pending, processing, completed, failed "pending"
Información detallada de la tarea de video
Tipo de salida de la tarea
text, image, audio, video "video"
Información de uso y facturación