Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.evolink.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "seedance-2.0-text-to-video",
  "prompt": "一只猫在钢琴上弹奏月光奏鸣曲,电影感光影,特写镜头",
  "duration": 8,
  "quality": "720p",
  "aspect_ratio": "16:9",
  "generate_audio": true
}
'
{
  "created": 1761313744,
  "id": "task-unified-1774857405-abc123",
  "model": "seedance-2.0-text-to-video",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 165,
    "video_duration": 8
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_second",
    "credits_reserved": 50,
    "user_group": "default"
  }
}

Autorizaciones

Authorization
string
header
requerido

##Todas las interfaces requieren autenticacion mediante Bearer Token##

Obtener API Key:

Visite la Pagina de gestion de API Key para obtener su API Key

Agregue en el encabezado de la solicitud al usar:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json
model
enum<string>
requerido

Nombre del modelo de generacion de video

ID del modeloModoVelocidad
seedance-2.0-text-to-videoTexto a videoEstandar
seedance-2.0-image-to-videoImagen a videoEstandar
seedance-2.0-reference-to-videoReferencia multimodalEstandar
seedance-2.0-fast-text-to-videoTexto a videoRapida
seedance-2.0-fast-image-to-videoImagen a videoRapida
seedance-2.0-fast-reference-to-videoReferencia multimodalRapida
Opciones disponibles:
seedance-2.0-text-to-video,
seedance-2.0-image-to-video,
seedance-2.0-reference-to-video,
seedance-2.0-fast-text-to-video,
seedance-2.0-fast-image-to-video,
seedance-2.0-fast-reference-to-video
Ejemplo:

"seedance-2.0-text-to-video"

prompt
string
requerido

Indicacion de texto que describe el video deseado. Admite chino e ingles, se recomienda no exceder 500 caracteres en chino y 1000 palabras en ingles

Uso del prompt segun el modelo:

  • Text-to-Video: descripcion de texto puro, no admite el uso de image_urls, video_urls, audio_urls en el prompt
  • Image-to-Video: descripcion de texto puro, no admite el uso de video_urls, audio_urls en el prompt
  • Reference-to-Video: puede usar lenguaje natural para especificar el uso de cada material, como "primer fotograma es imagen 1", "usar el movimiento de camara del video 1 en todo momento", "audio 1 como musica de fondo"
Ejemplo:

"一只猫在钢琴上弹奏月光奏鸣曲,电影感光影,特写镜头"

image_urls
string<uri>[]

Array de URLs de imagenes

Modelos aplicables y limites de cantidad:

  • Text-to-Video: No admitido
  • Image-to-Video: Obligatorio, 1-2 imagenes
  • Reference-to-Video: Opcional, 0-9 imagenes

Comportamiento de imagenes en Image-to-Video:

Cantidad de imagenesComportamientoRol
1 imagenImagen a video con primer fotogramaSe establece automaticamente como first_frame
2 imagenesImagen a video con primer y ultimo fotograma1ra imagen -> first_frame, 2da imagen -> last_frame

Rol de imagenes en Reference-to-Video:

  • Referencia de estilo, imagen de producto, apariencia de personaje, primer/ultimo fotograma (especificado mediante prompt)

Requisitos de imagen:

  • Formatos admitidos: .jpeg, .png, .webp
  • Relacion de aspecto (ancho/alto): 0.4 ~ 2.5
  • Pixeles de ancho/alto: 300 ~ 6000 px
  • Tamano por imagen: no mas de 30MB
  • El tamano total del cuerpo de la solicitud no debe exceder 64MB
  • Al proporcionar primer y ultimo fotograma, ambas imagenes pueden ser iguales. Si la relacion de aspecto no coincide, se toma el primer fotograma como referencia y el ultimo se recorta automaticamente
  • Las URLs de imagenes deben ser accesibles directamente por el servidor
Maximum array length: 9
Ejemplo:
["https://example.com/image1.jpg"]
video_urls
string<uri>[]

Array de URLs de videos de referencia

Solo aplicable a modelos Reference-to-Video, otros modelos no admiten este parametro

Limite de cantidad: 0-3 videos

Descripcion del rol:

  • Referencia de movimiento de camara, referencia de accion, video original para editar/extender

Requisitos de video:

  • Formatos admitidos: .mp4, .mov
  • Resolucion: 480p, 720p
  • Duracion por video: 2 ~ 15 segundos, maximo 3, duracion total de todos los videos <= 15 segundos
  • Relacion de aspecto (ancho/alto): 0.4 ~ 2.5
  • Pixeles de ancho/alto: 300 ~ 6000 px
  • Pixeles de imagen (ancho x alto): 409,600 ~ 927,408 (ej. 640x640 ~ 834x1112)
  • Tamano por archivo: no mas de 50MB
  • Velocidad de fotogramas: 24 ~ 60 FPS
  • El uso de referencia de video aumentara los costos (la duracion del video de entrada se incluye en la facturacion)
  • Las URLs de video deben ser accesibles directamente por el servidor

Nota: No se puede proporcionar solo audio_urls, debe incluir al menos 1 imagen (image_urls) o 1 video (video_urls)

Maximum array length: 3
Ejemplo:
["https://example.com/reference.mp4"]
audio_urls
string<uri>[]

Array de URLs de audio de referencia

Solo aplicable a modelos Reference-to-Video, otros modelos no admiten este parametro

Limite de cantidad: 0-3 segmentos

Descripcion del rol:

  • Musica de fondo, efectos de sonido, referencia de voz/dialogos

Requisitos de audio:

  • Formatos admitidos: .wav, .mp3
  • Duracion por segmento de audio: 2 ~ 15 segundos, maximo 3 segmentos, duracion total de todo el audio <= 15 segundos
  • Tamano por archivo: no mas de 15MB
  • Las URLs de audio deben ser accesibles directamente por el servidor

Nota: No se puede ingresar solo audio_urls, debe incluir al menos 1 imagen o 1 video

Maximum array length: 3
Ejemplo:
["https://example.com/bgm.mp3"]
duration
integer
predeterminado:5

Duracion del video de salida (segundos), valor predeterminado 5 segundos

  • Admite cualquier valor entero entre 4 y 15 segundos
  • La duracion esta directamente relacionada con la facturacion
  • Aplicable a los 6 modelos
Rango requerido: 4 <= x <= 15
Ejemplo:

8

quality
enum<string>
predeterminado:720p

Resolucion del video, valor predeterminado 720p

Valores opcionales:

  • 480p: menor claridad, precio mas bajo
  • 720p: claridad estandar, este es el valor predeterminado

Aplicable a los 6 modelos

Opciones disponibles:
480p,
720p
Ejemplo:

"720p"

aspect_ratio
enum<string>
predeterminado:16:9

Relacion de aspecto del video, valor predeterminado 16:9

Valores opcionales:

  • 16:9 (horizontal), 9:16 (vertical), 1:1 (cuadrado), 4:3, 3:4, 21:9 (ultra ancho)
  • adaptive: selecciona automaticamente la mejor proporcion

Comportamiento de adaptive segun el modelo:

  • Text-to-Video: selecciona automaticamente segun el contenido de la indicacion
  • Image-to-Video: se adapta automaticamente segun la relacion de aspecto de la imagen del primer fotograma
  • Reference-to-Video: prioridad: proporcion del material de video > proporcion del material de imagen > inferencia de la indicacion

Valores de pixeles por resolucion:

Relacion de aspecto480p720p
16:9864x4961280x720
4:3752x5601112x834
1:1640x640960x960
3:4560x752834x1112
9:16496x864720x1280
21:9992x4321470x630
Opciones disponibles:
16:9,
9:16,
1:1,
4:3,
3:4,
21:9,
adaptive
Ejemplo:

"16:9"

generate_audio
boolean
predeterminado:true

Si se genera audio sincronizado, valor predeterminado true

  • true: el video incluye audio sincronizado (voz, efectos de sonido, musica de fondo), sin cargo adicional
  • false: salida de video sin audio

Aplicable a los 6 modelos

Ejemplo:

true

model_params
object

Parametros extendidos del modelo

Solo aplicable a modelos Text-to-Video (version estandar y rapida)

callback_url
string<uri>

Direccion de callback HTTPS despues de completar la tarea

Momento del callback:

  • Se activa cuando la tarea se completa (completed), falla (failed) o se cancela (cancelled)
  • Se envia despues de confirmar la facturacion

Restricciones de seguridad:

  • Solo admite protocolo HTTPS
  • Prohibido el callback a direcciones IP de red interna (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
  • La longitud de la URL no debe exceder 2048 caracteres

Mecanismo de callback:

  • Tiempo de espera: 10 segundos
  • Maximo 3 reintentos despues del fallo (reintentos a los 1/2/4 segundos despues del fallo)
  • El formato del cuerpo de respuesta del callback es consistente con el formato de retorno de la interfaz de consulta de tareas
  • Un codigo de estado 2xx se considera exitoso, otros codigos de estado activan reintentos

Aplicable a los 6 modelos

Ejemplo:

"https://your-domain.com/webhooks/video-task-completed"

Respuesta

Tarea de generacion de video creada exitosamente

created
integer

Marca de tiempo de creacion de la tarea

Ejemplo:

1761313744

id
string

ID de la tarea

Ejemplo:

"task-unified-1774857405-abc123"

model
string

Nombre del modelo utilizado

Ejemplo:

"seedance-2.0-text-to-video"

object
enum<string>

Tipo especifico de la tarea

Opciones disponibles:
video.generation.task
progress
integer

Porcentaje de progreso de la tarea (0-100)

Rango requerido: 0 <= x <= 100
Ejemplo:

0

status
enum<string>

Estado de la tarea

Opciones disponibles:
pending,
processing,
completed,
failed
Ejemplo:

"pending"

task_info
object

Informacion detallada de la tarea de video

type
enum<string>

Tipo de salida de la tarea

Opciones disponibles:
text,
image,
audio,
video
Ejemplo:

"video"

usage
object

Informacion de uso y facturacion