Saltar al contenido principal
POST
/
v1
/
videos
/
generations
curl --request POST \
  --url https://api.evolink.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "videoretalk",
  "video_url": "https://example.com/speaker.mp4",
  "audio_url": "https://example.com/target-speech.wav"
}
'
{
  "created": 1775200000,
  "id": "task-unified-1775200000-xyz12345",
  "model": "videoretalk",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": false,
    "estimated_time": 90,
    "video_duration": 0
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_second",
    "credits_reserved": 480,
    "user_group": "default"
  }
}

Autorizaciones

Authorization
string
header
requerido

##Todas las interfaces requieren autenticación con Bearer Token##

Obtener API Key:

Visita la página de administración de API Key para obtener tu API Key

Agrégalo en el encabezado de solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json
model
enum<string>
predeterminado:videoretalk
requerido

Nombre del modelo

Opciones disponibles:
videoretalk
Ejemplo:

"videoretalk"

video_url
string<uri>
requerido

URL del video de entrada que contiene la persona cuyo movimiento labial se reemplazará

Requisitos:

  • URL de video accesible públicamente en internet
  • Formatos: MP4, MOV y otros formatos comunes
  • El video debe contener un rostro claramente visible
  • Duración recomendada: 2 ~ 300 segundos
Ejemplo:

"https://example.com/speaker.mp4"

audio_url
string<uri>
requerido

URL del audio objetivo; la persona en el video hablará sincronizando con este audio

Requisitos:

  • URL de audio accesible públicamente en internet
  • Formatos: WAV, MP3, M4A y otros formatos comunes
  • Se recomienda que sea contenido de voz hablada
Ejemplo:

"https://example.com/target-speech.wav"

ref_image_url
string<uri>

URL de imagen de referencia facial

Cuando el video contiene múltiples rostros, use esta imagen para especificar el rostro objetivo cuyo movimiento labial se reemplazará

Requisitos:

  • La imagen debe contener el rostro frontal de la persona objetivo
  • Solo es necesario cuando el video contiene múltiples rostros
Ejemplo:

"https://example.com/target-person-face.jpg"

video_extension
boolean
predeterminado:false

Cuando la duración del audio > duración del video, indica si se extiende automáticamente el video a la duración del audio

  • true: duración de salida = duración del audio (el video se extiende automáticamente)
  • false: duración de salida = min(duración del video, duración del audio)
Ejemplo:

false

query_face_threshold
integer
predeterminado:170

Umbral de confianza para la coincidencia facial

  • Rango: 120 ~ 200
  • Cuanto menor es el valor, más fácil es la coincidencia (puede haber coincidencias incorrectas)
  • Cuanto mayor es el valor, más estricta es la coincidencia (puede fallar la coincidencia)
  • Si aparece el error "no se encontró rostro coincidente", reduzca el valor apropiadamente (por ejemplo, 140)
  • Si coincide con el rostro incorrecto, aumente el valor apropiadamente (por ejemplo, 190)
Rango requerido: 120 <= x <= 200
Ejemplo:

170

callback_url
string<uri>

Dirección de callback HTTPS tras completar la tarea

Momento del callback:

  • Se activa cuando la tarea se completa (completed), falla (failed) o se cancela (cancelled)
  • Se envía tras confirmar la facturación

Restricciones de seguridad:

  • Solo se admite el protocolo HTTPS
  • Prohibido hacer callback a direcciones IP internas (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
  • La URL no debe superar los 2048 caracteres

Mecanismo de callback:

  • Tiempo de espera: 10 segundos
  • Máximo 3 reintentos tras fallo (respectivamente 1/2/4 segundos después del fallo)
  • El formato del cuerpo de respuesta del callback es igual al formato de retorno de la interfaz de consulta de tareas
  • Si la dirección de callback devuelve código de estado 2xx se considera exitoso; otros códigos activan reintentos
Ejemplo:

"https://your-domain.com/webhooks/video-task-completed"

Respuesta

Tarea de generación de video con sincronización labial creada con éxito

created
integer

Marca de tiempo de creación de la tarea

Ejemplo:

1775200000

id
string

ID de tarea

Ejemplo:

"task-unified-1775200000-xyz12345"

model
string

Nombre del modelo realmente utilizado

Ejemplo:

"videoretalk"

object
enum<string>

Tipo específico de la tarea

Opciones disponibles:
video.generation.task
progress
integer

Porcentaje de progreso de la tarea (0-100)

Rango requerido: 0 <= x <= 100
Ejemplo:

0

status
enum<string>

Estado de la tarea

EstadoprogressDescripción
pending0~10En espera de procesamiento
processing10~80En procesamiento
completed100Completado
failed0Fallido
Opciones disponibles:
pending,
processing,
completed,
failed
Ejemplo:

"pending"

task_info
object

Información detallada de la tarea de video

type
enum<string>

Tipo de salida de la tarea

Opciones disponibles:
video
Ejemplo:

"video"

usage
object

Información de uso y facturación