Saltar al contenido principal
POST
/
v1
/
videos
/
generations
Generación de vídeo de humano digital OmniHuman-1.5
curl --request POST \
  --url https://api.evolink.ai/v1/videos/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "omnihuman-1.5",
  "audio_url": "https://example.com/audio.mp3",
  "image_urls": [
    "https://example.com/person.jpg"
  ]
}
'
{
  "created": 1757169743,
  "id": "task-unified-1757169743-7cvnl5zw",
  "model": "omnihuman-1.5",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": false,
    "estimated_time": 120,
    "video_duration": 10
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_second",
    "credits_reserved": 10,
    "user_group": "default"
  }
}

Autorizaciones

Authorization
string
header
requerido

##Todas las APIs requieren autenticación Bearer Token##

Obtener API Key:

Visita la Página de gestión de API Key para obtener tu API Key

Agregar al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json
model
enum<string>
predeterminado:omnihuman-1.5
requerido

Nombre del modelo de generación de vídeo de humano digital

Opciones disponibles:
omnihuman-1.5
Ejemplo:

"omnihuman-1.5"

audio_url
string<uri>
requerido

URL de audio para impulsar la sincronización labial y los movimientos corporales

Nota:

  • Duración máxima de audio: 35 segundos
  • Formatos compatibles: .mp3, .wav
  • Las URLs de audio deben ser directamente accesibles por el servidor
  • La facturación se basa en la duración del audio (redondeado al segundo más cercano)
Ejemplo:

"https://example.com/audio.mp3"

image_urls
string<uri>[]
requerido

Lista de URLs de imágenes de referencia que contienen a la persona a animar

Nota:

  • Número de imágenes por solicitud: 1
  • La imagen debe contener una figura humana clara
  • Tamaño de imagen: no más de 10MB
  • Formatos de archivo compatibles: .jpg, .jpeg, .png, .webp
  • Las URLs de imágenes deben ser directamente visibles por el servidor
Maximum array length: 1
Ejemplo:
["https://example.com/person.jpg"]
prompt
string

Prompt de texto opcional para guiar el estilo de generación, solo admite chino, inglés, japonés, coreano, español mexicano e indonesio

Ejemplo:

"A person speaking naturally with subtle expressions"

pe_fast_mode
boolean
predeterminado:false

Habilitar modo de procesamiento rápido

Nota:

  • true: Generación más rápida con calidad potencialmente menor
  • false: Procesamiento de calidad estándar (por defecto)
Ejemplo:

false

mask_url
string<uri>[]

Array de URLs de máscaras para especificar regiones de animación

Nota:

  • Parámetro opcional para control avanzado
  • Las imágenes de máscara deben coincidir con las dimensiones de la imagen de referencia
Ejemplo:
["https://example.com/mask.png"]
seed
integer

Semilla aleatoria como base para determinar el estado de difusión inicial, aleatorio por defecto. Si la semilla es el mismo entero positivo y todos los demás parámetros son consistentes, el contenido generado puede tener resultados consistentes

subject_check
boolean
predeterminado:false

Habilitar detección de sujeto para verificar la presencia humana en la imagen

Nota:

  • true: Habilitar detección de sujeto, el tiempo de inicio de la solicitud aumentará
  • false: Omitir detección de sujeto (por defecto)
Ejemplo:

false

auto_mask
boolean
predeterminado:false

Habilitar la generación automática de máscara

Nota:

  • true: Detectar y enmascarar automáticamente la figura humana, el tiempo de inicio de la solicitud aumentará. Este parámetro se ignora cuando mask_url tiene un valor
  • false: Usar el mask_url proporcionado o sin máscara (predeterminado)
Ejemplo:

false

callback_url
string<uri>

Dirección de callback HTTPS después de completar la tarea

Momento del callback:

  • Se activa cuando la tarea se completa, falla o se cancela
  • Se envía después de completar la confirmación de facturación

Restricciones de seguridad:

  • Solo se admite el protocolo HTTPS
  • El callback a direcciones IP internas está prohibido (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
  • La longitud de la URL no debe exceder 2048 caracteres

Mecanismo de callback:

  • Tiempo de espera: 10 segundos
  • Máximo 3 reintentos en caso de fallo (reintentos después de 1 segundo/2 segundos/4 segundos)
  • El formato del cuerpo de respuesta del callback es consistente con el formato de respuesta de la API de consulta de tareas
  • La dirección de callback que devuelve un código de estado 2xx se considera exitosa, otros códigos de estado activarán reintentos
Ejemplo:

"https://your-domain.com/webhooks/video-task-completed"

Respuesta

Tarea de generación de vídeo de humano digital creada exitosamente

created
integer

Marca de tiempo de creación de la tarea

Ejemplo:

1757169743

id
string

ID de tarea

Ejemplo:

"task-unified-1757169743-7cvnl5zw"

model
string

Nombre del modelo real utilizado

Ejemplo:

"omnihuman-1.5"

object
enum<string>

Tipo de tarea específico

Opciones disponibles:
video.generation.task
progress
integer

Porcentaje de progreso de la tarea (0-100)

Rango requerido: 0 <= x <= 100
Ejemplo:

0

status
enum<string>

Estado de la tarea

Opciones disponibles:
pending,
processing,
completed,
failed
Ejemplo:

"pending"

task_info
object

Información detallada de la tarea de video

type
enum<string>

Tipo de salida de la tarea

Opciones disponibles:
text,
image,
audio,
video
Ejemplo:

"video"

usage
object

Información de uso y facturación