Generación de vídeo de humano digital OmniHuman-1.5

Autorizaciones

Authorization

string

header

requerido

##Todas las APIs requieren autenticación Bearer Token##

Obtener API Key:

Visita la Página de gestión de API Key para obtener tu API Key

Agregar al encabezado de la solicitud:

Authorization: Bearer YOUR_API_KEY

Cuerpo

application/json

model

enum<string>

predeterminado:omnihuman-1.5

requerido

Nombre del modelo de generación de vídeo de humano digital

Opciones disponibles:

omnihuman-1.5

Ejemplo:

"omnihuman-1.5"

audio_url

string<uri>

requerido

URL de audio para impulsar la sincronización labial y los movimientos corporales

Nota:

Duración máxima de audio: 35 segundos
Formatos compatibles: .mp3, .wav
Las URLs de audio deben ser directamente accesibles por el servidor
La facturación se basa en la duración del audio (redondeado al segundo más cercano)

Ejemplo:

"https://example.com/audio.mp3"

image_urls

string<uri>[]

requerido

Lista de URLs de imágenes de referencia que contienen a la persona a animar

Nota:

Número de imágenes por solicitud: 1
La imagen debe contener una figura humana clara
Tamaño de imagen: no más de 10MB
Formatos de archivo compatibles: .jpg, .jpeg, .png, .webp
Las URLs de imágenes deben ser directamente visibles por el servidor

Maximum array length: 1

Ejemplo:

["https://example.com/person.jpg"]

prompt

string

Prompt de texto opcional para guiar el estilo de generación, solo admite chino, inglés, japonés, coreano, español mexicano e indonesio

Ejemplo:

"A person speaking naturally with subtle expressions"

pe_fast_mode

boolean

predeterminado:false

Habilitar modo de procesamiento rápido

Nota:

true: Generación más rápida con calidad potencialmente menor
false: Procesamiento de calidad estándar (por defecto)

Ejemplo:

false

mask_url

string<uri>[]

Array de URLs de máscaras para especificar regiones de animación

Nota:

Parámetro opcional para control avanzado
Las imágenes de máscara deben coincidir con las dimensiones de la imagen de referencia

Ejemplo:

["https://example.com/mask.png"]

seed

integer

Semilla aleatoria como base para determinar el estado de difusión inicial, aleatorio por defecto. Si la semilla es el mismo entero positivo y todos los demás parámetros son consistentes, el contenido generado puede tener resultados consistentes

subject_check

boolean

predeterminado:false

Habilitar detección de sujeto para verificar la presencia humana en la imagen

Nota:

true: Habilitar detección de sujeto, el tiempo de inicio de la solicitud aumentará
false: Omitir detección de sujeto (por defecto)

Ejemplo:

false

auto_mask

boolean

predeterminado:false

Habilitar la generación automática de máscara

Nota:

true: Detectar y enmascarar automáticamente la figura humana, el tiempo de inicio de la solicitud aumentará. Este parámetro se ignora cuando mask_url tiene un valor
false: Usar el mask_url proporcionado o sin máscara (predeterminado)

Ejemplo:

false

callback_url

string<uri>

Dirección de callback HTTPS después de completar la tarea

Momento del callback:

Se activa cuando la tarea se completa, falla o se cancela
Se envía después de completar la confirmación de facturación

Restricciones de seguridad:

Solo se admite el protocolo HTTPS
El callback a direcciones IP internas está prohibido (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
La longitud de la URL no debe exceder 2048 caracteres

Mecanismo de callback:

Tiempo de espera: 10 segundos
Máximo 3 reintentos en caso de fallo (reintentos después de 1 segundo/2 segundos/4 segundos)
El formato del cuerpo de respuesta del callback es consistente con el formato de respuesta de la API de consulta de tareas
La dirección de callback que devuelve un código de estado 2xx se considera exitosa, otros códigos de estado activarán reintentos

Ejemplo:

"https://your-domain.com/webhooks/video-task-completed"

Respuesta

Tarea de generación de vídeo de humano digital creada exitosamente

created

integer

Marca de tiempo de creación de la tarea

Ejemplo:

1757169743

string

ID de tarea

Ejemplo:

"task-unified-1757169743-7cvnl5zw"

model

string

Nombre del modelo real utilizado

Ejemplo:

"omnihuman-1.5"

object

enum<string>

Tipo de tarea específico

Opciones disponibles:

video.generation.task

progress

integer

Porcentaje de progreso de la tarea (0-100)

Rango requerido: 0 <= x <= 100

Ejemplo:

0

status

enum<string>

Estado de la tarea

Opciones disponibles:

pending,

processing,

completed,

failed

Ejemplo:

"pending"

task_info

object

Información detallada de la tarea de video

Mostrar atributos secundarios

type

enum<string>

Tipo de salida de la tarea

Opciones disponibles:

text,

image,

audio,

video

Ejemplo:

"video"

usage

object

Información de uso y facturación

Mostrar atributos secundarios

Serie de imágenes

Serie de videos

Serie de audio

Serie de texto

Gestión de cuenta

Gestión de tareas

Gestión de archivos

Generación de vídeo de humano digital OmniHuman-1.5

Autorizaciones

Cuerpo

Respuesta