Generación de vídeo de humano digital OmniHuman-1.5
- El modelo OmniHuman-1.5 (omnihuman-1.5) genera vídeos de humanos digitales impulsados por audio
- Modo de procesamiento asíncrono, use el ID de tarea devuelto para consultar
- Los enlaces de vídeo generados son válidos durante 24 horas, guárdelos oportunamente
Nota:
- Límite de duración de audio: máximo 35 segundos
- Formatos de audio compatibles: MP3, WAV
- La facturación se basa en la duración del audio (redondeado al segundo más cercano)
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
Autorizaciones
##Todas las APIs requieren autenticación Bearer Token##
Obtener API Key:
Visita la Página de gestión de API Key para obtener tu API Key
Agregar al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYCuerpo
Nombre del modelo de generación de vídeo de humano digital
omnihuman-1.5 "omnihuman-1.5"
URL de audio para impulsar la sincronización labial y los movimientos corporales
Nota:
- Duración máxima de audio:
35segundos - Formatos compatibles:
.mp3,.wav - Las URLs de audio deben ser directamente accesibles por el servidor
- La facturación se basa en la duración del audio (redondeado al segundo más cercano)
"https://example.com/audio.mp3"
Lista de URLs de imágenes de referencia que contienen a la persona a animar
Nota:
- Número de imágenes por solicitud:
1 - La imagen debe contener una figura humana clara
- Tamaño de imagen: no más de
10MB - Formatos de archivo compatibles:
.jpg,.jpeg,.png,.webp - Las URLs de imágenes deben ser directamente visibles por el servidor
1["https://example.com/person.jpg"]Prompt de texto opcional para guiar el estilo de generación, solo admite chino, inglés, japonés, coreano, español mexicano e indonesio
"A person speaking naturally with subtle expressions"
Habilitar modo de procesamiento rápido
Nota:
true: Generación más rápida con calidad potencialmente menorfalse: Procesamiento de calidad estándar (por defecto)
false
Array de URLs de máscaras para especificar regiones de animación
Nota:
- Parámetro opcional para control avanzado
- Las imágenes de máscara deben coincidir con las dimensiones de la imagen de referencia
["https://example.com/mask.png"]Semilla aleatoria como base para determinar el estado de difusión inicial, aleatorio por defecto. Si la semilla es el mismo entero positivo y todos los demás parámetros son consistentes, el contenido generado puede tener resultados consistentes
Habilitar detección de sujeto para verificar la presencia humana en la imagen
Nota:
true: Habilitar detección de sujeto, el tiempo de inicio de la solicitud aumentaráfalse: Omitir detección de sujeto (por defecto)
false
Habilitar la generación automática de máscara
Nota:
true: Detectar y enmascarar automáticamente la figura humana, el tiempo de inicio de la solicitud aumentará. Este parámetro se ignora cuandomask_urltiene un valorfalse: Usar el mask_url proporcionado o sin máscara (predeterminado)
false
Dirección de callback HTTPS después de completar la tarea
Momento del callback:
- Se activa cuando la tarea se completa, falla o se cancela
- Se envía después de completar la confirmación de facturación
Restricciones de seguridad:
- Solo se admite el protocolo HTTPS
- El callback a direcciones IP internas está prohibido (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La longitud de la URL no debe exceder
2048caracteres
Mecanismo de callback:
- Tiempo de espera:
10segundos - Máximo
3reintentos en caso de fallo (reintentos después de1segundo/2segundos/4segundos) - El formato del cuerpo de respuesta del callback es consistente con el formato de respuesta de la API de consulta de tareas
- La dirección de callback que devuelve un código de estado 2xx se considera exitosa, otros códigos de estado activarán reintentos
"https://your-domain.com/webhooks/video-task-completed"
Respuesta
Tarea de generación de vídeo de humano digital creada exitosamente
Marca de tiempo de creación de la tarea
1757169743
ID de tarea
"task-unified-1757169743-7cvnl5zw"
Nombre del modelo real utilizado
"omnihuman-1.5"
Tipo de tarea específico
video.generation.task Porcentaje de progreso de la tarea (0-100)
0 <= x <= 1000
Estado de la tarea
pending, processing, completed, failed "pending"
Información detallada de la tarea de video
Tipo de salida de la tarea
text, image, audio, video "video"
Información de uso y facturación