Gemini Omni Flash Texto a Video
- El modelo Gemini Omni Flash (gemini-omni-flash-text-to-video) admite el modo texto a video, generando un video con audio nativo a partir de un prompt de texto
- Control de duracion: usa
durationpara indicar una duracion entera de3~10segundos, o pasaautopara dejar que el modelo lo decida - Relacion de aspecto: usa
aspect_ratiopara elegir16:9,9:16oauto - Audio nativo: el modelo genera automaticamente audio sincronizado para la imagen, sin parametros adicionales
- Descripcion negativa: escribela directamente en
prompt(por ejemploNo dialogue); este modelo no ofrece un parametro independiente de prompt negativo - Procesamiento asincrono, usa el ID de tarea devuelto para consultar estado
- Los enlaces de video generados son validos durante 24 horas, guardalos cuanto antes
Autorizaciones
##Todas las APIs requieren autenticacion Bearer Token##
Obtener API Key:
Visita la Pagina de gestion de API Key para obtener tu API Key
Agregar al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYCuerpo
Nombre del modelo, fijo en gemini-omni-flash-text-to-video
gemini-omni-flash-text-to-video "gemini-omni-flash-text-to-video"
Prompt de texto para la generacion de video, admite chino e ingles
Recomendaciones de uso:
- Describe el sujeto principal, la accion, la escena, el movimiento de camara, etc.; cuanto mas concreto, mas estable el resultado
- Escribe los requisitos negativos directamente en el prompt (por ejemplo
No dialogue,sin texto); este modelo no ofrece un parametro independiente de prompt negativo
"Una canica de vidrio rueda rapidamente por un riel de madera y finalmente cae al agua salpicando"
Duracion del video (segundos), por defecto 10
Valores admitidos:
- Entero: rango
3 ~ 10segundos auto: el modelo decide la duracion de salida
Nota de facturacion: el cobro real se basa en el consumo del video generado
3 <= x <= 106
Relacion de aspecto del video, por defecto 16:9
Valores admitidos:
16:9: imagen horizontal9:16: imagen verticalauto: el modelo decide la relacion de aspecto
16:9, 9:16, auto "16:9"
Direccion de callback HTTPS despues de completar la tarea
Momento del callback:
- Se activa cuando la tarea se completa (completed), falla (failed) o se cancela (cancelled)
- Se envia despues de completar la confirmacion de facturacion
Restricciones de seguridad:
- Solo se admite el protocolo HTTPS
- El callback a direcciones IP internas esta prohibido (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La longitud de la URL no debe exceder
2048caracteres
Mecanismo de callback:
- Tiempo de espera:
10segundos - Maximo
3reintentos en caso de fallo (reintentos despues de1segundo/2segundos/4segundos) - El formato del cuerpo de respuesta del callback es consistente con el formato de respuesta de la API de consulta de tareas
- La direccion de callback que devuelve un codigo de estado 2xx se considera exitosa, otros codigos de estado activaran reintentos
"https://your-domain.com/webhooks/video-task-completed"
Respuesta
Tarea de video creada exitosamente
Marca de tiempo de creacion de la tarea
1757169743
ID de tarea
"task-unified-1757169743-7cvnl5zw"
Nombre del modelo real utilizado
"gemini-omni-flash-text-to-video"
Tipo de tarea especifico
video.generation.task Porcentaje de progreso de la tarea (0-100)
0 <= x <= 1000
Estado de la tarea
pending, processing, completed, failed "pending"
Informacion detallada de la tarea de video
Tipo de salida de la tarea
text, image, audio, video "video"
Informacion de uso y facturacion