Gemini Omni Flash Generation de video a partir de texte
- Le modele Gemini Omni Flash (gemini-omni-flash-text-to-video) prend en charge le mode de generation de video a partir de texte, en produisant une video avec audio natif a partir d’un prompt textuel
- Controle de la duree : via
duration, indiquez une duree entiere de3~10secondes, ou passezautopour laisser le modele decider - Ratio d’image : via
aspect_ratio, choisissez16:9,9:16ouauto - Audio natif : le modele genere automatiquement un audio synchronise avec l’image, sans parametre supplementaire
- Description negative : ecrivez-la directement dans
prompt(par exempleNo dialogue) ; ce modele ne fournit pas de parametre de prompt negatif dedie - Mode de traitement asynchrone, utilisez l’ID de tache renvoye pour effectuer une requete
- Le lien de la video generee est valable 24 heures, veuillez l’enregistrer au plus vite
Autorisations
##Toutes les interfaces necessitent une authentification par Bearer Token##
Obtenir une cle API :
Rendez-vous sur la page de gestion des cles API pour obtenir votre cle API
Ajoutez ceci dans l'en-tete de la requete lors de l'utilisation :
Authorization: Bearer YOUR_API_KEYCorps
Nom du modele, toujours gemini-omni-flash-text-to-video
gemini-omni-flash-text-to-video "gemini-omni-flash-text-to-video"
Prompt textuel pour la generation de video, prend en charge le chinois et l'anglais
Conseils d'utilisation :
- Decrivez le sujet, les actions, la scene, les mouvements de camera, etc. ; plus c'est precis, plus le resultat est stable
- Ecrivez les exigences negatives directement dans le prompt (par exemple
No dialogue,pas de texte a l'ecran) ; ce modele ne fournit pas de parametre de prompt negatif dedie
"Une bille de verre roule rapidement sur un rail en bois puis plonge dans l'eau en eclaboussant"
Duree de la video (secondes), par defaut 10
Valeurs possibles :
- Entier : plage
3 ~ 10secondes auto: le modele decide lui-meme la duree de sortie
Note de facturation : le debit reel est base sur l'usage de la video generee
3 <= x <= 106
Ratio largeur/hauteur de la video, par defaut 16:9
Valeurs possibles :
16:9: image horizontale9:16: image verticaleauto: le modele decide lui-meme le ratio d'image
16:9, 9:16, auto "16:9"
Adresse de rappel HTTPS a la fin de la tache
Moment du rappel :
- Declenche lorsque la tache est terminee (completed), a echoue (failed) ou est annulee (cancelled)
- Envoye apres confirmation de la facturation
Restrictions de securite :
- Prend en charge uniquement le protocole HTTPS
- Les rappels vers des adresses IP de reseau interne sont interdits (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La longueur de l'URL ne depasse pas
2048caracteres
Mecanisme de rappel :
- Delai d'expiration :
10secondes - Jusqu'a
3tentatives apres echec (les tentatives ont lieu respectivement1seconde /2secondes /4secondes apres l'echec) - Le format du corps de rappel est identique a celui renvoye par l'interface de requete de tache
- L'adresse de rappel est consideree comme reussie si elle renvoie un code de statut 2xx ; les autres codes declenchent une nouvelle tentative
"https://your-domain.com/webhooks/video-task-completed"
Réponse
Tache video creee avec succes
Horodatage de creation de la tache
1757169743
ID de la tache
"task-unified-1757169743-7cvnl5zw"
Nom du modele reellement utilise
"gemini-omni-flash-text-to-video"
Type specifique de la tache
video.generation.task Pourcentage de progression de la tache (0-100)
0 <= x <= 1000
Statut de la tache
pending, processing, completed, failed "pending"
Informations detaillees sur la tache video
Type de sortie de la tache
text, image, audio, video "video"
Informations d'usage et de facturation