Gemini Omni Flash Generation de video a partir d'images de reference
- Le modele Gemini Omni Flash (gemini-omni-flash-reference-to-video) prend en charge le mode de generation de video a partir d’images de reference, en produisant une video avec audio natif a partir de 1 a 6 images de reference et d’un prompt textuel
- Entree image de reference : via
image_urls, prend en charge 1 a 6 images, servant a contraindre le sujet, le style ou les elements de la video - Controle de la duree : via
duration, indiquez une duree entiere de3~10secondes, ou passezautopour laisser le modele decider - Ratio d’image : via
aspect_ratio, choisissez16:9,9:16ouauto - Audio natif : le modele genere automatiquement un audio synchronise avec l’image, sans parametre supplementaire
- Description negative : ecrivez-la directement dans
prompt(par exempleNo dialogue) ; ce modele ne fournit pas de parametre de prompt negatif dedie - Mode de traitement asynchrone, utilisez l’ID de tache renvoye pour effectuer une requete
- Le lien de la video generee est valable 24 heures, veuillez l’enregistrer au plus vite
Autorisations
##Toutes les interfaces necessitent une authentification par Bearer Token##
Obtenir une cle API :
Rendez-vous sur la page de gestion des cles API pour obtenir votre cle API
Ajoutez ceci dans l'en-tete de la requete lors de l'utilisation :
Authorization: Bearer YOUR_API_KEYCorps
Nom du modele, toujours gemini-omni-flash-reference-to-video
gemini-omni-flash-reference-to-video "gemini-omni-flash-reference-to-video"
Prompt textuel pour la generation de video, prend en charge le chinois et l'anglais
Conseils d'utilisation :
- Decrivez les actions du sujet des images de reference dans la video, les mouvements de camera, l'ambiance de la scene, etc.
- Ecrivez les exigences negatives directement dans le prompt (par exemple
No dialogue,pas de texte a l'ecran) ; ce modele ne fournit pas de parametre de prompt negatif dedie
"Un petit chat joue espieglement avec une pelote de laine"
Tableau d'images de reference, prend en charge 1 a 6 images
Formes prises en charge :
- URL d'image HTTP/HTTPS
- data URL de forme
data:image/...;base64,... - chaine d'image base64 pure
Formats requis : prend en charge png, jpeg, webp
1 - 6 elements[
"https://example.com/character.png",
"https://example.com/scene.png"
]Duree de la video (secondes), par defaut 10
Valeurs possibles :
- Entier : plage
3 ~ 10secondes auto: le modele decide lui-meme la duree de sortie
Note de facturation : le debit reel est base sur l'usage de la video generee
3 <= x <= 106
Ratio largeur/hauteur de la video, par defaut 16:9
Valeurs possibles :
16:9: image horizontale9:16: image verticaleauto: le modele decide lui-meme le ratio d'image
16:9, 9:16, auto "16:9"
Adresse de rappel HTTPS a la fin de la tache
Moment du rappel :
- Declenche lorsque la tache est terminee (completed), a echoue (failed) ou est annulee (cancelled)
- Envoye apres confirmation de la facturation
Restrictions de securite :
- Prend en charge uniquement le protocole HTTPS
- Les rappels vers des adresses IP de reseau interne sont interdits (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, etc.)
- La longueur de l'URL ne depasse pas
2048caracteres
Mecanisme de rappel :
- Delai d'expiration :
10secondes - Jusqu'a
3tentatives apres echec (les tentatives ont lieu respectivement1seconde /2secondes /4secondes apres l'echec) - Le format du corps de rappel est identique a celui renvoye par l'interface de requete de tache
- L'adresse de rappel est consideree comme reussie si elle renvoie un code de statut 2xx ; les autres codes declenchent une nouvelle tentative
"https://your-domain.com/webhooks/video-task-completed"
Réponse
Tache video creee avec succes
Horodatage de creation de la tache
1757169743
ID de la tache
"task-unified-1757169743-7cvnl5zw"
Nom du modele reellement utilise
"gemini-omni-flash-reference-to-video"
Type specifique de la tache
video.generation.task Pourcentage de progression de la tache (0-100)
0 <= x <= 1000
Statut de la tache
pending, processing, completed, failed "pending"
Informations detaillees sur la tache video
Type de sortie de la tache
text, image, audio, video "video"
Informations d'usage et de facturation