Gemini Omni Flash Bild-zu-Video
- Das Modell Gemini Omni Flash (gemini-omni-flash-image-to-video) unterstützt den Bild-zu-Video-Modus und generiert anhand eines Eingabebildes und eines Text-Prompts ein Video mit nativem Audio
- Bildeingabe: Über
image_urlsübergeben, derzeit wird nur 1 Bild unterstützt - Dauersteuerung: Über
durationeine ganzzahlige Dauer von3~10Sekunden angeben oderautoübergeben, damit das Modell selbst entscheidet - Seitenverhältnis: Über
aspect_ratiozwischen16:9,9:16oderautowählen - Natives Audio: Das Modell generiert automatisch synchrones Audio zum Bild, ohne zusätzliche Parameter
- Negative Beschreibung: Direkt in
promptschreiben (z. B.No dialogue); dieses Modell bietet keinen separaten Parameter für negative Prompts - Asynchroner Verarbeitungsmodus, Abfrage über die zurückgegebene Aufgaben-ID
- Der generierte Videolink ist 24 Stunden gültig, bitte zeitnah speichern
Autorisierungen
##Alle APIs erfordern Bearer-Token-Authentifizierung##
API-Schlüssel erhalten:
Besuchen Sie die API-Schlüsselverwaltungsseite, um Ihren API-Schlüssel zu erhalten
Zum Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYBody
Modellname, fest gemini-omni-flash-image-to-video
gemini-omni-flash-image-to-video "gemini-omni-flash-image-to-video"
Text-Prompt für die Videogenerierung, unterstützt Chinesisch und Englisch
Empfehlungen:
- Beschreiben Sie Aktion des Bildmotivs, Kamerabewegung, Stimmungswechsel usw.; je konkreter, desto stabiler das Ergebnis
- Negative Anforderungen direkt in den Prompt schreiben (z. B.
No dialogue,kein Text); dieses Modell bietet keinen separaten Parameter für negative Prompts
"Die Person im Bild dreht langsam den Kopf und lächelt, während im Hintergrund die Blätter sanft im Wind wiegen"
Array von Eingabebildern, derzeit wird nur 1 Bild unterstützt
Unterstützte Formen:
- HTTP/HTTPS-Bild-URL
- Data-URL der Form
data:image/...;base64,... - Reiner base64-Bildstring
Formatanforderung: Unterstützt png, jpeg, webp
1 element["https://example.com/portrait.jpg"]Videodauer (Sekunden), Standard 10
Werte:
- Ganzzahl: Bereich
3 ~ 10Sekunden auto: Das Modell entscheidet selbst über die Ausgabedauer
Abrechnung: Die tatsächliche Belastung richtet sich nach der Nutzung des generierten Videos
3 <= x <= 106
Video-Seitenverhältnis, Standard 16:9
Werte:
16:9: Querformat9:16: Hochformatauto: Das Modell entscheidet selbst über das Seitenverhältnis
16:9, 9:16, auto "16:9"
HTTPS-Callback-Adresse nach Aufgabenabschluss
Callback-Zeitpunkt:
- Wird ausgelöst, wenn die Aufgabe abgeschlossen (completed), fehlgeschlagen (failed) oder abgebrochen (cancelled) wurde
- Wird nach Abschluss der Abrechnungsbestätigung gesendet
Sicherheitsbeschränkungen:
- Nur HTTPS-Protokoll wird unterstützt
- Callback an interne IP-Adressen ist verboten (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, usw.)
- URL-Länge darf
2048Zeichen nicht überschreiten
Callback-Mechanismus:
- Timeout:
10Sekunden - Maximal
3Wiederholungsversuche bei Fehler (Wiederholung nach1Sekunde/2Sekunden/4Sekunden) - Das Format des Callback-Antwortkörpers entspricht dem Antwortformat der Aufgabenabfrage-API
- Ein 2xx-Statuscode der Callback-Adresse gilt als erfolgreich, andere Statuscodes lösen eine Wiederholung aus
"https://your-domain.com/webhooks/video-task-completed"
Antwort
Videoaufgabe erfolgreich erstellt
Zeitstempel der Aufgabenerstellung
1757169743
Aufgaben-ID
"task-unified-1757169743-7cvnl5zw"
Tatsächlich verwendeter Modellname
"gemini-omni-flash-image-to-video"
Spezifischer Aufgabentyp
video.generation.task Aufgabenfortschritt in Prozent (0-100)
0 <= x <= 1000
Aufgabenstatus
pending, processing, completed, failed "pending"
Detaillierte Informationen zur Videoaufgabe
Aufgaben-Ausgabetyp
text, image, audio, video "video"
Nutzungs- und Abrechnungsinformationen