Gemini Omni Flash Referenzbild-zu-Video
- Das Modell Gemini Omni Flash (gemini-omni-flash-reference-to-video) unterstützt den Referenzbild-zu-Video-Modus und generiert anhand von 1~6 Referenzbildern und einem Text-Prompt ein Video mit nativem Audio
- Referenzbildeingabe: Über
image_urlsübergeben, unterstützt 1~6 Bilder, um Motiv, Stil oder Elemente des Videos zu bestimmen - Dauersteuerung: Über
durationeine ganzzahlige Dauer von3~10Sekunden angeben oderautoübergeben, damit das Modell selbst entscheidet - Seitenverhältnis: Über
aspect_ratiozwischen16:9,9:16oderautowählen - Natives Audio: Das Modell generiert automatisch synchrones Audio zum Bild, ohne zusätzliche Parameter
- Negative Beschreibung: Direkt in
promptschreiben (z. B.No dialogue); dieses Modell bietet keinen separaten Parameter für negative Prompts - Asynchroner Verarbeitungsmodus, Abfrage über die zurückgegebene Aufgaben-ID
- Der generierte Videolink ist 24 Stunden gültig, bitte zeitnah speichern
Autorisierungen
##Alle APIs erfordern Bearer-Token-Authentifizierung##
API-Schlüssel erhalten:
Besuchen Sie die API-Schlüsselverwaltungsseite, um Ihren API-Schlüssel zu erhalten
Zum Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYBody
Modellname, fest gemini-omni-flash-reference-to-video
gemini-omni-flash-reference-to-video "gemini-omni-flash-reference-to-video"
Text-Prompt für die Videogenerierung, unterstützt Chinesisch und Englisch
Empfehlungen:
- Beschreiben Sie Aktion, Kamerabewegung, Szenenstimmung usw. des Motivs aus dem Referenzbild im Video
- Negative Anforderungen direkt in den Prompt schreiben (z. B.
No dialogue,kein Text); dieses Modell bietet keinen separaten Parameter für negative Prompts
"Ein Kätzchen spielt verspielt mit einem Wollknäuel"
Array von Referenzbildern, unterstützt 1~6 Bilder
Unterstützte Formen:
- HTTP/HTTPS-Bild-URL
- Data-URL der Form
data:image/...;base64,... - Reiner base64-Bildstring
Formatanforderung: Unterstützt png, jpeg, webp
1 - 6 elements[
"https://example.com/character.png",
"https://example.com/scene.png"
]Videodauer (Sekunden), Standard 10
Werte:
- Ganzzahl: Bereich
3 ~ 10Sekunden auto: Das Modell entscheidet selbst über die Ausgabedauer
Abrechnung: Die tatsächliche Belastung richtet sich nach der Nutzung des generierten Videos
3 <= x <= 106
Video-Seitenverhältnis, Standard 16:9
Werte:
16:9: Querformat9:16: Hochformatauto: Das Modell entscheidet selbst über das Seitenverhältnis
16:9, 9:16, auto "16:9"
HTTPS-Callback-Adresse nach Aufgabenabschluss
Callback-Zeitpunkt:
- Wird ausgelöst, wenn die Aufgabe abgeschlossen (completed), fehlgeschlagen (failed) oder abgebrochen (cancelled) wurde
- Wird nach Abschluss der Abrechnungsbestätigung gesendet
Sicherheitsbeschränkungen:
- Nur HTTPS-Protokoll wird unterstützt
- Callback an interne IP-Adressen ist verboten (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x, usw.)
- URL-Länge darf
2048Zeichen nicht überschreiten
Callback-Mechanismus:
- Timeout:
10Sekunden - Maximal
3Wiederholungsversuche bei Fehler (Wiederholung nach1Sekunde/2Sekunden/4Sekunden) - Das Format des Callback-Antwortkörpers entspricht dem Antwortformat der Aufgabenabfrage-API
- Ein 2xx-Statuscode der Callback-Adresse gilt als erfolgreich, andere Statuscodes lösen eine Wiederholung aus
"https://your-domain.com/webhooks/video-task-completed"
Antwort
Videoaufgabe erfolgreich erstellt
Zeitstempel der Aufgabenerstellung
1757169743
Aufgaben-ID
"task-unified-1757169743-7cvnl5zw"
Tatsächlich verwendeter Modellname
"gemini-omni-flash-reference-to-video"
Spezifischer Aufgabentyp
video.generation.task Aufgabenfortschritt in Prozent (0-100)
0 <= x <= 1000
Aufgabenstatus
pending, processing, completed, failed "pending"
Detaillierte Informationen zur Videoaufgabe
Aufgaben-Ausgabetyp
text, image, audio, video "video"
Nutzungs- und Abrechnungsinformationen