Gemini Omni Flash 参照画像から動画生成
- Gemini Omni Flash (gemini-omni-flash-reference-to-video) モデルは参照画像から動画生成モードに対応し、1〜6枚の参照画像とテキストプロンプトをもとにネイティブ音声付きの動画を1本生成します
- 参照画像入力:
image_urlsで渡します。1〜6枚に対応し、動画内の被写体、スタイル、要素の制約に用います - 長さの制御:
durationで3〜10秒の整数の長さを指定するか、autoを渡してモデルに委ねます - 画面比率:
aspect_ratioで16:9、9:16、autoから選択します - ネイティブ音声: モデルが映像に同期した音声を自動生成し、追加パラメータは不要です
- ネガティブ指定:
promptに直接記述します(例:No dialogue)。本モデルは独立したネガティブプロンプト用のパラメータを提供しません - 非同期処理モードです。返却されたタスクIDを使って 照会 してください
- 生成された動画リンクの有効期限は24時間です。お早めに保存してください
承認
##すべてのインターフェースはBearer Tokenによる認証が必要です##
API Key の取得:
API Key 管理ページ にアクセスして API Key を取得してください
利用時はリクエストヘッダーに以下を追加します:
Authorization: Bearer YOUR_API_KEYボディ
モデル名。gemini-omni-flash-reference-to-video で固定です
gemini-omni-flash-reference-to-video "gemini-omni-flash-reference-to-video"
動画生成のテキストプロンプト。日本語・英語に対応します
使用のヒント:
- 参照画像の被写体が動画内で見せる動き、カメラワーク、シーンの雰囲気などを記述します
- ネガティブな要件はプロンプトに直接記述します(例:
No dialogue、文字を出さない)。本モデルは独立したネガティブプロンプト用のパラメータを提供しません
"子猫がいたずらっぽく毛糸玉をつつく"
参照画像の配列。1〜6枚に対応します
対応形式:
- HTTP/HTTPS 画像 URL
data:image/...;base64,...形式の data URL- base64 のみの画像文字列
フォーマット要件: png、jpeg、webp に対応
1 - 6 elements[
"https://example.com/character.png",
"https://example.com/scene.png"
]動画の長さ(秒)。デフォルトは 10
値の説明:
- 整数:範囲は
3 〜 10秒 auto:出力の長さをモデルが自ら決定します
課金について: 実際の課金は生成された動画の使用量に基づきます
3 <= x <= 106
動画のアスペクト比。デフォルトは 16:9
値の説明:
16:9:横向きの画面9:16:縦向きの画面auto:画面比率をモデルが自ら決定します
16:9, 9:16, auto "16:9"
タスク完了後のHTTPSコールバックアドレス
コールバックのタイミング:
- タスクの完了(completed)、失敗(failed)、キャンセル(cancelled)時にトリガーされます
- 課金確定後に送信されます
セキュリティ制限:
- HTTPSプロトコルのみ対応
- 内部ネットワークIPアドレス(127.0.0.1、10.x.x.x、172.16-31.x.x、192.168.x.x など)へのコールバックは禁止
- URLの長さは
2048文字以内
コールバックの仕組み:
- タイムアウト時間:
10秒 - 失敗後は最大
3回まで再試行します(失敗後それぞれ1秒/2秒/4秒後に再試行します) - コールバックのレスポンスボディの形式はタスク照会インターフェースの返却形式と同一です
- コールバックアドレスが2xxステータスコードを返した場合は成功とみなし、それ以外のステータスコードは再試行をトリガーします
"https://your-domain.com/webhooks/video-task-completed"
レスポンス
動画タスクの作成に成功しました
タスク作成のタイムスタンプ
1757169743
タスクID
"task-unified-1757169743-7cvnl5zw"
実際に使用されたモデル名
"gemini-omni-flash-reference-to-video"
タスクの具体的な種別
video.generation.task タスクの進捗率 (0-100)
0 <= x <= 1000
タスクの状態
pending, processing, completed, failed "pending"
動画タスクの詳細情報
タスクの出力タイプ
text, image, audio, video "video"
使用量と課金情報