Wan2.7 参照動画
- WAN2.7 (wan2.7-reference-video) モデルは参照→動画生成をサポートし、人や物を主役として単一キャラの演技や複数キャラのインタラクション動画を生成可能
- マルチモーダル入力: 先頭フレーム画像 (
image_start)、複数の参照画像 (image_urls)、複数の参照動画 (video_urls)、キャラごとの声バインディング - 少なくとも 1 つ の参照画像 (
image_urls) または参照動画 (video_urls) が必要。image_startのみでは要件を満たしません。image_urls+video_urlsの合計は ≤ 5 - プロンプト内のキャラ指定: 中国語では「图1, 图2 / 视频1, 视频2」、英語では「Image 1」「Video 1」を使用 —
image_urls/video_urlsの配列順に 1-based で対応。画像と動画は別々にカウントされ「Image 1」「Video 1」が共存可能 - 複数キャラの声バインディング:
model_params.voice_bindings(精密バインディング)を推奨。レガシーフィールドaudio_urls(位置順アライメント)もサポート - 非同期処理モード、返却されたタスク ID でステータスを照会
- 生成された動画リンクの有効期間は 24 時間です。お早めに保存してください
- 課金: 「入力動画長 + 出力動画長」で課金。生成成功時のみ課金、失敗は無料
承認
すべての API は Bearer Token 認証が必要です
API Key の取得:
API Key 管理ページ で API Key を取得してください
リクエストヘッダーに追加:
Authorization: Bearer YOUR_API_KEYボディ
モデル名、wan2.7-reference-video 固定
wan2.7-reference-video "wan2.7-reference-video"
動画生成用のテキストプロンプト。中国語と英語をサポート、各文字 / アルファベット / 句読点を 1 文字としてカウントし、超過分は自動的に切り詰められます。最大 5000 文字
キャラ指定ルール:
- 中国語: 「图1, 图2 / 视频1, 视频2」を使用 —
image_urls/video_urlsの配列順に 1-based で対応 - 英語: 「Image 1」「Video 1」を使用(先頭大文字、語と数字の間にスペース)
- 画像と動画は別々にカウントされ、「Image 1」「Video 1」が共存可能
- 参照画像または参照動画が 1 つだけの場合は「the reference image」「the reference video」と簡略化可能
マルチグリッド画像(ストーリーボード): マルチグリッド画像を提供する場合、ストーリーボード形式で主要シーンを記述。モデルがグリッドレイアウトを認識し遷移を補完します
5000"Video 1 が Image 3 を抱え、Image 4 の椅子に座って柔らかなカントリーフォークを演奏する"
動画に表示したくない内容を記述するネガティブプロンプト。中国語と英語をサポート、最大 500 文字、超過分は自動的に切り詰められます
500"ぼやけ、低品質"
先頭フレーム画像 URL、生成動画の最初のフレームとして使用。image_urls + video_urls ≤ 5 の上限にカウントされません。声バインディングを受け付けません(先頭フレーム自体は複数キャラの声割当に参加しない)
ユースケース:
- 先頭フレームに参照対象が既に存在する場合: 参照素材と組み合わせてアイデンティティの一貫性を強化
- 先頭フレームに参照対象がない場合: 動画進行中に登場する新主体を参照素材で定義
画像制限:
- フォーマット: JPEG、JPG、PNG(透明非対応)、BMP、WEBP
- 解像度: 幅・高さが
[240, 8000]ピクセル - アスペクト比: 1:8 ~ 8:1
- ファイルサイズ:
20MB以下
"https://example.com/first_frame.jpg"
参照画像 URL のリスト。主体(人 / 動物 / 物体)またはシーン背景を提供可能。主体を含む場合、各画像には単一キャラのみ含めることを推奨
数量制限:
image_urls+video_urlsの合計 ≤ 5image_urls/video_urlsのいずれかが必須(image_startのみでは不足)
画像制限:
- フォーマット: JPEG、JPG、PNG(透明非対応)、BMP、WEBP
- 解像度: 幅・高さが
[240, 8000]ピクセル - アスペクト比: 1:8 ~ 8:1
- ファイルサイズ:
20MB以下
[
"https://example.com/ref1.jpg",
"https://example.com/ref2.jpg"
]参照動画 URL のリスト。動画は主体(人 / 動物 / 物体)を含むことを推奨し、空ショットや純粋な背景動画は非推奨。主体を含む場合、各動画には単一キャラのみ含めることを推奨。動画の音声は声参照として利用可能
数量制限:
image_urls+video_urlsの合計 ≤ 5image_urls/video_urlsのいずれかが必須
動画制限:
- フォーマット: mp4、mov
- 長さ:
1 ~ 30秒 - 解像度: 幅・高さが
[240, 4096]ピクセル - アスペクト比: 1:8 ~ 8:1
- ファイルサイズ:
100MB以下
注意: video_urls を渡す場合、duration の上限は 10 秒に制限されます
["https://example.com/reference.mp4"]【互換性フィールド — model_params.voice_bindings の使用を推奨】
参照声音声 URL のリスト。参照素材に位置順でバインドされます — まず video_urls 配列、次に image_urls 配列の順に(出現順で 1 対 1 対応)。最大 5 要素
優先度:
model_params.voice_bindingsとaudio_urlsを同時に指定した場合、voice_bindingsのみ使用され本フィールドは無視されますvideo_urlsの動画に音声が含まれており声バインディングが未指定の場合、元の音声が使用されます。明示的な声バインディングを指定すると元の音声を上書きします
音声制限:
- 対応フォーマット:
wav、mp3 - 長さ:
1 ~ 10秒 - ファイルサイズ:
15MB以下
5[
"https://example.com/voice1.mp3",
"https://example.com/voice2.mp3"
]高度なパラメータコンテナ(推奨)
動画品質、デフォルト 720p
オプション:
720p: 標準画質、標準価格(デフォルト)1080p: 高画質、価格が高くなります
720p, 1080p "720p"
動画のアスペクト比、デフォルト 16:9
動作:
image_start未指定: 指定したaspect_ratioで動画を生成image_start指定: 本フィールドは無視され、先頭フレーム画像のアスペクト比に近い比率で生成
画質別の出力解像度:
| 画質 | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
動画長(秒、整数)
範囲:
video_urlsなし:2 ~ 15、デフォルト5video_urlsあり:2 ~ 10(10 秒に制限)
課金: 実際に生成された動画の長さに基づきます
2 <= x <= 155
ランダムシード、デフォルトはランダム
説明:
- 範囲:
1~2147483647 - シードを固定するとプロンプト調整時の変動を抑制し再現性が向上します
1 <= x <= 214748364742
プロンプトのインテリジェント書き換えを有効にするかどうか。有効にすると、大規模モデルがプロンプトを最適化し、シンプルまたは記述の不十分なプロンプトの結果を大幅に改善します。
注意: デフォルト値は false です。フィールドを省略するか false を送信した場合、書き換えは行われません。有効にするには明示的に true を送信してください。
false
タスク完了時の HTTPS コールバック URL
コールバックタイミング:
- タスクの完了 (completed)、失敗 (failed)、キャンセル (cancelled) 時にトリガー
- 課金確定後に送信
セキュリティ制約:
- HTTPS のみサポート
- 内部 IP アドレス(127.0.0.1、10.x.x.x、172.16-31.x.x、192.168.x.x など)へのコールバックは禁止
- URL の長さは
2048文字以内
コールバックメカニズム:
- タイムアウト:
10秒 - 失敗後最大
3回リトライ(失敗から1/2/4秒後) - コールバックレスポンス形式はタスク照会 API と一致
- 2xx ステータスは成功とみなされ、その他はリトライをトリガー
"https://your-domain.com/webhooks/video-task-completed"
レスポンス
動画タスクの作成に成功しました
タスク作成タイムスタンプ
1757169743
タスク ID
"task-unified-1757169743-7cvnl5zw"
実際に使用したモデル名
"wan2.7-reference-video"
タスクの具体的な種類
video.generation.task タスク進捗率 (0-100)
0 <= x <= 1000
タスクステータス
pending, processing, completed, failed "pending"
動画タスクの詳細情報
タスクの出力タイプ
text, image, audio, video "video"
使用量と課金情報