VideoRetalk
- 音声駆動による動画の口パク生成:動画内の人物の口の動きをターゲット音声に合わせた口パクに置き換えます
- 非同期処理モード:返却されたタスクIDを使って結果を照会してください
- 生成された動画リンクの有効期間は24時間です。速やかに保存してください
典型的なユースケース:
- 多言語吹き替え:元の動画の口パクを他の言語の吹き替えに置き換える
- バーチャルアナウンサー:TTS で生成した音声で人物動画を駆動する
- 広告制作:同じ動画素材から異なる言語の広告バージョンを素早く生成する
- 教育・研修:講師の動画を異なる言語の解説に置き換える
注意事項:
- 入力 URL はインターネットからアクセス可能である必要があります
- 動画に人物の顔が含まれている必要があります。含まれていない場合、タスクは失敗します
- 複数の顔がある場合は必ず
ref_image_urlを指定してください
承認
##すべてのインターフェースは Bearer Token による認証が必要です##
API キーの取得:
API キー管理ページ にアクセスして API キーを取得してください
リクエストヘッダーに以下を追加してください:
Authorization: Bearer YOUR_API_KEYボディ
モデル名
videoretalk "videoretalk"
口パクを置き換える人物を含む入力動画 URL
要件:
- インターネットからアクセス可能な動画 URL
- 形式:MP4、MOV などの一般的な形式
- 動画内に明確に見える顔が必要
- 推奨時間:
2~300秒
"https://example.com/speaker.mp4"
ターゲット音声 URL(動画内の人物がこの音声に合わせて話します)
要件:
- インターネットからアクセス可能な音声 URL
- 形式:WAV、MP3、M4A などの一般的な形式
- 人声による発話内容を推奨
"https://example.com/target-speech.wav"
顔参照画像 URL
動画に複数の顔がある場合、この画像で口パクを置き換えるターゲットの顔を指定します
要件:
- 画像にターゲット人物の正面顔が含まれていること
- 動画に複数の顔がある場合にのみ必要
"https://example.com/target-person-face.jpg"
音声の長さが動画の長さより長い場合、動画を自動的に音声の長さまで延長するかどうか
true:出力時間 = 音声時間(動画が自動延長される)false:出力時間 = min(動画時間, 音声時間)
false
顔マッチングの信頼度しきい値
- 範囲:
120~200 - 値が低いほどマッチングしやすい(誤マッチングの可能性あり)
- 値が高いほど厳格(マッチングできない可能性あり)
- 「一致する顔が見つからない」エラーが出た場合は少し下げてください(例:
140) - 間違った顔にマッチングした場合は少し上げてください(例:
190)
120 <= x <= 200170
タスク完了後の HTTPS コールバック URL
コールバックのタイミング:
- タスクが完了(completed)、失敗(failed)、またはキャンセル(cancelled)した際にトリガー
- 課金確認後に送信
セキュリティ制限:
- HTTPS プロトコルのみサポート
- 内部 IP アドレスへのコールバックは禁止(127.0.0.1、10.x.x.x、172.16-31.x.x、192.168.x.x など)
- URL の長さは
2048文字以内
コールバックの仕組み:
- タイムアウト:
10秒 - 失敗時は最大
3回リトライ(失敗後それぞれ1秒 /2秒 /4秒後にリトライ) - コールバックのレスポンスボディ形式はタスク照会インターフェースの返却形式と同一
- コールバック URL が 2xx ステータスコードを返した場合は成功とみなし、それ以外はリトライをトリガー
"https://your-domain.com/webhooks/video-task-completed"
レスポンス
音声駆動ポートレート動画生成タスクの作成に成功
タスク作成タイムスタンプ
1775200000
タスク ID
"task-unified-1775200000-xyz12345"
実際に使用されたモデル名
"videoretalk"
タスクの具体的なタイプ
video.generation.task タスクの進捗率 (0-100)
0 <= x <= 1000
タスクのステータス
| ステータス | progress | 説明 |
|---|---|---|
pending | 0~10 | 処理待ち |
processing | 10~80 | 処理中 |
completed | 100 | 完了 |
failed | 0 | 失敗 |
pending, processing, completed, failed "pending"
動画タスクの詳細情報
タスクの出力タイプ
video "video"
使用量と課金情報