Wan2.7 Referenzvideo
- Das WAN2.7 (wan2.7-reference-video)-Modell unterstützt Referenz-zu-Video-Generierung und nutzt Personen oder Objekte als Hauptdarsteller, um Einzel- oder Mehrfigurenszenen zu erzeugen
- Multimodale Eingaben: Startbild (
image_start), mehrere Referenzbilder (image_urls), mehrere Referenzvideos (video_urls) sowie Stimmbindung pro Charakter - Mindestens ein Referenzbild (
image_urls) oder ein Referenzvideo (video_urls) ist erforderlich; nurimage_startreicht nicht.image_urls+video_urlszusammen ≤ 5 - Charakter-Indexierung im Prompt: im Chinesischen “图1, 图2 / 视频1, 视频2”; im Englischen “Image 1”, “Video 1” — entsprechen 1-basiert der Reihenfolge von
image_urls/video_urls. Bilder und Videos werden getrennt gezählt, daher können “Image 1” und “Video 1” nebeneinander existieren - Mehrfach-Stimmbindung: bevorzugt
model_params.voice_bindings(präzise Bindung); das ältereaudio_urls(positionelle Zuordnung) wird ebenfalls unterstützt - Asynchroner Verarbeitungsmodus, verwenden Sie die zurückgegebene Task-ID für die Statusabfrage
- Generierte Videolinks sind 24 Stunden gültig, bitte zeitnah speichern
- Abrechnung: erfolgt nach “Eingabe-Videodauer + Ausgabe-Videodauer”; nur erfolgreiche Generierungen werden abgerechnet, fehlgeschlagene Aufgaben sind kostenlos
Autorisierungen
Alle APIs erfordern Bearer-Token-Authentifizierung
API-Schlüssel erhalten:
Besuchen Sie die API-Schlüssel-Verwaltungsseite, um Ihren API-Schlüssel zu erhalten
Im Anfrage-Header hinzufügen:
Authorization: Bearer YOUR_API_KEYBody
Modellname, muss wan2.7-reference-video sein
wan2.7-reference-video "wan2.7-reference-video"
Textprompt für die Videogenerierung. Unterstützt Chinesisch und Englisch; jedes Zeichen / jeder Buchstabe / jedes Satzzeichen zählt als 1, Überschuss wird automatisch gekürzt. Maximale Länge 5000 Zeichen
Charakter-Indexierungsregeln:
- Chinesisch: "图1, 图2 / 视频1, 视频2" — entspricht 1-basiert der Reihenfolge von
image_urls/video_urls - Englisch: "Image 1", "Video 1" (Großbuchstaben, Leerzeichen zwischen Wort und Ziffer)
- Bilder und Videos werden getrennt gezählt, sodass "Image 1" und "Video 1" nebeneinander vorkommen können
- Bei nur einem Referenzbild oder einem Referenzvideo kann auch "das Referenzbild" oder "das Referenzvideo" verwendet werden
Mehrfach-Raster-Bild (Storyboard): Wird ein Raster-Bild bereitgestellt, beschreiben Sie Schlüsselaufnahmen in Storyboard-Form; das Modell erkennt das Raster und füllt die Übergänge
5000"Video 1 hält Image 3 und spielt einen sanften Country-Folk auf dem Stuhl in Image 4"
Negativprompt zur Beschreibung von Inhalten, die im Video vermieden werden sollen. Unterstützt Chinesisch und Englisch. Maximale Länge 500 Zeichen; Überschuss wird automatisch gekürzt
500"Unscharf, geringe Qualität"
URL des Startbilds, dient als Anfangsbild des Videos. Zählt nicht zur Obergrenze image_urls + video_urls ≤ 5. Akzeptiert keine Stimmbindung (das Startbild selbst nimmt nicht an der Mehrfach-Stimmverteilung teil)
Anwendungsfälle:
- Subjekt erscheint bereits im Startbild: kombiniert mit Referenzmaterialien zur Verstärkung der Identität
- Subjekt nicht im Startbild: Referenzmaterialien definieren neu auftretende Subjekte im Verlauf des Videos
Bildgrenzen:
- Formate: JPEG, JPG, PNG (Transparenz nicht unterstützt), BMP, WEBP
- Auflösung: Breite und Höhe in
[240, 8000]Pixel - Seitenverhältnis: 1:8 ~ 8:1
- Dateigröße: max.
20MB
"https://example.com/first_frame.jpg"
Referenzbild-URL-Liste. Kann Subjekte (Personen / Tiere / Objekte) oder Szenenhintergründe enthalten; bei Subjekten sollte jedes Bild nur einen Charakter enthalten
Mengenbegrenzung:
image_urls+video_urlszusammen ≤ 5- Mindestens eines von
image_urls/video_urlsmuss bereitgestellt werden (nurimage_startreicht nicht)
Bildgrenzen:
- Formate: JPEG, JPG, PNG (Transparenz nicht unterstützt), BMP, WEBP
- Auflösung: Breite und Höhe in
[240, 8000]Pixel - Seitenverhältnis: 1:8 ~ 8:1
- Dateigröße: max.
20MB
[
"https://example.com/ref1.jpg",
"https://example.com/ref2.jpg"
]Referenzvideo-URL-Liste. Sollte ein Subjekt (Person / Tier / Objekt) enthalten; leere oder reine Hintergrund-Aufnahmen werden nicht empfohlen. Bei Subjekten sollte jedes Video nur einen Charakter enthalten. Audio im Video kann als Stimmreferenz dienen
Mengenbegrenzung:
image_urls+video_urlszusammen ≤ 5- Mindestens eines von
image_urls/video_urlsmuss bereitgestellt werden
Videogrenzen:
- Formate: mp4, mov
- Dauer:
1 ~ 30Sekunden - Auflösung: Breite und Höhe in
[240, 4096]Pixel - Seitenverhältnis: 1:8 ~ 8:1
- Dateigröße: max.
100MB
Hinweis: wenn video_urls bereitgestellt wird, ist duration auf 10 Sekunden begrenzt
["https://example.com/reference.mp4"][Kompatibilitätsfeld — bevorzugen Sie model_params.voice_bindings]
Referenzstimme-URL-Liste. Wird positionell an Referenzmaterialien gebunden — zuerst gegen video_urls, dann gegen image_urls (in Reihenfolge der Listen, eins-zu-eins). Maximal 5 Elemente
Priorität:
- Wenn sowohl
model_params.voice_bindingsals auchaudio_urlsbereitgestellt werden, wird nurvoice_bindingsverwendet und dieses Feld ignoriert - Wenn ein Video in
video_urlsAudio enthält und keine Stimmbindung gesetzt ist, wird das Original-Audio verwendet; eine explizite Stimmbindung überschreibt das Original
Audiogrenzen:
- Unterstützte Formate:
wav,mp3 - Dauer:
1 ~ 10Sekunden - Dateigröße: max.
15MB
5[
"https://example.com/voice1.mp3",
"https://example.com/voice2.mp3"
]Container für erweiterte Parameter (empfohlen)
Videoqualität, Standard: 720p
Optionen:
720p: Standardqualität, Standardpreis (Standard)1080p: Hohe Qualität, höherer Preis
720p, 1080p "720p"
Seitenverhältnis des Videos, Standard: 16:9
Verhalten:
image_startnicht bereitgestellt: Video wird mit dem angegebenenaspect_ratiogeneriertimage_startbereitgestellt: dieses Feld wird ignoriert; das Video verwendet ein Seitenverhältnis ähnlich dem Startbild
Ausgabeauflösung pro Qualitätsstufe:
| Qualität | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
Videodauer in Sekunden (Ganzzahl)
Bereich:
- Ohne
video_urls:2 ~ 15, Standard5 - Mit
video_urls:2 ~ 10(begrenzt auf 10 Sekunden)
Abrechnung: anhand der tatsächlich generierten Videodauer
2 <= x <= 155
Zufallsseed, standardmäßig zufällig
Hinweise:
- Bereich:
1~2147483647 - Ein fester Seed reduziert beim Iterieren am Prompt die Variation und verbessert die Reproduzierbarkeit
1 <= x <= 214748364742
Ob die intelligente Prompt-Umschreibung aktiviert werden soll. Wenn aktiviert, optimiert ein großes Modell den Prompt, was die Ergebnisse für einfache oder unzureichend beschreibende Prompts deutlich verbessert.
Hinweis: Standard ist false — wird der Parameter weggelassen oder false gesendet, erfolgt keine Umschreibung. Senden Sie explizit true, um die Umschreibung zu aktivieren.
true
HTTPS-Callback-URL für den Aufgabenabschluss
Callback-Zeitpunkt:
- Wird ausgelöst, wenn die Aufgabe abgeschlossen, fehlgeschlagen oder abgebrochen wurde
- Wird nach Abrechnungsbestätigung gesendet
Sicherheitseinschränkungen:
- Nur HTTPS wird unterstützt
- Callbacks an interne IP-Adressen sind verboten (127.0.0.1, 10.x.x.x, 172.16-31.x.x, 192.168.x.x usw.)
- URL-Länge max.
2048Zeichen
Callback-Mechanismus:
- Timeout:
10Sekunden - Bis zu
3Wiederholungen nach Fehlschlag (jeweils nach1/2/4Sekunden) - Callback-Antwortformat ist identisch mit der Task-Query-API
- 2xx-Statuscodes gelten als erfolgreich, andere lösen Wiederholungen aus
"https://your-domain.com/webhooks/video-task-completed"
Antwort
Video-Aufgabe erfolgreich erstellt
Zeitstempel der Aufgabenerstellung
1757169743
Aufgaben-ID
"task-unified-1757169743-7cvnl5zw"
Tatsächlich verwendeter Modellname
"wan2.7-reference-video"
Spezifischer Aufgabentyp
video.generation.task Aufgabenfortschritt in Prozent (0-100)
0 <= x <= 1000
Aufgabenstatus
pending, processing, completed, failed "pending"
Detaillierte Informationen zur Video-Aufgabe
Ausgabetyp der Aufgabe
text, image, audio, video "video"
Nutzungs- und Abrechnungsinformationen