generation_mode 参数选择三种生成模式:
first_frame:首帧生视频——基于首帧图像生成视频,可选驱动音频first_last_frame:首尾帧生视频——基于首帧+尾帧两张图像插值生成视频,可选驱动音频video_continuation:视频续写——基于一段视频片段续写后续内容,可选尾帧图(不支持驱动音频)generation_mode 为可选参数(向后兼容),未传时将根据请求中的素材类型自动选择合适的模式image_start(首帧)image_start + audio_urls(首帧 + 驱动音频)image_start + image_end(首尾帧)image_start + image_end + audio_urls(首尾帧 + 驱动音频)video_urls(视频续写)video_urls + image_end(视频续写 + 尾帧)Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
##所有接口均需要使用Bearer Token进行认证##
获取 API Key :
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY模型名称,固定为 wan2.7-image-to-video
wan2.7-image-to-video "wan2.7-image-to-video"
生成模式,决定素材组合的合法性。推荐显式指定
取值说明:
first_frame:首帧生视频。必传 image_start;可选 audio_urls;不接受 image_end 与 video_urlsfirst_last_frame:首尾帧生视频。必传 image_start + image_end;可选 audio_urls;不接受 video_urlsvideo_continuation:视频续写。必传 video_urls[0];可选 image_end(作为尾帧);不接受 image_start 与 audio_urls未传时的兼容行为: 未传 generation_mode 时,将根据请求中的素材类型自动选择合适的模式;建议显式指定以避免歧义
first_frame, first_last_frame, video_continuation "first_frame"
视频生成的文本提示词。支持中英文,每个汉字/字母占 1 个字符,超过部分会自动截断。最大长度 5000 字符
5000"一只猫在弹钢琴"
负面提示词,描述不希望在视频画面中出现的内容。支持中英文,最大长度 500 字符,超过部分会自动截断
500"模糊, 低质量"
首帧图片 URL
模式约束:
first_frame 模式:必传first_last_frame 模式:必传video_continuation 模式:禁止传入图像限制:
[240, 8000] 像素20MB"https://example.com/first_frame.jpg"
尾帧图片 URL
模式约束:
first_last_frame 模式:必传video_continuation 模式:可选(作为视频续写的目标尾帧)first_frame 模式:禁止传入(如需首尾帧,请使用 first_last_frame)图像限制:
[240, 8000] 像素20MB"https://example.com/last_frame.jpg"
视频续写 URL 数组,仅支持 1 个元素
模式约束:
video_continuation 模式:必传first_frame / first_last_frame 模式:禁止传入audio_urls 同时使用视频限制:
2 ~ 10 秒(输入片段本身长度)[240, 4096] 像素100MB续写时长规则:
duration 参数表示最终输出视频的总时长(包含原始输入片段 + 模型续写部分)duration − 输入视频时长duration 必须 ≥ 输入视频时长duration)结算示例:
| 输入视频时长 | duration | 续写生成 | 最终输出 | 计费时长 |
|---|---|---|---|---|
| 3 秒 | 15 | 12 秒 | 15 秒 | 15 秒 |
| 5 秒 | 10 | 5 秒 | 10 秒 | 10 秒 |
| 8 秒 | 8 | 0 秒(仅原片输出) | 8 秒 | 8 秒 |
["https://example.com/clip.mp4"]驱动音频文件 URL 数组。当前仅支持 1 个元素。模型将以该音频为驱动源生成视频(如口型同步、动作卡点等)
模式约束:
first_frame 模式:可选first_last_frame 模式:可选video_continuation 模式:禁止传入(不能与 video_urls 同时使用)格式要求:
wav、mp32 ~ 30 秒15MB截断处理:
duration 值,自动截取前 N 秒,其余部分丢弃1 element["https://example.com/audio.mp3"]视频清晰度,默认为720p
说明:
720p: 标准清晰度,标准价格,此为默认值1080p: 高清晰度,价格会提升720p, 1080p "720p"
视频时长(秒),整数,范围 2 ~ 15,默认 5
含义说明:
first_frame / first_last_frame 模式:表示生成视频的总时长video_continuation 模式:表示最终输出视频的总时长(= 原始输入片段 + 模型续写部分)video_continuation 模式额外约束:
duration 必须 ≥ 输入视频时长(否则报错)duration − 输入视频时长duration = 输入视频时长时,不进行续写,仅原样输出输入片段video_urls 字段中的续写时长规则与示例计费说明: 实际扣费以生成视频的秒数为准
2 <= x <= 155
随机种子,默认随机
说明:
1 ~ 21474836471 <= x <= 214748364742
是否开启prompt智能改写,开启后将使用大模型优化正向提示词,对描述性不足、较为简单的prompt提升效果较明显。
注意: 默认值为 false,不传或传 false 时不会触发改写,如需开启请显式传 true
false
任务完成后的HTTPS回调地址
回调时机:
安全限制:
2048字符回调机制:
10秒3次(会分别在失败的1秒/2秒/4秒后进行重试)"https://your-domain.com/webhooks/video-task-completed"
视频任务创建成功
任务创建时间戳
1757169743
任务ID
"task-unified-1757169743-7cvnl5zw"
实际使用的模型名称
"wan2.7-image-to-video"
任务的具体类型
video.generation.task 任务进度百分比 (0-100)
0 <= x <= 1000
任务状态
pending, processing, completed, failed "pending"
视频任务详细信息
任务的输出类型
text, image, audio, video "video"
使用量和计费信息