prompt 自然语言控制镜头结构
prompt 内容自行理解audio_urls:模型以该音频为驱动源生成视频audio_urls:模型根据视频画面内容自动生成匹配的背景音乐或音效Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
##所有接口均需要使用Bearer Token进行认证##
获取 API Key :
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY模型名称,固定为 wan2.7-text-to-video
wan2.7-text-to-video "wan2.7-text-to-video"
视频生成的文本提示词。支持中英文,每个汉字/字母占 1 个字符,超过部分会自动截断,最大长度 5000 字符
多镜头叙事: 通过自然语言控制镜头结构
5000"一只小猫在月光下奔跑"
负面提示词,描述不希望在视频画面中出现的内容。支持中英文,最大长度 500 字符,超过部分会自动截断
500"模糊, 低质量"
驱动音频文件 URL 数组(可选)。当前仅支持 1 个元素
生效逻辑:
格式要求:
wav、mp32 ~ 30 秒15MB截断处理:
duration 值,自动截取前 N 秒,其余部分丢弃1 element["https://example.com/audio.mp3"]视频清晰度,默认为720p
说明:
720p: 标准清晰度,标准价格,此为默认值1080p: 高清晰度,价格会提升720p, 1080p "720p"
视频宽高比,默认为 16:9
不同档位输出分辨率:
| 分辨率档位 | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720p | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080p | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |
16:9, 9:16, 1:1, 4:3, 3:4 "16:9"
视频时长(秒),范围 2-15
注意:
2~15秒之间的任意整数值2 <= x <= 155
随机种子,默认随机
说明:
1 ~ 21474836471 <= x <= 214748364742
是否开启prompt智能改写,开启后将使用大模型优化正向提示词,对描述性不足、较为简单的prompt提升效果较明显。
注意: 默认值为 false,不传或传 false 时不会触发改写,如需开启请显式传 true
false
任务完成后的HTTPS回调地址
回调时机:
安全限制:
2048字符回调机制:
10秒3次(会分别在失败的1秒/2秒/4秒后进行重试)"https://your-domain.com/webhooks/video-task-completed"
视频任务创建成功
任务创建时间戳
1757169743
任务ID
"task-unified-1757169743-7cvnl5zw"
实际使用的模型名称
"wan2.7-text-to-video"
任务的具体类型
video.generation.task 任务进度百分比 (0-100)
0 <= x <= 1000
任务状态
pending, processing, completed, failed "pending"
视频任务详细信息
任务的输出类型
text, image, audio, video "video"
使用量和计费信息