> ## Documentation Index
> Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Qwen Voice Design 声音设计

> - 通过文本描述创建自定义音色，返回音色名称和预览音频
- [Qwen3 TTS VD](/cn/api-manual/audio-series/qwen-tts/qwen3-tts-vd) 语音合成**必须使用本接口创建的音色**，不支持系统内置音色
- 异步处理模式，使用返回的任务ID [进行查询](/cn/api-manual/task-management/get-task-detail)
- 生成的音频链接有效期为24小时，请尽快保存

**使用流程：**
1. 调用本接口创建音色
2. 轮询任务结果，获取 `result_data.voice`（音色名称）
3. 调用 [Qwen3 TTS VD](/cn/api-manual/audio-series/qwen-tts/qwen3-tts-vd)，传入 `voice` 参数进行语音合成



## OpenAPI

````yaml cn/api-manual/audio-series/qwen-tts/qwen-voice-design.json POST /v1/audios/generations
openapi: 3.1.0
info:
  title: Qwen Voice Design 声音设计接口
  description: 通过文本描述创建自定义音色，返回音色名称和预览音频。qwen3-tts-vd 语音合成必须使用本接口创建的音色，不支持系统内置音色。
  license:
    name: MIT
  version: 1.0.0
servers:
  - url: https://api.evolink.ai
    description: 生产环境
security:
  - bearerAuth: []
tags:
  - name: 声音设计
    description: Qwen Voice Design 声音设计相关接口
paths:
  /v1/audios/generations:
    post:
      tags:
        - 声音设计
      summary: Qwen Voice Design 声音设计
      description: >-
        - 通过文本描述创建自定义音色，返回音色名称和预览音频

        - [Qwen3 TTS VD](/cn/api-manual/audio-series/qwen-tts/qwen3-tts-vd)
        语音合成**必须使用本接口创建的音色**，不支持系统内置音色

        - 异步处理模式，使用返回的任务ID
        [进行查询](/cn/api-manual/task-management/get-task-detail)

        - 生成的音频链接有效期为24小时，请尽快保存


        **使用流程：**

        1. 调用本接口创建音色

        2. 轮询任务结果，获取 `result_data.voice`（音色名称）

        3. 调用 [Qwen3 TTS
        VD](/cn/api-manual/audio-series/qwen-tts/qwen3-tts-vd)，传入 `voice`
        参数进行语音合成
      operationId: createQwenVoiceDesign
      requestBody:
        required: true
        content:
          application/json:
            schema:
              $ref: '#/components/schemas/QwenVoiceDesignRequest'
            examples:
              minimal:
                summary: 最简调用
                value:
                  model: qwen-voice-design
                  voice_prompt: 沉稳的中年男性播音员，音色低沉浑厚，富有磁性，语速平稳，吐字清晰
                  preview_text: 各位听众朋友，大家好，欢迎收听晚间新闻。
                  preferred_name: announcer
              full_params:
                summary: 完整参数
                value:
                  model: qwen-voice-design
                  voice_prompt: 年轻活泼的女性声音，语速较快，带有明显的上扬语调，适合介绍时尚产品
                  preview_text: Hi everyone, welcome to today's fashion review!
                  preferred_name: fashion_host
                  language: en
                  sample_rate: 48000
                  response_format: mp3
      responses:
        '200':
          description: 声音设计任务创建成功
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/QwenVoiceDesignResponse'
        '400':
          description: 请求参数错误
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: invalid_parameter
                  message: 'Missing required parameter: voice_prompt or preview_text'
                  type: invalid_request_error
        '401':
          description: 未认证、Token无效或过期
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: unauthorized
                  message: Invalid or expired token
                  type: authentication_error
        '402':
          description: 配额不足、需要充值
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: insufficient_quota
                  message: Insufficient quota. Please top up your account.
                  type: insufficient_quota
        '403':
          description: 无权限访问
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: model_access_denied
                  message: 'Token does not have access to model: qwen-voice-design'
                  type: invalid_request_error
        '429':
          description: 请求频率超限
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: rate_limit_exceeded
                  message: Too many requests, please try again later
                  type: rate_limit_error
        '500':
          description: 服务器内部错误
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/ErrorResponse'
              example:
                error:
                  code: internal_error
                  message: Internal server error
                  type: api_error
components:
  schemas:
    QwenVoiceDesignRequest:
      type: object
      required:
        - model
        - voice_prompt
        - preview_text
        - preferred_name
      properties:
        model:
          type: string
          description: 模型名称
          enum:
            - qwen-voice-design
          default: qwen-voice-design
          example: qwen-voice-design
        voice_prompt:
          type: string
          description: |-
            声音特征描述，用于定义音色

            **约束：**
            - 最大 `2048` 字符
            - 仅支持中文和英文

            **描述维度建议：**
            - 性别：男性、女性、中性
            - 年龄：儿童(5-12)、青少年(13-18)、青年(19-35)、中年(36-55)、老年(55+)
            - 音调：高音、中音、低音
            - 语速：快速、中速、缓慢
            - 情感：开朗、沉稳、温柔、严肃、活泼、冷静
            - 特点：有磁性、清脆、沙哑、圆润、甜美、浑厚
            - 用途：新闻播报、广告配音、有声书、动画角色、语音助手

            **推荐写法示例：**
            - `沉稳的中年男性，语速缓慢，音色低沉有磁性，适合朗读新闻或纪录片解说`
            - `可爱的儿童声音，大约8岁女孩，说话略带稚气，适合动画角色配音`
            - `温柔知性的女性，30岁左右，语调平和，适合有声书朗读`
          maxLength: 2048
          example: 沉稳的中年男性播音员，音色低沉浑厚，富有磁性，语速平稳，吐字清晰
        preview_text:
          type: string
          description: |-
            预览文本，用于生成试听音频

            **约束：**
            - 最大 `1024` 字符
            - 支持 10 种语言：中文、英文、日语、韩语、德语、法语、意大利语、俄语、葡萄牙语、西班牙语
            - 建议与 `language` 语种一致
          maxLength: 1024
          example: 各位听众朋友，大家好，欢迎收听晚间新闻。
        preferred_name:
          type: string
          description: |-
            音色名称前缀

            **约束：**
            - 仅数字、英文字母、下划线
            - 不超过 `16` 字符

            生成的完整音色名格式：`qwen-tts-vd-{preferred_name}-voice-{timestamp}`

            如传入 `announcer`，最终音色名类似：`qwen-tts-vd-announcer-voice-20260402-a1b2`
          maxLength: 16
          pattern: ^[a-zA-Z0-9_]+$
          example: announcer
        language:
          type: string
          description: |-
            音色的语言倾向，建议与 `preview_text` 语种一致

            不传时由上游使用默认值 `zh`
          enum:
            - zh
            - en
            - ja
            - ko
            - de
            - fr
            - it
            - ru
            - pt
            - es
          example: zh
        sample_rate:
          type: integer
          description: |-
            预览音频采样率（Hz）

            不传时由上游使用默认值 `24000`
          enum:
            - 8000
            - 16000
            - 24000
            - 48000
          example: 24000
        response_format:
          type: string
          description: |-
            预览音频格式

            不传时由上游使用默认值 `wav`
          enum:
            - pcm
            - wav
            - mp3
            - opus
          example: wav
        target_model:
          type: string
          description: >-
            创建的音色将由哪个 TTS 模型驱动


            **重要：** 创建音色时指定的 `target_model` 必须与后续语音合成时使用的模型一致，否则合成会失败


            | 值 | 说明 |

            |-----|------|

            | `qwen3-tts-vd-2026-01-26` | 千问3-TTS-VD 非流式（默认） |

            | `qwen3-tts-vd-realtime-2026-01-15` | 千问3-TTS-VD-Realtime 双向流式（新版）
            |

            | `qwen3-tts-vd-realtime-2025-12-16` | 千问3-TTS-VD-Realtime 双向流式（旧版）
            |


            > 目前本平台已接入 `qwen3-tts-vd-2026-01-26`（非流式），realtime 模型暂未接入但可预创建音色
          enum:
            - qwen3-tts-vd-2026-01-26
            - qwen3-tts-vd-realtime-2026-01-15
            - qwen3-tts-vd-realtime-2025-12-16
          default: qwen3-tts-vd-2026-01-26
          example: qwen3-tts-vd-2026-01-26
        callback_url:
          type: string
          description: |-
            任务完成后的HTTPS回调地址

            **回调时机：**
            - 任务完成（completed）、失败（failed）或取消（cancelled）时触发
            - 在计费确认完成后发送

            **安全限制：**
            - 仅支持HTTPS协议
            - 禁止回调到内网IP地址（127.0.0.1、10.x.x.x、172.16-31.x.x、192.168.x.x等）
            - URL长度不超过`2048`字符

            **回调机制：**
            - 超时时间：`10`秒
            - 失败后最多重试`3`次（会分别在失败的`1`秒/`2`秒/`4`秒后进行重试）
            - 回调响应体格式与任务查询接口返回的格式一致
            - 回调地址若返回2xx状态码视为成功，其他状态码会触发重试
          format: uri
          example: https://your-domain.com/webhooks/voice-design-completed
    QwenVoiceDesignResponse:
      type: object
      properties:
        created:
          type: integer
          description: 任务创建时间戳
          example: 1775123456
        id:
          type: string
          description: 任务ID
          example: task-unified-1775123456-abcd1234
        model:
          type: string
          description: 实际使用的模型名称
          example: qwen-voice-design
        object:
          type: string
          enum:
            - audio.generation.task
          description: 任务的具体类型
        progress:
          type: integer
          description: 任务进度百分比 (0-100)
          minimum: 0
          maximum: 100
          example: 0
        status:
          type: string
          description: 任务状态
          enum:
            - pending
            - processing
            - completed
            - failed
          example: pending
        task_info:
          $ref: '#/components/schemas/AudioTaskInfo'
          description: 音频任务详细信息
        type:
          type: string
          enum:
            - audio
          description: 任务的输出类型
          example: audio
        usage:
          $ref: '#/components/schemas/AudioUsage'
          description: 使用量和计费信息
    ErrorResponse:
      type: object
      properties:
        error:
          type: object
          properties:
            code:
              type: string
              description: 错误代码标识符
            message:
              type: string
              description: 错误描述信息
            type:
              type: string
              description: 错误类型
    AudioTaskInfo:
      type: object
      properties:
        can_cancel:
          type: boolean
          description: 任务是否可以取消
          example: true
        estimated_time:
          type: integer
          description: 预估完成时间(秒)
          minimum: 0
          example: 15
        audio_type:
          type: string
          description: 音频任务类型
          example: voice_design
    AudioUsage:
      type: object
      description: 使用量信息
      properties:
        credits_reserved:
          type: number
          description: 预估消耗积分数
          minimum: 0
          example: 2
  securitySchemes:
    bearerAuth:
      type: http
      scheme: bearer
      description: |-
        ##所有接口均需要使用Bearer Token进行认证##

        **获取 API Key：**

        访问 [API Key 管理页面](https://evolink.ai/dashboard/keys) 获取您的 API Key

        **使用时在请求头中添加：**
        ```
        Authorization: Bearer YOUR_API_KEY
        ```

````