跳转到主要内容
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "请介绍一下你自己"
    }
  ]
}
'
{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好!我是 GLM-5.2,可以帮你完成对话、推理、写作、代码等多种任务。",
        "reasoning_content": "让我先分析这个问题……",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}
BaseURL 说明:默认 BaseURL 为 https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。

授权

Authorization
string
header
必填

##所有接口均需要使用 Bearer Token 进行认证##

获取 API Key

访问 API Key 管理页面 获取您的 API Key

使用时在请求头中添加

Authorization: Bearer YOUR_API_KEY

请求体

application/json
model
enum<string>
默认值:glm-5.2
必填

调用的模型代码

  • glm-5.2:最新旗舰模型,提供复杂推理、超长上下文与极致推理速度
可用选项:
glm-5.2
示例:

"glm-5.2"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
必填

对话消息列表,包含当前对话的完整上下文信息

支持四种角色:systemuserassistanttool。不同角色的消息具有不同的字段结构,请选择对应角色查看。至少包含 1 条消息,且不能只包含系统消息或助手消息。

Minimum array length: 1
stream
boolean
默认值:false

是否启用流式输出模式

  • false:模型生成完整响应后一次性返回(默认),适合短文本与批处理
  • true:通过 Server-Sent Events(SSE)实时逐块返回,适合聊天与长文本;流式结束时返回 data: [DONE]
示例:

false

thinking
object

控制是否开启思维链(Chain of Thought)

reasoning_effort
enum<string>
默认值:max

控制模型的推理程度(GLM-5.2 专属能力)

说明

  • 仅在 thinking 开启时生效,默认 max
  • 取值由强到弱:max > xhigh > high > medium > low > minimal > none

GLM-5.2 映射规则(为与其他协议兼容):

  • xhigh → 等价 max
  • low / medium → 等价 high
  • none / minimal → 放弃思考(不进行深度推理)
可用选项:
max,
xhigh,
high,
medium,
low,
minimal,
none
示例:

"max"

do_sample
boolean
默认值:true

是否启用采样策略

  • true(默认):使用 temperature / top_p 进行随机采样,输出更多样
  • false:总是选择概率最高的词汇(贪心解码),输出更确定,此时 temperaturetop_p 被忽略

对需要一致性、可重复性的任务(如代码生成、翻译),建议设置为 false

示例:

true

temperature
number<float>
默认值:1

采样温度,控制输出的随机性和创造性

说明

  • 取值范围:[0.0, 1.0],限两位小数
  • 较高值(如 0.8):更随机、更有创意,适合创意写作
  • 较低值(如 0.2):更稳定、更确定,适合事实问答与代码生成
  • GLM-5.2 默认值:1.0

建议:不要同时调整 temperaturetop_p

必填范围: 0 <= x <= 1
示例:

1

top_p
number<float>
默认值:0.95

核采样(Nucleus Sampling)参数,是 temperature 采样的替代方法

说明

  • 取值范围:[0.01, 1.0],限两位小数
  • 模型只考虑累积概率达到 top_p 的候选词汇,例如 0.1 表示只考虑前 10% 概率的词汇
  • 较小值产生更集中、更一致的输出;较大值增加多样性
  • GLM-5.2 默认值:0.95

建议:不要同时调整 temperaturetop_p

必填范围: 0.01 <= x <= 1
示例:

0.95

max_tokens
integer

模型输出的最大 token 数量限制

说明

  • GLM-5.2 最大支持 131,072 tokens(128K)输出长度,建议设置不小于 1024
  • 开启 thinking 时,思维链 token 也计入该上限
  • 若生成因 length 原因被截断,请尝试调高此值
必填范围: 1 <= x <= 131072
示例:

1024

tools
(Function 工具 · object | Retrieval 工具(知识库检索) · object | Web Search 工具(网络搜索) · object | MCP 工具 · object)[]

模型可以调用的工具列表

说明

  • 支持函数调用(function)、知识库检索(retrieval)、网络搜索(web_search)、MCP(mcp
  • 最多支持 128 个函数
Maximum array length: 128
tool_choice
enum<string>
默认值:auto

控制模型选择调用哪个函数的方式

说明:仅在工具类型为 function 时生效,默认且仅支持 auto(由模型自动决定是否调用工具)

可用选项:
auto
示例:

"auto"

stop
string[]

停止词列表

说明

  • 当模型生成文本遇到指定字符串时立即停止生成(停止词本身不包含在返回文本中)
  • 目前仅支持单个停止词,格式为 ["stop_word1"],例如 ["Human:"]
Maximum array length: 4
示例:
["Human:"]
response_format
object

指定模型响应输出格式,默认为 text

说明

  • { "type": "json_object" } 启用 JSON 模式,模型返回有效的 JSON 格式数据,适用于结构化数据提取等场景
  • 使用 JSON 模式时,建议在 systemuser 消息中明确要求输出 JSON
request_id
string

请求唯一标识符

说明

  • 由用户端传递,长度 6-64 字符,建议使用 UUID 格式确保唯一性
  • 若未提供,平台将自动生成
Required string length: 6 - 64
示例:

"req-7f3a2c1e8b9d4f0a"

user_id
string

终端用户的唯一标识符

说明:长度 6-128 字符,建议使用不包含敏感信息的唯一标识,可帮助平台监控和检测滥用行为

Required string length: 6 - 128
示例:

"user-abc123456"

响应

对话生成成功

id
string

任务 ID

示例:

"chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a"

object
enum<string>

响应类型

可用选项:
chat.completion
示例:

"chat.completion"

request_id
string

请求 ID(在请求中提供 request_id 时回传)

示例:

"req-7f3a2c1e8b9d4f0a"

created
integer

请求创建时间,Unix 时间戳(秒)

示例:

1777021417

model
string

模型名称

示例:

"glm-5.2"

choices
object[]

模型响应列表

usage
object

调用结束时返回的 Token 使用统计

网页搜索相关信息,使用 web_search 工具且命中搜索时返回

content_filter
object[]

内容安全相关信息