curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "请介绍一下你自己"
    }
  ]
}
'

{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好！我是 GLM-5.2，可以帮你完成对话、推理、写作、代码等多种任务。",
        "reasoning_content": "让我先分析这个问题……",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}

GLM-5.2

GLM-5.2 - OpenAI 兼容接口

使用 OpenAI Chat Completions 协议调用 GLM-5.2 模型
同步处理模式，实时返回对话内容
纯文本对话：单轮或多轮上下文对话
系统提示词：通过 role=system 消息自定义 AI 的角色和行为
深度思考：通过 thinking.type 开关思维链，reasoning_effort 调节推理强度；推理过程通过 reasoning_content 返回
流式输出：支持 SSE 流式返回（stream=true）
工具调用：支持 Function Calling、知识库检索（retrieval）、网络搜索（web_search）、MCP（最多 128 个工具）
结构化输出：通过 response_format 启用 JSON 模式

流式响应说明：当 stream=true 时，通过 Server-Sent Events 返回，每条消息格式为 data: {JSON}，结束时返回 data: [DONE]。每个数据块（ChatCompletionChunk）包含 id、created、model、choices、可选 usage 与 content_filter；其中 choices[].delta 增量返回 role / content / reasoning_content / tool_calls，choices[].finish_reason 在最后一块给出终止原因。

POST

chat

completions

curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "请介绍一下你自己"
    }
  ]
}
'

{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "你好！我是 GLM-5.2，可以帮你完成对话、推理、写作、代码等多种任务。",
        "reasoning_content": "让我先分析这个问题……",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}

BaseURL 说明：默认 BaseURL 为 https://direct.evolink.ai，对文本模型支持更好，支持长连接；https://api.evolink.ai 是多模态主力地址，对文本模型作为备用地址使用。

授权

Authorization

string

header

必填

##所有接口均需要使用 Bearer Token 进行认证##

获取 API Key：

访问 API Key 管理页面获取您的 API Key

使用时在请求头中添加：

Authorization: Bearer YOUR_API_KEY

请求体

application/json

model

enum<string>

默认值:glm-5.2

必填

调用的模型代码

glm-5.2：最新旗舰模型，提供复杂推理、超长上下文与极致推理速度

可用选项:

glm-5.2

示例:

"glm-5.2"

messages

(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]

必填

对话消息列表，包含当前对话的完整上下文信息

支持四种角色：system、user、assistant、tool。不同角色的消息具有不同的字段结构，请选择对应角色查看。至少包含 1 条消息，且不能只包含系统消息或助手消息。

Minimum array length: 1

System Message
User Message
Assistant Message
Tool Message

Show child attributes

stream

boolean

默认值:false

是否启用流式输出模式

false：模型生成完整响应后一次性返回（默认），适合短文本与批处理
true：通过 Server-Sent Events（SSE）实时逐块返回，适合聊天与长文本；流式结束时返回 data: [DONE]

示例:

false

thinking

object

控制是否开启思维链（Chain of Thought）

Show child attributes

reasoning_effort

enum<string>

默认值:max

控制模型的推理程度（GLM-5.2 专属能力）

说明：

仅在 thinking 开启时生效，默认 max
取值由强到弱：max > xhigh > high > medium > low > minimal > none

GLM-5.2 映射规则（为与其他协议兼容）：

xhigh → 等价 max
low / medium → 等价 high
none / minimal → 放弃思考（不进行深度推理）

可用选项:

max,

xhigh,

high,

medium,

low,

minimal,

none

示例:

"max"

do_sample

boolean

默认值:true

是否启用采样策略

true（默认）：使用 temperature / top_p 进行随机采样，输出更多样
false：总是选择概率最高的词汇（贪心解码），输出更确定，此时 temperature 与 top_p 被忽略

对需要一致性、可重复性的任务（如代码生成、翻译），建议设置为 false

示例:

true

temperature

number<float>

默认值:1

采样温度，控制输出的随机性和创造性

说明：

取值范围：[0.0, 1.0]，限两位小数
较高值（如 0.8）：更随机、更有创意，适合创意写作
较低值（如 0.2）：更稳定、更确定，适合事实问答与代码生成
GLM-5.2 默认值：1.0

建议：不要同时调整 temperature 和 top_p

必填范围: 0 <= x <= 1

示例:

1

top_p

number<float>

默认值:0.95

核采样（Nucleus Sampling）参数，是 temperature 采样的替代方法

说明：

取值范围：[0.01, 1.0]，限两位小数
模型只考虑累积概率达到 top_p 的候选词汇，例如 0.1 表示只考虑前 10% 概率的词汇
较小值产生更集中、更一致的输出；较大值增加多样性
GLM-5.2 默认值：0.95

建议：不要同时调整 temperature 和 top_p

必填范围: 0.01 <= x <= 1

示例:

0.95

max_tokens

integer

模型输出的最大 token 数量限制

说明：

GLM-5.2 最大支持 131,072 tokens（128K）输出长度，建议设置不小于 1024
开启 thinking 时，思维链 token 也计入该上限
若生成因 length 原因被截断，请尝试调高此值

必填范围: 1 <= x <= 131072

示例:

1024

tools

(Function 工具 · object | Retrieval 工具（知识库检索） · object | Web Search 工具（网络搜索） · object | MCP 工具 · object)[]

模型可以调用的工具列表

说明：

支持函数调用（function）、知识库检索（retrieval）、网络搜索（web_search）、MCP（mcp）
最多支持 128 个函数

Maximum array length: 128

Function 工具
Retrieval 工具（知识库检索）
Web Search 工具（网络搜索）
MCP 工具

Show child attributes

tool_choice

enum<string>

默认值:auto

控制模型选择调用哪个函数的方式

说明：仅在工具类型为 function 时生效，默认且仅支持 auto（由模型自动决定是否调用工具）

可用选项:

auto

示例:

"auto"

stop

string[]

停止词列表

说明：

当模型生成文本遇到指定字符串时立即停止生成（停止词本身不包含在返回文本中）
目前仅支持单个停止词，格式为 ["stop_word1"]，例如 ["Human:"]

Maximum array length: 4

示例:

["Human:"]

response_format

object

指定模型响应输出格式，默认为 text

说明：

{ "type": "json_object" } 启用 JSON 模式，模型返回有效的 JSON 格式数据，适用于结构化数据提取等场景
使用 JSON 模式时，建议在 system 或 user 消息中明确要求输出 JSON

Show child attributes

request_id

string

请求唯一标识符

说明：

由用户端传递，长度 6-64 字符，建议使用 UUID 格式确保唯一性
若未提供，平台将自动生成

Required string length: 6 - 64

示例:

"req-7f3a2c1e8b9d4f0a"

user_id

string

终端用户的唯一标识符

说明：长度 6-128 字符，建议使用不包含敏感信息的唯一标识，可帮助平台监控和检测滥用行为

Required string length: 6 - 128

示例:

"user-abc123456"

响应

对话生成成功

string

任务 ID

示例:

"chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a"

object

enum<string>

响应类型

可用选项:

chat.completion

示例:

"chat.completion"

request_id

string

请求 ID（在请求中提供 request_id 时回传）

示例:

"req-7f3a2c1e8b9d4f0a"

created

integer

请求创建时间，Unix 时间戳（秒）

示例:

1777021417

model

string

模型名称

示例:

"glm-5.2"

choices

object[]

模型响应列表

Show child attributes

usage

object

调用结束时返回的 Token 使用统计

Show child attributes

web_search

object[]

网页搜索相关信息，使用 web_search 工具且命中搜索时返回

Show child attributes

content_filter

object[]

内容安全相关信息

Show child attributes

MiniMax-M2.5 - 完整参数文档查询积分使用情况