GLM-5.2 - Anthropic 兼容接口

授权

Authorization

string

header

必填

##所有接口均需要使用 Bearer Token 进行认证##

获取 API Key：

访问 API Key 管理页面获取您的 API Key

使用时在请求头中添加：

Authorization: Bearer YOUR_API_KEY

备注：EvoLink 对 /v1/messages 统一采用 Bearer Token 鉴权。

请求体

application/json

model

enum<string>

必填

要调用的模型

可用选项:

glm-5.2

示例:

"glm-5.2"

messages

object[]

必填

对话消息列表，按轮次 user / assistant 交替

说明：

至少包含 1 条消息
最后一条消息通常为 role=user
支持多轮上下文，模型会引用历史消息

Minimum array length: 1

Show child attributes

max_tokens

integer

指定生成内容长度的上限（Token 数）

说明：

thinking 产生的 token 也计入该上限
达到上限时内容会被截断，响应 stop_reason=max_tokens

必填范围: x >= 1

示例:

1024

system

系统提示词，用于设定 AI 角色与行为

说明：

支持字符串或内容块数组
通过顶层 system 字段传入（不要放进 messages）
模型会遵循 system 约束
⚠️ 过长的 system 可能被截断：需要长上下文请放入 messages，不要全部堆在 system

示例:

"You are a helpful assistant."

temperature

number

采样温度

说明：

值越高输出越发散，越低越确定
建议范围 [0, 1]

必填范围: 0 <= x <= 1

示例:

1

top_p

number

核采样阈值

说明：

范围 [0, 1]
建议不要同时调整 temperature 与 top_p

必填范围: 0 <= x <= 1

示例:

0.9

top_k

integer

仅从概率最高的 K 个 token 中采样（Anthropic 特有参数）

说明：

值越小输出越确定，越大候选越多样

必填范围: x >= 0

示例:

10

stop_sequences

string[]

自定义停止序列：生成命中其中任一字符串时停止

说明：

命中即截断，命中处之前的内容正常返回
⚠️ 注意：命中停止序列时，GLM-5.2 的 stop_reason 返回 end_turn（而非 Anthropic 标准的 stop_sequence），响应也不含 stop_sequence 字段。若客户端依赖 stop_reason=="stop_sequence" 判断命中，需特殊处理

示例:

["\n\n"]

stream

boolean

默认值:false

是否以 SSE 流式返回

true：Server-Sent Events 流式返回（标准 Anthropic 事件序列：message_start / content_block_start / content_block_delta / message_delta / message_stop）
false：完整响应后一次性返回（默认）

示例:

false

thinking

object

控制深度思考

说明：

GLM-5.2 是推理模型，不传该字段时默认开启思考
开启时响应 content 数组中会出现 type="thinking" 的推理过程 block（按 output token 计费，signature 可能为空串）
传 {"type":"disabled"} 可关闭思考，显著减少 output token
⚠️ 仅 type 二元开关有效：budget_tokens、effort 等思考预算/等级参数不生效（会被忽略），无法精细控制思考量

Show child attributes

tools

object[]

工具定义列表

说明：

遵循 Anthropic tool 定义规范
input_schema 使用 JSON Schema 对象
模型会返回标准 tool_use block，stop_reason=tool_use

Show child attributes

tool_choice

object

工具选择策略

Show child attributes

metadata

object

请求元数据

Show child attributes

响应

消息对象

Anthropic 风格的消息响应

string

消息唯一 ID（格式形如 msg_<uuid>）

type

enum<string>

响应对象类型

可用选项:

message

role

enum<string>

可用选项:

assistant

model

string

实际使用的模型

示例:

"glm-5.2"

content

object[]

响应内容块列表

可能包含的 block type：

thinking：推理过程（思考开启时，默认开启）
text：最终回答文本
tool_use：模型发起的工具调用

Show child attributes

stop_reason

enum<string>

停止原因

end_turn：自然结束（⚠️ 命中 stop_sequences 时也返回此值）
max_tokens：达到 max_tokens 上限
tool_use：模型触发工具调用

可用选项:

end_turn,

max_tokens,

tool_use

usage

object

Token 使用统计（Anthropic 规范）

Show child attributes