Messages API
GLM-5.2 - Anthropic 兼容接口
- 使用 Anthropic Messages 协议调用 GLM-5.2 模型
- 请求 / 响应结构与 Anthropic API 对齐
- 系统提示词:通过顶层
system传入 - 思考模式:GLM-5.2 默认开启思考,思考内容通过
content[type=thinking]block 返回;传thinking.type=disabled关闭 - 流式输出:SSE 事件流
- 工具调用:兼容 Anthropic
tool_use/tool_result流程 - ⚠️ 不支持多模态:GLM-5.2 为纯文本模型,图像 / 视频内容块会被忽略
POST
BaseURL 说明:默认 BaseURL 为
https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。授权
##所有接口均需要使用 Bearer Token 进行认证##
获取 API Key:
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY
备注:EvoLink 对 /v1/messages 统一采用 Bearer Token 鉴权。
请求体
application/json
要调用的模型
可用选项:
glm-5.2 示例:
"glm-5.2"
对话消息列表,按轮次 user / assistant 交替
说明:
- 至少包含 1 条消息
- 最后一条消息通常为
role=user - 支持多轮上下文,模型会引用历史消息
Minimum array length:
1指定生成内容长度的上限(Token 数)
说明:
- thinking 产生的 token 也计入该上限
- 达到上限时内容会被截断,响应
stop_reason=max_tokens
必填范围:
x >= 1示例:
1024
系统提示词,用于设定 AI 角色与行为
说明:
- 支持字符串或内容块数组
- 通过顶层
system字段传入(不要放进 messages) - 模型会遵循 system 约束
- ⚠️ 过长的 system 可能被截断:需要长上下文请放入
messages,不要全部堆在system
示例:
"You are a helpful assistant."
采样温度
说明:
- 值越高输出越发散,越低越确定
- 建议范围
[0, 1]
必填范围:
0 <= x <= 1示例:
1
核采样阈值
说明:
- 范围
[0, 1] - 建议不要同时调整 temperature 与 top_p
必填范围:
0 <= x <= 1示例:
0.9
仅从概率最高的 K 个 token 中采样(Anthropic 特有参数)
说明:
- 值越小输出越确定,越大候选越多样
必填范围:
x >= 0示例:
10
自定义停止序列:生成命中其中任一字符串时停止
说明:
- 命中即截断,命中处之前的内容正常返回
- ⚠️ 注意:命中停止序列时,GLM-5.2 的
stop_reason返回end_turn(而非 Anthropic 标准的stop_sequence),响应也不含stop_sequence字段。若客户端依赖stop_reason=="stop_sequence"判断命中,需特殊处理
示例:
["\n\n"]
是否以 SSE 流式返回
true:Server-Sent Events 流式返回(标准 Anthropic 事件序列:message_start / content_block_start / content_block_delta / message_delta / message_stop)false:完整响应后一次性返回(默认)
示例:
false
控制深度思考
说明:
- GLM-5.2 是推理模型,不传该字段时默认开启思考
- 开启时响应
content数组中会出现type="thinking"的推理过程 block(按 output token 计费,signature可能为空串) - 传
{"type":"disabled"}可关闭思考,显著减少 output token - ⚠️ 仅
type二元开关有效:budget_tokens、effort等思考预算/等级参数不生效(会被忽略),无法精细控制思考量
工具定义列表
说明:
- 遵循 Anthropic tool 定义规范
input_schema使用 JSON Schema 对象- 模型会返回标准
tool_useblock,stop_reason=tool_use
工具选择策略
请求元数据
响应
消息对象
Anthropic 风格的消息响应
消息唯一 ID(格式形如 msg_<uuid>)
响应对象类型
可用选项:
message 可用选项:
assistant 实际使用的模型
示例:
"glm-5.2"
响应内容块列表
可能包含的 block type:
thinking:推理过程(思考开启时,默认开启)text:最终回答文本tool_use:模型发起的工具调用
停止原因
end_turn:自然结束(⚠️ 命中 stop_sequences 时也返回此值)max_tokens:达到 max_tokens 上限tool_use:模型触发工具调用
可用选项:
end_turn, max_tokens, tool_use Token 使用统计(Anthropic 规范)