跳转到主要内容
POST
/
v1
/
messages
curl --request POST \ --url https://direct.evolink.ai/v1/messages \ --header 'Authorization: Bearer <token>' \ --header 'Content-Type: application/json' \ --data ' { "model": "glm-5.2", "max_tokens": 1024, "messages": [ { "role": "user", "content": "你好,世界" } ] } '
{ "id": "msg_0842a705-9d0b-4eaa-b12d-09a4106326c5", "type": "message", "role": "assistant", "model": "glm-5.2", "content": [ { "type": "thinking", "thinking": "用户要求用一个词打招呼,回答 \"Hi\" 即可。", "signature": "" }, { "type": "text", "text": "Hi." } ], "stop_reason": "end_turn", "usage": { "input_tokens": 18, "output_tokens": 101, "cache_creation_input_tokens": 0, "cache_read_input_tokens": 0, "prompt_tokens_details": { "cached_tokens": 0 } } }
BaseURL 说明:默认 BaseURL 为 https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。

授权

Authorization
string
header
必填

##所有接口均需要使用 Bearer Token 进行认证##

获取 API Key

访问 API Key 管理页面 获取您的 API Key

使用时在请求头中添加

Authorization: Bearer YOUR_API_KEY

备注:EvoLink 对 /v1/messages 统一采用 Bearer Token 鉴权。

请求体

application/json
model
enum<string>
必填

要调用的模型

可用选项:
glm-5.2
示例:

"glm-5.2"

messages
object[]
必填

对话消息列表,按轮次 user / assistant 交替

说明

  • 至少包含 1 条消息
  • 最后一条消息通常为 role=user
  • 支持多轮上下文,模型会引用历史消息
Minimum array length: 1
max_tokens
integer

指定生成内容长度的上限(Token 数)

说明

  • thinking 产生的 token 也计入该上限
  • 达到上限时内容会被截断,响应 stop_reason=max_tokens
必填范围: x >= 1
示例:

1024

system

系统提示词,用于设定 AI 角色与行为

说明

  • 支持字符串或内容块数组
  • 通过顶层 system 字段传入(不要放进 messages)
  • 模型会遵循 system 约束
  • ⚠️ 过长的 system 可能被截断:需要长上下文请放入 messages,不要全部堆在 system
示例:

"You are a helpful assistant."

temperature
number

采样温度

说明

  • 值越高输出越发散,越低越确定
  • 建议范围 [0, 1]
必填范围: 0 <= x <= 1
示例:

1

top_p
number

核采样阈值

说明

  • 范围 [0, 1]
  • 建议不要同时调整 temperature 与 top_p
必填范围: 0 <= x <= 1
示例:

0.9

top_k
integer

仅从概率最高的 K 个 token 中采样(Anthropic 特有参数)

说明

  • 值越小输出越确定,越大候选越多样
必填范围: x >= 0
示例:

10

stop_sequences
string[]

自定义停止序列:生成命中其中任一字符串时停止

说明

  • 命中即截断,命中处之前的内容正常返回
  • ⚠️ 注意:命中停止序列时,GLM-5.2 的 stop_reason 返回 end_turn(而非 Anthropic 标准的 stop_sequence),响应也不含 stop_sequence 字段。若客户端依赖 stop_reason=="stop_sequence" 判断命中,需特殊处理
示例:
["\n\n"]
stream
boolean
默认值:false

是否以 SSE 流式返回

  • true:Server-Sent Events 流式返回(标准 Anthropic 事件序列:message_start / content_block_start / content_block_delta / message_delta / message_stop)
  • false:完整响应后一次性返回(默认)
示例:

false

thinking
object

控制深度思考

说明

  • GLM-5.2 是推理模型,不传该字段时默认开启思考
  • 开启时响应 content 数组中会出现 type="thinking" 的推理过程 block(按 output token 计费,signature 可能为空串)
  • {"type":"disabled"} 可关闭思考,显著减少 output token
  • ⚠️ type 二元开关有效budget_tokenseffort 等思考预算/等级参数不生效(会被忽略),无法精细控制思考量
tools
object[]

工具定义列表

说明

  • 遵循 Anthropic tool 定义规范
  • input_schema 使用 JSON Schema 对象
  • 模型会返回标准 tool_use block,stop_reason=tool_use
tool_choice
object

工具选择策略

metadata
object

请求元数据

响应

消息对象

Anthropic 风格的消息响应

id
string

消息唯一 ID(格式形如 msg_<uuid>

type
enum<string>

响应对象类型

可用选项:
message
role
enum<string>
可用选项:
assistant
model
string

实际使用的模型

示例:

"glm-5.2"

content
object[]

响应内容块列表

可能包含的 block type

  • thinking:推理过程(思考开启时,默认开启)
  • text:最终回答文本
  • tool_use:模型发起的工具调用
stop_reason
enum<string>

停止原因

  • end_turn:自然结束(⚠️ 命中 stop_sequences 时也返回此值)
  • max_tokens:达到 max_tokens 上限
  • tool_use:模型触发工具调用
可用选项:
end_turn,
max_tokens,
tool_use
usage
object

Token 使用统计(Anthropic 规范)