deepseek-v4-flash / deepseek-v4-prosystem 传入thinking 对象开关;思考内容通过 content[type=thinking] block 返回tool_use / tool_result 流程https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。##所有接口均需要使用 Bearer Token 进行认证##
获取 API Key:
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY备注:虽然 Anthropic 原生 API 使用 x-api-key 头,EvoLink 对 /v1/messages 统一采用 Bearer Token 鉴权。
要调用的模型
deepseek-v4-flash:快速通用deepseek-v4-pro:深度推理提示:两个模型 均默认启用 thinking,响应中始终包含 type="thinking" content block;如需关闭请显式 thinking.type="disabled"。未指定或不支持的 model 会被自动映射到 deepseek-v4-flash。
deepseek-v4-flash, deepseek-v4-pro "deepseek-v4-flash"
要生成的最大 token 数(必填)
说明:
1 <= x <= 3840001024
对话消息列表,按轮次 user / assistant 交替
说明:
role=userimage / document 内容类型1系统提示词,用于设定 AI 角色与行为
说明:
system 消息,Anthropic 端点使用顶层 system 字段"You are a helpful assistant."
采样温度
说明:
[0.0, 2.0]0 <= x <= 21
核采样阈值
说明:
[0, 1]0 <= x <= 11
自定义停止序列
说明:
4是否以 SSE 流式返回
true:Server-Sent Events 流式返回false:完整响应后一次性返回(默认)false
思考模式控制(V4)
说明:
type=enabled)content 数组中会出现 type="thinking" 的推理过程 block(按输出 token 计费)budget_tokens 字段,使用 output_config.effort 控制深度content 数组即可(Anthropic 协议风格更宽松,不会因为缺失 thinking 而报错,但保留 signature 有助于上下文一致性)输出配置(V4 扩展)
说明:Deepseek 仅支持 effort 字段
工具定义列表
说明:
input_schema 使用 JSON Schema 对象控制工具调用行为
可选 type:
auto:模型自动决定(默认,当提供 tools 时)any:必须调用某个工具(不指定哪个)tool:必须调用指定的 namenone:禁止调用工具消息对象
Anthropic 风格的消息响应
消息唯一 ID
响应对象类型
message assistant 实际使用的模型
"deepseek-v4-pro"
响应内容块列表
可能包含的 block type:
thinking:推理过程(仅启用 thinking 时)text:最终回答文本tool_use:模型发起的工具调用停止原因
end_turn:自然结束max_tokens:达到 max_tokens 上限stop_sequence:命中 stop_sequencestool_use:模型触发工具调用end_turn, max_tokens, stop_sequence, tool_use 当 stop_reason=stop_sequence 时命中的具体序列,否则 null
Token 使用统计(Anthropic 规范)