跳转到主要内容
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "请介绍一下你自己"
    }
  ]
}
'
{
  "id": "066b36619b147e326d17053cccdef70f",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "<think>\n用户问的是法国首都,这是常识性问题,直接给出答案巴黎即可。\n</think>\n法国的首都是**巴黎**。",
        "role": "assistant",
        "name": "MiniMax AI",
        "audio_content": ""
      }
    }
  ],
  "created": 1777026807,
  "model": "MiniMax-M3",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 60,
    "total_characters": 0,
    "prompt_tokens": 7,
    "completion_tokens": 53,
    "prompt_tokens_details": {
      "cached_tokens": 0
    }
  },
  "input_sensitive": false,
  "output_sensitive": false,
  "input_sensitive_type": 0,
  "output_sensitive_type": 0,
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL 说明:默认 BaseURL 为 https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。

授权

Authorization
string
header
必填

##所有接口均需要使用 Bearer Token 进行认证##

获取 API Key

访问 API Key 管理页面 获取您的 API Key

使用时在请求头中添加

Authorization: Bearer YOUR_API_KEY

请求体

application/json
model
enum<string>
必填

对话模型名称

可用选项:
MiniMax-M3
示例:

"MiniMax-M3"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
必填

对话消息列表,支持多轮对话

不同角色的消息具有不同的字段结构,请选择对应角色查看

Minimum array length: 1
thinking
object

控制深度思考

说明

  • 默认 adaptive:模型根据问题难度自适应决定是否进行深度思考
  • 默认情况下思考内容会内联在回复 content 中(以 <think>...</think> 包裹);如需拆分到独立字段,请配合 reasoning_split
reasoning_split
boolean

是否将思考内容拆分到独立字段

  • false(默认):思考内容内联在 content 中,以 <think>...</think> 包裹
  • true:思考内容拆分到 choices[].message.reasoning_contentreasoning_details
temperature
number
默认值:1

采样温度,控制输出的随机性

说明

  • 较低值(如 0.2):更确定、更聚焦的输出
  • 较高值(如 1.5):更随机、更有创意的输出
  • 取值范围 [0, 2],默认 1
必填范围: 0 <= x <= 2
示例:

1

top_p
number
默认值:0.95

核采样(Nucleus Sampling)参数

说明

  • 控制从累积概率前多少的 token 中采样
  • 例如 0.95 表示从累积概率达到 95% 的 token 中选择
  • 取值范围 [0, 1],MiniMax-M3 默认 0.95

建议:不要同时调整 temperature 和 top_p

必填范围: 0 <= x <= 1
示例:

0.95

max_completion_tokens
integer

指定生成内容长度的上限(Token 数)

说明

  • MiniMax-M3 推荐 131,072(128K),上限 524,288(512K)
  • 思考产生的 token 也计入该上限
  • 如果生成因 length 原因中断,请尝试调高此值
必填范围: 1 <= x <= 524288
示例:

131072

stream
boolean
默认值:false

是否以流式方式返回响应

  • true:流式返回,通过 SSE(Server-Sent Events)逐块实时返回内容
  • false:等待完整响应后一次性返回(默认)
示例:

false

stream_options
object

流式响应选项

仅在 stream=true 时有效

tools
object[]

工具定义列表,用于 Function Calling

每个工具需要定义名称、描述和参数 schema

max_tokens
integer
已弃用

旧版生成长度限制参数

说明:已弃用,请改用 max_completion_tokens

必填范围: x >= 1

响应

对话生成成功

id
string

对话完成的唯一标识符

示例:

"0668a381bdc3c0ded310e27c9a46d16e7"

model
string

实际使用的模型名称

示例:

"MiniMax-M3"

object
enum<string>

响应类型

可用选项:
chat.completion
示例:

"chat.completion"

created
integer

创建时间戳(Unix 秒)

示例:

1777026807

choices
object[]

对话生成的选择列表

usage
object

Token 使用统计信息

input_sensitive
boolean

输入内容是否命中敏感词。若输入严重违规,接口会返回内容违规错误,回复内容为空

input_sensitive_type
integer

输入命中敏感词类型(input_sensitive 为 true 时返回):1 严重违规;2 色情;3 广告;4 违禁;5 谩骂;6 暴恐;7 其他

output_sensitive
boolean

输出内容是否命中敏感词

output_sensitive_type
integer

输出命中敏感词类型

base_resp
object

状态码和错误详情