MiniMax-M3 - OpenAI 兼容接口
- 使用 OpenAI Chat Completions 协议调用 MiniMax-M3 模型
- 多轮对话:支持单轮或多轮上下文对话
- 系统提示词:通过
role=system消息自定义 AI 的角色和行为 - 多模态输入:
content支持文本 + 图像 / 视频混排 - 思考模式:通过
thinking.type控制;思考内容通过reasoning_content返回 - 流式输出:支持 SSE 流式返回
- 工具调用:支持 Function Calling
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://direct.evolink.ai,对文本模型支持更好,支持长连接;https://api.evolink.ai 是多模态主力地址,对文本模型作为备用地址使用。授权
##所有接口均需要使用 Bearer Token 进行认证##
获取 API Key:
访问 API Key 管理页面 获取您的 API Key
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY请求体
对话模型名称
MiniMax-M3 "MiniMax-M3"
对话消息列表,支持多轮对话
不同角色的消息具有不同的字段结构,请选择对应角色查看
1- System Message
- User Message
- Assistant Message
- Tool Message
控制深度思考
说明:
- 默认
adaptive:模型根据问题难度自适应决定是否进行深度思考 - 默认情况下思考内容会内联在回复
content中(以<think>...</think>包裹);如需拆分到独立字段,请配合reasoning_split
是否将思考内容拆分到独立字段
false(默认):思考内容内联在content中,以<think>...</think>包裹true:思考内容拆分到choices[].message.reasoning_content与reasoning_details
采样温度,控制输出的随机性
说明:
- 较低值(如 0.2):更确定、更聚焦的输出
- 较高值(如 1.5):更随机、更有创意的输出
- 取值范围
[0, 2],默认 1
0 <= x <= 21
核采样(Nucleus Sampling)参数
说明:
- 控制从累积概率前多少的 token 中采样
- 例如 0.95 表示从累积概率达到 95% 的 token 中选择
- 取值范围
[0, 1],MiniMax-M3 默认 0.95
建议:不要同时调整 temperature 和 top_p
0 <= x <= 10.95
指定生成内容长度的上限(Token 数)
说明:
- MiniMax-M3 推荐 131,072(128K),上限 524,288(512K)
- 思考产生的 token 也计入该上限
- 如果生成因
length原因中断,请尝试调高此值
1 <= x <= 524288131072
是否以流式方式返回响应
true:流式返回,通过 SSE(Server-Sent Events)逐块实时返回内容false:等待完整响应后一次性返回(默认)
false
流式响应选项
仅在 stream=true 时有效
工具定义列表,用于 Function Calling
每个工具需要定义名称、描述和参数 schema
旧版生成长度限制参数
说明:已弃用,请改用 max_completion_tokens
x >= 1响应
对话生成成功
对话完成的唯一标识符
"0668a381bdc3c0ded310e27c9a46d16e7"
实际使用的模型名称
"MiniMax-M3"
响应类型
chat.completion "chat.completion"
创建时间戳(Unix 秒)
1777026807
对话生成的选择列表
Token 使用统计信息
输入内容是否命中敏感词。若输入严重违规,接口会返回内容违规错误,回复内容为空
输入命中敏感词类型(input_sensitive 为 true 时返回):1 严重违规;2 色情;3 广告;4 违禁;5 谩骂;6 暴恐;7 其他
输出内容是否命中敏感词
输出命中敏感词类型
状态码和错误详情