MiniMax-M3 - OpenAI 호환 API
- OpenAI Chat Completions 프로토콜을 사용하여 MiniMax-M3 모델을 호출합니다
- 멀티턴 대화: 단일 턴 또는 멀티턴 컨텍스트 대화 지원
- 시스템 프롬프트:
role=system메시지로 AI의 역할과 동작을 사용자 정의 - 멀티모달 입력:
content는 텍스트 + 이미지 / 비디오 혼합을 지원 - 사고 모드:
thinking.type으로 제어하며, 사고 내용은reasoning_content를 통해 반환 - 스트리밍 출력: SSE 스트리밍 응답 지원
- 도구 호출: Function Calling 지원
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://direct.evolink.ai이며, 텍스트 모델과 장시간 연결을 더 잘 지원합니다. https://api.evolink.ai는 멀티모달 서비스의 기본 엔드포인트이자 텍스트 모델의 대체 주소 역할을 합니다.인증
##모든 인터페이스는 Bearer Token 인증이 필요합니다##
API Key 발급:
API Key 관리 페이지에 방문하여 API Key를 발급받으세요
요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY본문
대화 모델 이름
MiniMax-M3 "MiniMax-M3"
대화 메시지 목록, 멀티턴 대화 지원
역할마다 메시지의 필드 구조가 다르므로 해당 역할을 선택하여 확인하세요
1- System Message
- User Message
- Assistant Message
- Tool Message
심층 사고 제어
설명:
- 기본값
adaptive: 모델이 문제 난이도에 따라 심층 사고 여부를 자율적으로 결정합니다 - 기본적으로 사고 내용은 응답
content에 인라인됩니다(<think>...</think>로 감쌈); 독립된 필드로 분리하려면reasoning_split을 함께 사용하세요
사고 내용을 독립된 필드로 분리할지 여부
false(기본값): 사고 내용이content에 인라인되며<think>...</think>로 감쌉니다true: 사고 내용이choices[].message.reasoning_content와reasoning_details로 분리됩니다
샘플링 온도, 출력의 무작위성을 제어
설명:
- 낮은 값(예: 0.2): 더 확정적이고 집중된 출력
- 높은 값(예: 1.5): 더 무작위하고 창의적인 출력
- 범위
[0, 2], 기본값 1
0 <= x <= 21
핵 샘플링(Nucleus Sampling) 파라미터
설명:
- 누적 확률 상위 토큰에서 샘플링하는 범위를 제어
- 예를 들어 0.95는 누적 확률이 95%에 도달하는 토큰에서 선택함을 의미
- 범위
[0, 1], MiniMax-M3 기본값 0.95
권장 사항: temperature와 top_p를 동시에 조정하지 마세요
0 <= x <= 10.95
생성 내용 길이의 상한 지정(Token 수)
설명:
- MiniMax-M3 권장 131,072(128K), 상한 524,288(512K)
- 사고로 생성된 token도 이 상한에 포함됩니다
- 생성이
length사유로 중단되면 이 값을 높여 보세요
1 <= x <= 524288131072
응답을 스트리밍 방식으로 반환할지 여부
true: 스트리밍 반환, SSE(Server-Sent Events)를 통해 내용을 청크 단위로 실시간 반환false: 완전한 응답을 기다린 후 한 번에 반환(기본값)
false
스트리밍 응답 옵션
stream=true일 때만 유효합니다
Function Calling을 위한 도구 정의 목록
각 도구는 이름, 설명, 파라미터 schema를 정의해야 합니다
구버전 생성 길이 제한 파라미터
설명: 더 이상 사용되지 않으므로 max_completion_tokens를 사용하세요
x >= 1응답
대화 생성 성공
대화 완료의 고유 식별자
"0668a381bdc3c0ded310e27c9a46d16e7"
실제 사용된 모델 이름
"MiniMax-M3"
응답 유형
chat.completion "chat.completion"
생성 타임스탬프(Unix 초)
1777026807
대화 생성 선택 목록
Token 사용 통계 정보
입력 내용이 민감어 필터에 걸렸는지 여부. 입력이 심각하게 위반될 경우 인터페이스는 콘텐츠 위반 오류를 반환하며 응답 내용은 비어 있습니다
입력이 걸린 민감어 유형(input_sensitive가 true일 때 반환): 1 심각한 위반; 2 음란; 3 광고; 4 금지; 5 욕설; 6 폭력·테러; 7 기타
출력 내용이 민감어 필터에 걸렸는지 여부
출력이 걸린 민감어 유형
상태 코드 및 오류 상세