Messages API
MiniMax-M3 - Anthropic 호환 API
- Anthropic Messages 프로토콜을 사용하여 MiniMax-M3 모델을 호출합니다
- 요청 / 응답 구조가 Anthropic API와 정렬됨
- 멀티모달 대화:
content는 텍스트와 이미지 콘텐츠 블록을 지원 - 시스템 프롬프트: 최상위
system필드를 통해 전달 - 사고 모드:
thinking객체로 제어; 사고 내용은content[type=thinking]block을 통해 반환 - 스트리밍 출력: SSE 이벤트 스트림
- 도구 호출: Anthropic
tool_use/tool_result흐름과 호환
POST
Documentation Index
Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt
Use this file to discover all available pages before exploring further.
BaseURL: 기본 BaseURL은
https://direct.evolink.ai이며, 텍스트 모델과 장시간 연결을 더 잘 지원합니다. https://api.evolink.ai는 멀티모달 서비스의 기본 엔드포인트이자 텍스트 모델의 대체 주소 역할을 합니다.인증
##모든 인터페이스는 Bearer Token 인증이 필요합니다##
API Key 발급:
API Key 관리 페이지에 방문하여 API Key를 발급받으세요
요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY참고: EvoLink는 /v1/messages에 대해 Bearer Token 인증을 통일적으로 사용합니다.
본문
application/json
호출할 모델
사용 가능한 옵션:
MiniMax-M3 예시:
"MiniMax-M3"
대화 메시지 목록, 턴마다 user / assistant 교대
설명:
- 최소 1개의 메시지를 포함해야 함
- 마지막 메시지는 일반적으로
role=user
Minimum array length:
1생성 내용 길이의 상한 지정(Token 수)
설명:
- MiniMax-M3 권장 131,072(128K), 상한 524,288(512K)
- thinking으로 생성된 token도 이 상한에 포함됩니다
- 상한을 초과하는 내용은 잘립니다; 생성이
length사유로 중단되면 이 값을 높여 보세요
필수 범위:
1 <= x <= 524288예시:
1024
시스템 프롬프트, AI 역할과 동작을 설정하는 데 사용
설명:
- 문자열 또는 문자열 배열 지원
- 최상위
system필드로 전달
예시:
"You are a helpful assistant."
샘플링 온도
설명:
- 범위
[0, 2] - 기본값 1; 값이 높을수록 발산적이고, 낮을수록 확정적
필수 범위:
0 <= x <= 2예시:
1
핵 샘플링 임계값
설명:
- 범위
[0, 1], MiniMax-M3 기본값 0.95 - temperature와 top_p를 동시에 조정하지 않는 것을 권장
필수 범위:
0 <= x <= 1예시:
0.95
SSE 스트리밍으로 반환할지 여부
true: Server-Sent Events 스트리밍 반환false: 완전한 응답 후 한 번에 반환(기본값)
예시:
false
심층 사고 제어. thinking을 활성화한 후에는 멀티턴 대화에서 thinking 블록을 원본 그대로 되돌려 보내야 합니다
설명:
- 기본값
adaptive: 모델이 문제 난이도에 따라 심층 사고 여부를 자율적으로 결정 - 활성화 시 응답
content배열에type="thinking"의 추론 과정 block이 나타납니다(출력 token으로 계산)
도구 정의 목록
설명:
- Anthropic tool 정의 규범을 따름
input_schema는 JSON Schema 객체를 사용
도구 선택 전략. auto와 none만 지원
요청 메타데이터
응답
메시지 객체
Anthropic 스타일의 메시지 응답
메시지 고유 ID
응답 객체 유형
사용 가능한 옵션:
message 사용 가능한 옵션:
assistant 실제 사용된 모델
예시:
"MiniMax-M3"
응답 콘텐츠 블록 목록
포함될 수 있는 block type:
thinking: 추론 과정(thinking이 적용될 때만)text: 최종 답변 텍스트tool_use: 모델이 시작한 도구 호출
정지 사유
end_turn: 자연스러운 종료max_tokens: max_tokens 상한 도달tool_use: 모델이 도구 호출을 트리거
사용 가능한 옵션:
end_turn, max_tokens, tool_use Token 사용 통계(Anthropic 규범)