메인 콘텐츠로 건너뛰기
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "messages": [
    {
      "role": "user",
      "content": "자기소개를 해 주세요"
    }
  ]
}
'
{
  "id": "066b36619b147e326d17053cccdef70f",
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "<think>\n사용자가 묻는 것은 프랑스의 수도로, 이는 상식적인 질문이므로 바로 답인 파리를 제시하면 됩니다.\n</think>\n프랑스의 수도는 **파리**입니다.",
        "role": "assistant",
        "name": "MiniMax AI",
        "audio_content": ""
      }
    }
  ],
  "created": 1777026807,
  "model": "MiniMax-M3",
  "object": "chat.completion",
  "usage": {
    "total_tokens": 60,
    "total_characters": 0,
    "prompt_tokens": 7,
    "completion_tokens": 53,
    "prompt_tokens_details": {
      "cached_tokens": 0
    }
  },
  "input_sensitive": false,
  "output_sensitive": false,
  "input_sensitive_type": 0,
  "output_sensitive_type": 0,
  "base_resp": {
    "status_code": 0,
    "status_msg": ""
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL: 기본 BaseURL은 https://direct.evolink.ai이며, 텍스트 모델과 장시간 연결을 더 잘 지원합니다. https://api.evolink.ai는 멀티모달 서비스의 기본 엔드포인트이자 텍스트 모델의 대체 주소 역할을 합니다.

인증

Authorization
string
header
필수

##모든 인터페이스는 Bearer Token 인증이 필요합니다##

API Key 발급:

API Key 관리 페이지에 방문하여 API Key를 발급받으세요

요청 헤더에 추가:

Authorization: Bearer YOUR_API_KEY

본문

application/json
model
enum<string>
필수

대화 모델 이름

사용 가능한 옵션:
MiniMax-M3
예시:

"MiniMax-M3"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
필수

대화 메시지 목록, 멀티턴 대화 지원

역할마다 메시지의 필드 구조가 다르므로 해당 역할을 선택하여 확인하세요

Minimum array length: 1
thinking
object

심층 사고 제어

설명:

  • 기본값 adaptive: 모델이 문제 난이도에 따라 심층 사고 여부를 자율적으로 결정합니다
  • 기본적으로 사고 내용은 응답 content에 인라인됩니다(<think>...</think>로 감쌈); 독립된 필드로 분리하려면 reasoning_split을 함께 사용하세요
reasoning_split
boolean

사고 내용을 독립된 필드로 분리할지 여부

  • false(기본값): 사고 내용이 content에 인라인되며 <think>...</think>로 감쌉니다
  • true: 사고 내용이 choices[].message.reasoning_contentreasoning_details로 분리됩니다
temperature
number
기본값:1

샘플링 온도, 출력의 무작위성을 제어

설명:

  • 낮은 값(예: 0.2): 더 확정적이고 집중된 출력
  • 높은 값(예: 1.5): 더 무작위하고 창의적인 출력
  • 범위 [0, 2], 기본값 1
필수 범위: 0 <= x <= 2
예시:

1

top_p
number
기본값:0.95

핵 샘플링(Nucleus Sampling) 파라미터

설명:

  • 누적 확률 상위 토큰에서 샘플링하는 범위를 제어
  • 예를 들어 0.95는 누적 확률이 95%에 도달하는 토큰에서 선택함을 의미
  • 범위 [0, 1], MiniMax-M3 기본값 0.95

권장 사항: temperature와 top_p를 동시에 조정하지 마세요

필수 범위: 0 <= x <= 1
예시:

0.95

max_completion_tokens
integer

생성 내용 길이의 상한 지정(Token 수)

설명:

  • MiniMax-M3 권장 131,072(128K), 상한 524,288(512K)
  • 사고로 생성된 token도 이 상한에 포함됩니다
  • 생성이 length 사유로 중단되면 이 값을 높여 보세요
필수 범위: 1 <= x <= 524288
예시:

131072

stream
boolean
기본값:false

응답을 스트리밍 방식으로 반환할지 여부

  • true: 스트리밍 반환, SSE(Server-Sent Events)를 통해 내용을 청크 단위로 실시간 반환
  • false: 완전한 응답을 기다린 후 한 번에 반환(기본값)
예시:

false

stream_options
object

스트리밍 응답 옵션

stream=true일 때만 유효합니다

tools
object[]

Function Calling을 위한 도구 정의 목록

각 도구는 이름, 설명, 파라미터 schema를 정의해야 합니다

max_tokens
integer
지원 중단

구버전 생성 길이 제한 파라미터

설명: 더 이상 사용되지 않으므로 max_completion_tokens를 사용하세요

필수 범위: x >= 1

응답

대화 생성 성공

id
string

대화 완료의 고유 식별자

예시:

"0668a381bdc3c0ded310e27c9a46d16e7"

model
string

실제 사용된 모델 이름

예시:

"MiniMax-M3"

object
enum<string>

응답 유형

사용 가능한 옵션:
chat.completion
예시:

"chat.completion"

created
integer

생성 타임스탬프(Unix 초)

예시:

1777026807

choices
object[]

대화 생성 선택 목록

usage
object

Token 사용 통계 정보

input_sensitive
boolean

입력 내용이 민감어 필터에 걸렸는지 여부. 입력이 심각하게 위반될 경우 인터페이스는 콘텐츠 위반 오류를 반환하며 응답 내용은 비어 있습니다

input_sensitive_type
integer

입력이 걸린 민감어 유형(input_sensitive가 true일 때 반환): 1 심각한 위반; 2 음란; 3 광고; 4 금지; 5 욕설; 6 폭력·테러; 7 기타

output_sensitive
boolean

출력 내용이 민감어 필터에 걸렸는지 여부

output_sensitive_type
integer

출력이 걸린 민감어 유형

base_resp
object

상태 코드 및 오류 상세