메인 콘텐츠로 건너뛰기
POST
/
v1
/
messages
curl --request POST \
  --url https://direct.evolink.ai/v1/messages \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "MiniMax-M3",
  "max_tokens": 1024,
  "messages": [
    {
      "role": "user",
      "content": "안녕하세요, 세계"
    }
  ]
}
'
{
  "id": "066a381bdc3c0ded310e27c9a46d16e7",
  "type": "message",
  "role": "assistant",
  "model": "MiniMax-M3",
  "content": [
    {
      "type": "thinking",
      "thinking": "사용자가 묻는 것은 일본의 수도로, 이는 기초 지리 지식 질문입니다. 답은 도쿄이므로 바로 제시하면 됩니다.",
      "signature": "066a381bdc3c0ded310e27c9a46d16e7"
    },
    {
      "type": "text",
      "text": "일본의 수도는 **도쿄**입니다."
    }
  ],
  "stop_reason": "end_turn",
  "usage": {
    "input_tokens": 7,
    "output_tokens": 77,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0
  }
}

Documentation Index

Fetch the complete documentation index at: https://docs.evolink.ai/llms.txt

Use this file to discover all available pages before exploring further.

BaseURL: 기본 BaseURL은 https://direct.evolink.ai이며, 텍스트 모델과 장시간 연결을 더 잘 지원합니다. https://api.evolink.ai는 멀티모달 서비스의 기본 엔드포인트이자 텍스트 모델의 대체 주소 역할을 합니다.

인증

Authorization
string
header
필수

##모든 인터페이스는 Bearer Token 인증이 필요합니다##

API Key 발급:

API Key 관리 페이지에 방문하여 API Key를 발급받으세요

요청 헤더에 추가:

Authorization: Bearer YOUR_API_KEY

참고: EvoLink는 /v1/messages에 대해 Bearer Token 인증을 통일적으로 사용합니다.

본문

application/json
model
enum<string>
필수

호출할 모델

사용 가능한 옵션:
MiniMax-M3
예시:

"MiniMax-M3"

messages
object[]
필수

대화 메시지 목록, 턴마다 user / assistant 교대

설명:

  • 최소 1개의 메시지를 포함해야 함
  • 마지막 메시지는 일반적으로 role=user
Minimum array length: 1
max_tokens
integer

생성 내용 길이의 상한 지정(Token 수)

설명:

  • MiniMax-M3 권장 131,072(128K), 상한 524,288(512K)
  • thinking으로 생성된 token도 이 상한에 포함됩니다
  • 상한을 초과하는 내용은 잘립니다; 생성이 length 사유로 중단되면 이 값을 높여 보세요
필수 범위: 1 <= x <= 524288
예시:

1024

system

시스템 프롬프트, AI 역할과 동작을 설정하는 데 사용

설명:

  • 문자열 또는 문자열 배열 지원
  • 최상위 system 필드로 전달
예시:

"You are a helpful assistant."

temperature
number
기본값:1

샘플링 온도

설명:

  • 범위 [0, 2]
  • 기본값 1; 값이 높을수록 발산적이고, 낮을수록 확정적
필수 범위: 0 <= x <= 2
예시:

1

top_p
number
기본값:0.95

핵 샘플링 임계값

설명:

  • 범위 [0, 1], MiniMax-M3 기본값 0.95
  • temperature와 top_p를 동시에 조정하지 않는 것을 권장
필수 범위: 0 <= x <= 1
예시:

0.95

stream
boolean
기본값:false

SSE 스트리밍으로 반환할지 여부

  • true: Server-Sent Events 스트리밍 반환
  • false: 완전한 응답 후 한 번에 반환(기본값)
예시:

false

thinking
object

심층 사고 제어. thinking을 활성화한 후에는 멀티턴 대화에서 thinking 블록을 원본 그대로 되돌려 보내야 합니다

설명:

  • 기본값 adaptive: 모델이 문제 난이도에 따라 심층 사고 여부를 자율적으로 결정
  • 활성화 시 응답 content 배열에 type="thinking"의 추론 과정 block이 나타납니다(출력 token으로 계산)
tools
object[]

도구 정의 목록

설명:

  • Anthropic tool 정의 규범을 따름
  • input_schema는 JSON Schema 객체를 사용
tool_choice
object

도구 선택 전략. auto와 none만 지원

metadata
object

요청 메타데이터

응답

메시지 객체

Anthropic 스타일의 메시지 응답

id
string

메시지 고유 ID

type
enum<string>

응답 객체 유형

사용 가능한 옵션:
message
role
enum<string>
사용 가능한 옵션:
assistant
model
string

실제 사용된 모델

예시:

"MiniMax-M3"

content
object[]

응답 콘텐츠 블록 목록

포함될 수 있는 block type:

  • thinking: 추론 과정(thinking이 적용될 때만)
  • text: 최종 답변 텍스트
  • tool_use: 모델이 시작한 도구 호출
stop_reason
enum<string>

정지 사유

  • end_turn: 자연스러운 종료
  • max_tokens: max_tokens 상한 도달
  • tool_use: 모델이 도구 호출을 트리거
사용 가능한 옵션:
end_turn,
max_tokens,
tool_use
usage
object

Token 사용 통계(Anthropic 규범)