메인 콘텐츠로 건너뛰기
POST
/
v1
/
chat
/
completions
지능형 모델 라우팅
curl --request POST \
  --url https://api.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "evolink/auto",
  "messages": [
    {
      "role": "user",
      "content": "인공지능의 발전 역사를 소개해 주세요"
    }
  ],
  "temperature": 0.7,
  "top_p": 0.9,
  "top_k": 40,
  "stream": false
}
'
{
  "id": "chatcmpl-20260308112637503180122ABCD1234",
  "model": "gpt-5.4",
  "object": "chat.completion",
  "created": 1741428397,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "인공지능의 발전 역사는 1950년대로 거슬러 올라갑니다..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 120,
    "total_tokens": 135
  }
}

기능 소개

EvoLink Auto는 요청 내용에 따라 가장 적합한 AI 모델을 자동으로 선택하는 지능형 모델 라우팅 기능입니다. 수동으로 모델을 지정할 필요가 없습니다.

핵심 장점

  • 스마트 매칭: 요청 내용을 자동 분석하여 가장 적합한 모델 선택
  • 비용 최적화: 품질을 유지하면서 비용 효율적인 모델 우선 선택
  • 부하 분산: 여러 모델 간 요청을 자동 분산하여 시스템 안정성 향상
  • 투명성: 응답에 실제 사용된 모델 이름을 반환하여 추적 및 최적화 용이

사용 시나리오

어떤 모델을 사용할지 불확실하거나 시스템이 자동으로 모델 선택을 최적화하기를 원하는 경우에 적합합니다.
model 매개변수를 evolink/auto로 설정하기만 하면 시스템이 자동으로 가장 적합한 모델을 선택합니다.

인증

Authorization
string
header
필수

모든 API는 Bearer Token 인증이 필요합니다

API Key 받기:

API Key 관리 페이지를 방문하여 API Key를 받으세요

요청 헤더에 추가:

Authorization: Bearer YOUR_API_KEY

본문

application/json
model
enum<string>
기본값:evolink/auto
필수

지능형 라우팅 사용

사용 가능한 옵션:
evolink/auto
예시:

"evolink/auto"

messages
object[]
필수

대화 메시지 목록

Minimum array length: 1
예시:
[
{
"role": "user",
"content": "인공지능의 발전 역사를 소개해 주세요"
}
]
temperature
number

샘플링 온도, 출력의 무작위성을 제어합니다

설명:

  • 낮은 값(예: 0.2): 더 확실하고 집중된 출력
  • 높은 값(예: 1.5): 더 무작위적이고 창의적인 출력
필수 범위: 0 <= x <= 2
예시:

0.7

top_p
number

핵 샘플링(Nucleus Sampling) 매개변수

설명:

  • 누적 확률 상위 몇 %의 토큰에서 샘플링할지 제어합니다
  • 예를 들어 0.9는 누적 확률이 90%에 도달하는 토큰 중에서 선택합니다
  • 기본값: 1.0 (모든 토큰 고려)

권장 사항: temperature와 top_p를 동시에 조정하지 마세요

필수 범위: 0 <= x <= 1
예시:

0.9

top_k
integer

Top-K 샘플링 매개변수

설명:

  • 예를 들어 10은 매 샘플링 시 확률이 가장 높은 10개의 토큰만 고려하도록 제한합니다
  • 값이 작을수록 출력이 더 집중됩니다
  • 기본값은 제한 없음
필수 범위: x >= 1
예시:

40

stream
boolean
기본값:false

스트리밍 방식으로 응답을 반환할지 여부

  • true: 스트리밍 반환, 청크 단위로 실시간 콘텐츠 반환
  • false: 전체 응답을 기다린 후 한 번에 반환
예시:

false

응답

요청 성공

id
string

채팅 완성의 고유 식별자

예시:

"chatcmpl-20260308112637503180122ABCD1234"

model
string

실제 사용된 모델 이름

예시:

"gpt-5.4"

object
enum<string>

응답 유형

사용 가능한 옵션:
chat.completion
예시:

"chat.completion"

created
integer

생성 타임스탬프

예시:

1741428397

choices
object[]

대화에서 생성된 선택 목록

usage
object

토큰 사용 통계