deepseek-v4-flash(빠른 범용)와 deepseek-v4-pro(심층 추론) 두 모델 지원thinking.type으로 심층 추론 제어; deepseek-v4-pro의 사고 내용은 reasoning_content로 반환response_format으로 활성화https://direct.evolink.ai이며, 텍스트 모델 지원이 더 우수하고 장시간 연결을 지원합니다. https://api.evolink.ai는 멀티모달 서비스의 주력 엔드포인트이며, 텍스트 모델에 대해서는 대체 주소로 사용됩니다.##모든 인터페이스는 Bearer Token 인증이 필요합니다##
API Key 받기:
API Key 관리 페이지를 방문하여 API Key를 받으세요
사용 시 요청 헤더에 추가:
Authorization: Bearer YOUR_API_KEY채팅 모델 이름
deepseek-v4-flash: 빠른 범용 모델, 1M 컨텍스트deepseek-v4-pro: 심층 추론 모델, 수학·프로그래밍 및 복잡한 논리에 능숙팁: 두 모델 모두 기본적으로 thinking이 활성화되어 있어 응답에 reasoning_content가 포함됩니다. 출력 token 비용을 낮추려면 thinking.type="disabled"로 끌 수 있습니다. 두 모델의 매개변수는 완전히 동일합니다.
deepseek-v4-flash, deepseek-v4-pro "deepseek-v4-flash"
대화 메시지 목록, 다중 턴 대화 지원
역할마다 메시지 필드 구조가 다르므로 해당 역할을 선택하여 확인하세요
1사고 모드 제어 (V4 신규)
설명:
type=enabled)choices[].message.reasoning_content로 반환되며 출력 token으로 과금됩니다⚠️ 다중 턴 대화/도구 호출 주의사항: 이번 턴의 응답에 reasoning_content가 포함된 경우, 다음 요청의 messages 히스토리 내 해당 assistant 메시지에 이 필드를 그대로 돌려보내야 합니다. 그렇지 않으면 API가 400 The reasoning_content in the thinking mode must be passed back to the API를 반환합니다. 처리하고 싶지 않다면 세션 전체에 thinking.type="disabled"를 명시적으로 설정할 수 있습니다.
샘플링 온도, 출력의 무작위성을 제어합니다
설명:
0 <= x <= 21
Nucleus Sampling (핵 샘플링) 매개변수
설명:
권장: temperature와 top_p를 동시에 조정하지 마세요
0 <= x <= 11
생성 콘텐츠의 최대 token 수 제한
설명:
1 <= x <= 3840004096
빈도 페널티 매개변수, 반복 내용을 줄이는 데 사용
설명:
-2 <= x <= 20
존재 페널티 매개변수, 새로운 주제 생성을 장려하는 데 사용
설명:
-2 <= x <= 20
응답 형식 지정
설명:
{"type": "json_object"}로 설정하면 JSON 모드가 활성화됩니다중지 시퀀스, 모델이 이 문자열을 만나면 생성을 중단합니다
설명:
응답을 스트리밍 방식으로 반환할지 여부
true: 스트리밍 반환, SSE(Server-Sent Events)를 통해 청크 단위로 실시간 반환false: 완전한 응답을 기다린 후 한 번에 반환 (기본값)false
스트리밍 응답 옵션
stream=true일 때만 유효합니다
도구 정의 목록, Function Calling에 사용
설명:
128도구 호출 동작 제어
가능한 값:
none: 어떤 도구도 호출하지 않음auto: 모델이 도구 호출 여부를 자동 결정 (tools 제공 시 기본값)required: 모델이 하나 이상의 도구를 반드시 호출하도록 강제{"type":"function","function":{"name":"xxx"}}: 특정 도구를 지정하여 호출기본값: tools 미제공 시 none, tools 제공 시 auto
none, auto, required token의 로그 확률을 반환할지 여부
설명:
true로 설정하면 응답에 각 token의 로그 확률 정보가 포함됩니다확률 상위 N개 token의 로그 확률 반환
설명:
logprobs가 true로 설정되어야 합니다[0, 20]0 <= x <= 20Token 바이어스 매핑
설명:
각 입력 메시지에 대해 생성할 채팅 완성 옵션 수
설명:
1 <= x <= 81
랜덤 시드 (Beta)
설명:
최종 사용자를 나타내는 고유 식별자
설명:
채팅 생성 성공
채팅 완성의 고유 식별자
"53c548dc-ec02-4a2f-bbb6-eca4184630b8"
실제 사용된 모델 이름
"deepseek-v4-flash"
응답 유형
chat.completion "chat.completion"
생성 타임스탬프 (Unix 초)
1777021417
채팅 생성의 선택 목록
Token 사용 통계 정보 (캐시 및 추론 세부 항목 포함)
시스템 지문 식별자
"fp_evolink_v4_20260402"