curl --request POST \
  --url https://api.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "kimi-k2-thinking",
  "messages": [
    {
      "role": "user",
      "content": "Please introduce yourself"
    }
  ],
  "temperature": 1
}
'

{
  "id": "cmpl-04ea926191a14749b7f2c7a48a68abc6",
  "model": "kimi-k2-thinking",
  "object": "chat.completion",
  "created": 1698999496,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hi there! How can I help you?",
        "reasoning_content": "The user just said \"hi\". This is a very simple greeting. I should be friendly, helpful, and professional in my response..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 8,
    "completion_tokens": 292,
    "total_tokens": 300,
    "prompt_tokens_details": {
      "cached_tokens": 8
    }
  }
}

Kimi-K2

Kimi K2 - 完全なAPIリファレンス

OpenAI SDK形式でKimi-K2モデルを呼び出し
同期処理モード、リアルタイムレスポンス
テキスト会話: シングルまたはマルチターンのコンテキスト対話、simple_textおよびmulti_turnの例を参照
システムプロンプト: AIの役割と動作をカスタマイズ、system_promptの例を参照
マルチモーダル入力: テキスト+画像の混合入力をサポート、visionの例を参照
ツール呼び出し: Function Callingをサポート、tool_useの例を参照
Partial Mode: プリフィルモードをサポート、partial_modeの例を参照

POST

chat

completions

curl --request POST \
  --url https://api.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "kimi-k2-thinking",
  "messages": [
    {
      "role": "user",
      "content": "Please introduce yourself"
    }
  ],
  "temperature": 1
}
'

{
  "id": "cmpl-04ea926191a14749b7f2c7a48a68abc6",
  "model": "kimi-k2-thinking",
  "object": "chat.completion",
  "created": 1698999496,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hi there! How can I help you?",
        "reasoning_content": "The user just said \"hi\". This is a very simple greeting. I should be friendly, helpful, and professional in my response..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 8,
    "completion_tokens": 292,
    "total_tokens": 300,
    "prompt_tokens_details": {
      "cached_tokens": 8
    }
  }
}

承認

Authorization

string

header

必須

##すべてのAPIにBearer Token認証が必要です##

APIキーの取得：

APIキー管理ページにアクセスしてAPIキーを取得してください

リクエストヘッダーに追加：

Authorization: Bearer YOUR_API_KEY

ボディ

application/json

model

enum<string>

必須

チャット補完用モデル名

利用可能なオプション:

kimi-k2-thinking,

kimi-k2-thinking-turbo

例:

"kimi-k2-thinking"

messages

object[]

必須

会話用メッセージリスト、マルチターン対話とマルチモーダル入力をサポート

Minimum array length: 1

表示子属性

stream

boolean

デフォルト:false

レスポンスをストリーミングするかどうか

true: ストリームレスポンス、リアルタイムでチャンク単位にコンテンツを返却
false: 完全なレスポンスを待って一括で返却

例:

false

max_tokens

integer

レスポンスで生成するトークンの最大数

注意:

値が小さすぎるとレスポンスが途中で切れる可能性があります
最大トークン数に達した場合、finish_reasonは"length"になり、それ以外は"stop"になります

必須範囲: x >= 1

例:

2000

temperature

number

デフォルト:1

サンプリング温度、出力のランダム性を制御します

注意:

低い値（例: 0.2）: より決定論的で集中した出力
高い値（例: 1.5）: よりランダムで創造的な出力
kimi-k2-thinkingシリーズの推奨値: 1.0

必須範囲: 0 <= x <= 2

例:

1

top_p

number

デフォルト:1

Nucleusサンプリングパラメータ

注意:

累積確率に基づくトークンのサンプリングを制御します
例えば、0.9は累積確率上位90%のトークンからサンプリングすることを意味します
デフォルト: 1.0（すべてのトークンを考慮）

推奨: temperatureとtop_pを同時に調整しないでください

必須範囲: 0 <= x <= 1

例:

0.9

top_k

integer

Top-Kサンプリングパラメータ

注意:

例えば、10は確率上位10トークンに限定してサンプリングします
値が小さいほど出力がより集中します
デフォルト: 制限なし

必須範囲: x >= 1

例:

40

integer

デフォルト:1

各入力メッセージに対して生成する補完の数

注意:

デフォルト: 1、最大: 5
temperatureが0に非常に近い場合、結果は1つのみ返されます

必須範囲: 1 <= x <= 5

例:

1

presence_penalty

number

デフォルト:0

存在ペナルティ、-2.0から2.0の間の数値

注意:

正の値はテキストに出現するかどうかに基づいて新しいトークンにペナルティを与え、新しいトピックについて議論する可能性を高めます

必須範囲: -2 <= x <= 2

例:

0

frequency_penalty

number

デフォルト:0

頻度ペナルティ、-2.0から2.0の間の数値

注意:

正の値はテキスト内での出現頻度に基づいて新しいトークンにペナルティを与え、同じフレーズをそのまま繰り返す可能性を低下させます

必須範囲: -2 <= x <= 2

例:

0

response_format

object

レスポンス形式の設定

注意:

{"type": "json_object"}に設定するとJSONモードが有効になり、モデルが有効なJSONを生成することが保証されます
response_formatで{"type": "json_object"}を使用する場合、プロンプトでモデルにJSON形式の出力を明示的に指示してください
デフォルト: {"type": "text"}
警告: partial modeとresponse_format=json_objectを混在させないでください

表示子属性

stop

ストップシーケンス、これらのシーケンスが一致すると生成が停止します

注意:

ストップシーケンス自体は出力に含まれません
最大5つの文字列、各文字列は32バイト以下

tools

object[]

Tool UseまたはFunction Calling用のツールリスト

注意:

各ツールにはtypeを含める必要があります
function構造にはname、description、parametersを含める必要があります
tools配列には最大128個のfunctionを指定可能

Maximum array length: 128

表示子属性

レスポンス

チャット補完成功

string

チャット補完の一意の識別子

例:

"cmpl-04ea926191a14749b7f2c7a48a68abc6"

model

string

補完に使用されたモデル

例:

"kimi-k2-thinking"

object

enum<string>

レスポンスタイプ

利用可能なオプション:

chat.completion

例:

"chat.completion"

created

integer

補完が作成されたUnixタイムスタンプ

例:

1698999496

choices

object[]

補完選択肢のリスト

表示子属性

usage

object

トークン使用統計

表示子属性

DeepSeek - 完全なAPIリファレンスクレジット使用量の取得

画像シリーズ

動画シリーズ

オーディオシリーズ

テキストシリーズ

アカウント管理

タスク管理

ファイル管理

Kimi K2 - 完全なAPIリファレンス

承認

ボディ

レスポンス