メインコンテンツへスキップ
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://api.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "kimi-k2-thinking",
  "messages": [
    {
      "role": "user",
      "content": "Please introduce yourself"
    }
  ],
  "temperature": 1
}
'
{
  "id": "cmpl-04ea926191a14749b7f2c7a48a68abc6",
  "model": "kimi-k2-thinking",
  "object": "chat.completion",
  "created": 1698999496,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hi there! How can I help you?",
        "reasoning_content": "The user just said \"hi\". This is a very simple greeting. I should be friendly, helpful, and professional in my response..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 8,
    "completion_tokens": 292,
    "total_tokens": 300,
    "prompt_tokens_details": {
      "cached_tokens": 8
    }
  }
}

承認

Authorization
string
header
必須

##すべてのAPIにBearer Token認証が必要です##

APIキーの取得:

APIキー管理ページにアクセスしてAPIキーを取得してください

リクエストヘッダーに追加:

Authorization: Bearer YOUR_API_KEY

ボディ

application/json
model
enum<string>
必須

チャット補完用モデル名

利用可能なオプション:
kimi-k2-thinking,
kimi-k2-thinking-turbo
:

"kimi-k2-thinking"

messages
object[]
必須

会話用メッセージリスト、マルチターン対話とマルチモーダル入力をサポート

Minimum array length: 1
stream
boolean
デフォルト:false

レスポンスをストリーミングするかどうか

  • true: ストリームレスポンス、リアルタイムでチャンク単位にコンテンツを返却
  • false: 完全なレスポンスを待って一括で返却
:

false

max_tokens
integer

レスポンスで生成するトークンの最大数

注意:

  • 値が小さすぎるとレスポンスが途中で切れる可能性があります
  • 最大トークン数に達した場合、finish_reasonは"length"になり、それ以外は"stop"になります
必須範囲: x >= 1
:

2000

temperature
number
デフォルト:1

サンプリング温度、出力のランダム性を制御します

注意:

  • 低い値(例: 0.2): より決定論的で集中した出力
  • 高い値(例: 1.5): よりランダムで創造的な出力
  • kimi-k2-thinkingシリーズの推奨値: 1.0
必須範囲: 0 <= x <= 2
:

1

top_p
number
デフォルト:1

Nucleusサンプリングパラメータ

注意:

  • 累積確率に基づくトークンのサンプリングを制御します
  • 例えば、0.9は累積確率上位90%のトークンからサンプリングすることを意味します
  • デフォルト: 1.0(すべてのトークンを考慮)

推奨: temperatureとtop_pを同時に調整しないでください

必須範囲: 0 <= x <= 1
:

0.9

top_k
integer

Top-Kサンプリングパラメータ

注意:

  • 例えば、10は確率上位10トークンに限定してサンプリングします
  • 値が小さいほど出力がより集中します
  • デフォルト: 制限なし
必須範囲: x >= 1
:

40

n
integer
デフォルト:1

各入力メッセージに対して生成する補完の数

注意:

  • デフォルト: 1、最大: 5
  • temperatureが0に非常に近い場合、結果は1つのみ返されます
必須範囲: 1 <= x <= 5
:

1

presence_penalty
number
デフォルト:0

存在ペナルティ、-2.0から2.0の間の数値

注意:

  • 正の値はテキストに出現するかどうかに基づいて新しいトークンにペナルティを与え、新しいトピックについて議論する可能性を高めます
必須範囲: -2 <= x <= 2
:

0

frequency_penalty
number
デフォルト:0

頻度ペナルティ、-2.0から2.0の間の数値

注意:

  • 正の値はテキスト内での出現頻度に基づいて新しいトークンにペナルティを与え、同じフレーズをそのまま繰り返す可能性を低下させます
必須範囲: -2 <= x <= 2
:

0

response_format
object

レスポンス形式の設定

注意:

  • {"type": "json_object"}に設定するとJSONモードが有効になり、モデルが有効なJSONを生成することが保証されます
  • response_formatで{"type": "json_object"}を使用する場合、プロンプトでモデルにJSON形式の出力を明示的に指示してください
  • デフォルト: {"type": "text"}
  • 警告: partial modeとresponse_format=json_objectを混在させないでください
stop

ストップシーケンス、これらのシーケンスが一致すると生成が停止します

注意:

  • ストップシーケンス自体は出力に含まれません
  • 最大5つの文字列、各文字列は32バイト以下
tools
object[]

Tool UseまたはFunction Calling用のツールリスト

注意:

  • 各ツールにはtypeを含める必要があります
  • function構造にはname、description、parametersを含める必要があります
  • tools配列には最大128個のfunctionを指定可能
Maximum array length: 128

レスポンス

チャット補完成功

id
string

チャット補完の一意の識別子

:

"cmpl-04ea926191a14749b7f2c7a48a68abc6"

model
string

補完に使用されたモデル

:

"kimi-k2-thinking"

object
enum<string>

レスポンスタイプ

利用可能なオプション:
chat.completion
:

"chat.completion"

created
integer

補完が作成されたUnixタイムスタンプ

:

1698999496

choices
object[]

補完選択肢のリスト

usage
object

トークン使用統計