deepseek-v4-flash(高速汎用)と deepseek-v4-pro(深度推論)の 2 つのモデルをサポートthinking.type で深度推論を制御;deepseek-v4-pro の思考内容は reasoning_content で返されますresponse_format で有効化https://direct.evolink.ai で、テキストモデルへの対応が優れており、長時間接続をサポートします。https://api.evolink.ai はマルチモーダルの主力エンドポイントで、テキストモデルに対しては代替アドレスとして使用されます。##すべてのインターフェースは Bearer Token による認証が必要です##
API Key の取得:
API Key 管理ページ にアクセスして API Key を取得してください
使用時はリクエストヘッダに追加:
Authorization: Bearer YOUR_API_KEY会話モデル名
deepseek-v4-flash:高速汎用モデル、1M コンテキストdeepseek-v4-pro:深度推論モデル、数学、プログラミング、複雑なロジックが得意ヒント:両モデルは thinking がデフォルトで有効 であり、レスポンスには reasoning_content が含まれます。thinking.type="disabled" で無効化すると出力 token コストを削減できます。両モデルのパラメータは完全に同一です。
deepseek-v4-flash, deepseek-v4-pro "deepseek-v4-flash"
会話メッセージリスト、マルチターン会話をサポート
役割ごとにメッセージのフィールド構造が異なるため、該当する役割を選択して確認してください
1思考モード制御(V4 新機能)
説明:
type=enabled)choices[].message.reasoning_content で返され、出力 token として課金されます⚠️ マルチターン会話 / ツール呼び出しの注意:本ターンのレスポンスに reasoning_content が含まれている場合、次のリクエストの messages 履歴の該当 assistant メッセージでこのフィールドをそのまま返送する必要があります。さもないと API は 400 The reasoning_content in the thinking mode must be passed back to the API を返します。処理したくない場合は、セッション全体で明示的に thinking.type="disabled" を指定できます。
サンプリング温度、出力のランダム性を制御
説明:
0 <= x <= 21
核サンプリング(Nucleus Sampling)パラメータ
説明:
推奨:temperature と top_p を同時に調整しないでください
0 <= x <= 11
生成するコンテンツの最大 token 数を制限
説明:
1 <= x <= 3840004096
頻度ペナルティパラメータ、繰り返し内容を減らすため
説明:
-2 <= x <= 20
存在ペナルティパラメータ、新しいトピックの生成を促進するため
説明:
-2 <= x <= 20
レスポンスフォーマットを指定
説明:
{"type": "json_object"} に設定すると JSON モードを有効化停止シーケンス、モデルがこれらの文字列に遭遇すると生成を停止
説明:
ストリーミング方式でレスポンスを返すかどうか
true:ストリーミング返却、SSE(Server-Sent Events)を通じてチャンクごとにリアルタイムでコンテンツを返すfalse:完全なレスポンスを待ってから一度に返す(デフォルト)false
ストリーミングレスポンスオプション
stream=true の場合のみ有効
ツール定義リスト、Function Calling に使用
説明:
128ツール呼び出し動作を制御
選択可能な値:
none:いかなるツールも呼び出さないauto:モデルが自動的にツール呼び出しを決定(tools 提供時のデフォルト)required:モデルに 1 つ以上のツールを強制的に呼び出させる{"type":"function","function":{"name":"xxx"}}:特定のツール呼び出しを指定デフォルト値:tools を提供しない場合は none、提供する場合は auto
none, auto, required token の対数確率を返すかどうか
説明:
true に設定すると、レスポンスに各 token の対数確率情報が含まれます確率の最も高い上位 N 個の token の対数確率を返す
説明:
logprobs を true に設定する必要があります[0, 20]0 <= x <= 20Token バイアスマッピング
説明:
各入力メッセージに対して生成するチャット補完オプションの数
説明:
1 <= x <= 81
ランダムシード(Beta)
説明:
エンドユーザーを表す一意の識別子
説明:
会話生成成功
会話補完の一意識別子
"53c548dc-ec02-4a2f-bbb6-eca4184630b8"
実際に使用されたモデル名
"deepseek-v4-flash"
レスポンスタイプ
chat.completion "chat.completion"
作成タイムスタンプ(Unix 秒)
1777021417
会話生成の選択肢リスト
Token 使用統計情報(キャッシュと推論の分項を含む)
システム指紋識別子
"fp_evolink_v4_20260402"