メインコンテンツへスキップ
POST
/
v1
/
chat
/
completions
curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "自己紹介してください"
    }
  ]
}
'
{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "こんにちは!私は GLM-5.2 です。対話、推論、執筆、コーディングなど、さまざまなタスクをお手伝いできます。",
        "reasoning_content": "まずこの問題を分析してみましょう...",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}
BaseURL:デフォルトの BaseURL は https://direct.evolink.ai で、テキストモデルへの対応が優れており、長時間接続をサポートします。https://api.evolink.ai はマルチモーダルサービスの主力エンドポイントで、テキストモデルに対しては代替アドレスとして使用されます。

承認

Authorization
string
header
必須

##すべての API は Bearer Token 認証が必要です##

API キーの取得:

API キー管理ページにアクセスして API キーを取得してください

リクエストヘッダーに追加:

Authorization: Bearer YOUR_API_KEY

ボディ

application/json
model
enum<string>
デフォルト:glm-5.2
必須

呼び出すモデルコード

  • glm-5.2:最新のフラッグシップモデルで、複雑な推論、超長文コンテキスト、極めて高速な推論速度を提供します
利用可能なオプション:
glm-5.2
:

"glm-5.2"

messages
(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]
必須

対話メッセージのリスト。現在の対話の完全な文脈情報を含みます

systemuserassistanttool の 4 種類の役割に対応します。役割が異なるメッセージは異なるフィールド構造を持つため、対応する役割を選択して確認してください。少なくとも 1 件のメッセージを含む必要があり、システムメッセージまたはアシスタントメッセージのみで構成することはできません。

Minimum array length: 1
stream
boolean
デフォルト:false

ストリーミング出力モードを有効にするかどうか

  • false:モデルが完全なレスポンスを生成してから一括で返します(デフォルト)。短いテキストやバッチ処理に適しています
  • true:Server-Sent Events(SSE)でチャンクごとにリアルタイムに返します。チャットや長文に適しています。ストリーミング終了時に data: [DONE] を返します
:

false

thinking
object

思考連鎖(Chain of Thought)を有効にするかどうかを制御します

reasoning_effort
enum<string>
デフォルト:max

モデルの推論の度合いを制御します(GLM-5.2 専用能力)

説明

  • thinking が有効な場合のみ有効で、デフォルトは max
  • 値は強い順から弱い順へ:max > xhigh > high > medium > low > minimal > none

GLM-5.2 のマッピングルール(他のプロトコルとの互換性のため):

  • xhighmax と等価
  • low / mediumhigh と等価
  • none / minimal → 思考を放棄(深い推論を行わない)
利用可能なオプション:
max,
xhigh,
high,
medium,
low,
minimal,
none
:

"max"

do_sample
boolean
デフォルト:true

サンプリング戦略を有効にするかどうか

  • true(デフォルト):temperature / top_p を用いてランダムサンプリングを行い、出力がより多様になります
  • false:常に確率が最も高い語彙を選択し(貪欲デコード)、出力がより定まります。この場合 temperaturetop_p は無視されます

一貫性や再現性が必要なタスク(コード生成、翻訳など)には false の設定を推奨します

:

true

temperature
number<float>
デフォルト:1

サンプリング温度。出力のランダム性と創造性を制御します

説明

  • 範囲:[0.0, 1.0]、小数第 2 位まで
  • 高い値(例:0.8):よりランダムで独創性が高くなり、クリエイティブな執筆に適しています
  • 低い値(例:0.2):より安定して定まりやすくなり、事実に基づく質問応答やコード生成に適しています
  • GLM-5.2 のデフォルト値:1.0

推奨temperaturetop_p を同時に調整しないでください

必須範囲: 0 <= x <= 1
:

1

top_p
number<float>
デフォルト:0.95

核サンプリング(Nucleus Sampling)パラメータ。temperature サンプリングの代替手段です

説明

  • 範囲:[0.01, 1.0]、小数第 2 位まで
  • モデルは累積確率が top_p に達する候補語彙のみを考慮します。例えば 0.1 は上位 10% の確率の語彙のみを考慮することを意味します
  • 小さい値ほど絞り込まれた一貫性のある出力になり、大きい値ほど多様性が増します
  • GLM-5.2 のデフォルト値:0.95

推奨temperaturetop_p を同時に調整しないでください

必須範囲: 0.01 <= x <= 1
:

0.95

max_tokens
integer

モデル出力の最大 token 数の制限

説明

  • GLM-5.2 は最大 131,072 tokens(128K)の出力長に対応します。1024 以上の設定を推奨します
  • thinking が有効な場合、思考連鎖の token もこの上限に含まれます
  • 生成が length の理由で中断された場合は、この値を引き上げてみてください
必須範囲: 1 <= x <= 131072
:

1024

tools
(Function ツール · object | Retrieval ツール(ナレッジベース検索) · object | Web Search ツール(ウェブ検索) · object | MCP ツール · object)[]

モデルが呼び出せるツールのリスト

説明

  • 関数呼び出し(function)、ナレッジベース検索(retrieval)、ウェブ検索(web_search)、MCP(mcp)に対応します
  • 最大 128 個の関数に対応します
Maximum array length: 128
tool_choice
enum<string>
デフォルト:auto

モデルがどの関数を呼び出すかを選択する方法を制御します

説明:ツールの種類が function の場合のみ有効で、デフォルトかつ auto のみに対応します(ツールを呼び出すかどうかをモデルが自動で判断します)

利用可能なオプション:
auto
:

"auto"

stop
string[]

停止ワードのリスト

説明

  • モデルが生成テキスト中に指定した文字列に遭遇すると、ただちに生成を停止します(停止ワード自体は返却テキストに含まれません)
  • 現在は単一の停止ワードのみに対応し、形式は ["stop_word1"]、例えば ["Human:"] です
Maximum array length: 4
:
["Human:"]
response_format
object

モデルのレスポンス出力形式を指定します。デフォルトは text

説明

  • { "type": "json_object" } で JSON モードを有効化すると、モデルは有効な JSON 形式のデータを返します。構造化データの抽出などのシナリオに適しています
  • JSON モードを使用する場合は、system または user メッセージで JSON 出力をはっきりと要求することを推奨します
request_id
string

リクエストの一意の識別子

説明

  • ユーザー側から渡し、長さは 6〜64 文字です。一意性を確保するため UUID 形式を推奨します
  • 指定しない場合は、プラットフォームが自動で生成します
Required string length: 6 - 64
:

"req-7f3a2c1e8b9d4f0a"

user_id
string

エンドユーザーの一意の識別子

説明:長さは 6〜128 文字です。機密情報を含まない一意の識別子の使用を推奨します。プラットフォームによる不正利用の監視と検出に役立ちます

Required string length: 6 - 128
:

"user-abc123456"

レスポンス

対話生成に成功

id
string

タスク ID

:

"chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a"

object
enum<string>

レスポンスの種類

利用可能なオプション:
chat.completion
:

"chat.completion"

request_id
string

リクエスト ID(リクエストで request_id を指定した場合に返送されます)

:

"req-7f3a2c1e8b9d4f0a"

created
integer

リクエストの作成時刻。Unix タイムスタンプ(秒)

:

1777021417

model
string

モデル名

:

"glm-5.2"

choices
object[]

モデルレスポンスのリスト

usage
object

呼び出し終了時に返却される Token 使用統計

ウェブ検索関連情報。web_search ツールを使用し検索がヒットした場合に返却されます

content_filter
object[]

コンテンツ安全関連情報