curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "自己紹介してください"
    }
  ]
}
'

{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "こんにちは！私は GLM-5.2 です。対話、推論、執筆、コーディングなど、さまざまなタスクをお手伝いできます。",
        "reasoning_content": "まずこの問題を分析してみましょう...",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}

GLM-5.2

GLM-5.2 - OpenAI 互換 API

OpenAI Chat Completions プロトコルを使用して GLM-5.2 モデルを呼び出します
同期処理モードで、対話内容をリアルタイムに返却します
プレーンテキスト対話：シングルターンまたはマルチターンの文脈対話
システムプロンプト：role=system メッセージで AI の役割と振る舞いをカスタマイズ
深い思考：thinking.type で思考連鎖を切り替え、reasoning_effort で推論強度を調整します。推論過程は reasoning_content で返却されます
ストリーミング出力：SSE ストリーミングレスポンスに対応（stream=true）
ツール呼び出し：Function Calling、ナレッジベース検索（retrieval）、ウェブ検索（web_search）、MCP に対応（最大 128 個のツール）
構造化出力：response_format で JSON モードを有効化

ストリーミングレスポンスの説明：stream=true の場合、Server-Sent Events で返却され、各メッセージの形式は data: {JSON} となり、終了時に data: [DONE] を返します。各データチャンク（ChatCompletionChunk）には id、created、model、choices、およびオプションの usage と content_filter が含まれます。そのうち choices[].delta は role / content / reasoning_content / tool_calls を増分で返し、choices[].finish_reason は最後のチャンクで終了理由を示します。

POST

chat

completions

curl --request POST \
  --url https://direct.evolink.ai/v1/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "user",
      "content": "自己紹介してください"
    }
  ]
}
'

{
  "id": "chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a",
  "object": "chat.completion",
  "request_id": "req-7f3a2c1e8b9d4f0a",
  "created": 1777021417,
  "model": "glm-5.2",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "こんにちは！私は GLM-5.2 です。対話、推論、執筆、コーディングなど、さまざまなタスクをお手伝いできます。",
        "reasoning_content": "まずこの問題を分析してみましょう...",
        "tool_calls": [
          {
            "id": "<string>",
            "function": {
              "name": "<string>",
              "arguments": "<string>"
            },
            "mcp": {
              "id": "<string>",
              "server_label": "<string>",
              "error": "<string>"
            }
          }
        ]
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 24,
    "completion_tokens": 346,
    "total_tokens": 370,
    "prompt_tokens_details": {
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 321
    }
  },
  "web_search": [
    {
      "icon": "<string>",
      "title": "<string>",
      "link": "<string>",
      "media": "<string>",
      "publish_date": "<string>",
      "content": "<string>",
      "refer": "<string>"
    }
  ],
  "content_filter": [
    {
      "level": 1
    }
  ]
}

BaseURL：デフォルトの BaseURL は https://direct.evolink.ai で、テキストモデルへの対応が優れており、長時間接続をサポートします。https://api.evolink.ai はマルチモーダルサービスの主力エンドポイントで、テキストモデルに対しては代替アドレスとして使用されます。

承認

Authorization

string

header

必須

##すべての API は Bearer Token 認証が必要です##

API キーの取得：

API キー管理ページにアクセスして API キーを取得してください

リクエストヘッダーに追加：

Authorization: Bearer YOUR_API_KEY

ボディ

application/json

model

enum<string>

デフォルト:glm-5.2

必須

呼び出すモデルコード

glm-5.2：最新のフラッグシップモデルで、複雑な推論、超長文コンテキスト、極めて高速な推論速度を提供します

利用可能なオプション:

glm-5.2

例:

"glm-5.2"

messages

(System Message · object | User Message · object | Assistant Message · object | Tool Message · object)[]

必須

対話メッセージのリスト。現在の対話の完全な文脈情報を含みます

system、user、assistant、tool の 4 種類の役割に対応します。役割が異なるメッセージは異なるフィールド構造を持つため、対応する役割を選択して確認してください。少なくとも 1 件のメッセージを含む必要があり、システムメッセージまたはアシスタントメッセージのみで構成することはできません。

Minimum array length: 1

System Message
User Message
Assistant Message
Tool Message

Show child attributes

stream

boolean

デフォルト:false

ストリーミング出力モードを有効にするかどうか

false：モデルが完全なレスポンスを生成してから一括で返します（デフォルト）。短いテキストやバッチ処理に適しています
true：Server-Sent Events（SSE）でチャンクごとにリアルタイムに返します。チャットや長文に適しています。ストリーミング終了時に data: [DONE] を返します

例:

false

thinking

object

思考連鎖（Chain of Thought）を有効にするかどうかを制御します

Show child attributes

reasoning_effort

enum<string>

デフォルト:max

モデルの推論の度合いを制御します（GLM-5.2 専用能力）

説明：

thinking が有効な場合のみ有効で、デフォルトは max
値は強い順から弱い順へ：max > xhigh > high > medium > low > minimal > none

GLM-5.2 のマッピングルール（他のプロトコルとの互換性のため）：

xhigh → max と等価
low / medium → high と等価
none / minimal → 思考を放棄（深い推論を行わない）

利用可能なオプション:

max,

xhigh,

high,

medium,

low,

minimal,

none

例:

"max"

do_sample

boolean

デフォルト:true

サンプリング戦略を有効にするかどうか

true（デフォルト）：temperature / top_p を用いてランダムサンプリングを行い、出力がより多様になります
false：常に確率が最も高い語彙を選択し（貪欲デコード）、出力がより定まります。この場合 temperature と top_p は無視されます

一貫性や再現性が必要なタスク（コード生成、翻訳など）には false の設定を推奨します

例:

true

temperature

number<float>

デフォルト:1

サンプリング温度。出力のランダム性と創造性を制御します

説明：

範囲：[0.0, 1.0]、小数第 2 位まで
高い値（例：0.8）：よりランダムで独創性が高くなり、クリエイティブな執筆に適しています
低い値（例：0.2）：より安定して定まりやすくなり、事実に基づく質問応答やコード生成に適しています
GLM-5.2 のデフォルト値：1.0

推奨：temperature と top_p を同時に調整しないでください

必須範囲: 0 <= x <= 1

例:

1

top_p

number<float>

デフォルト:0.95

核サンプリング（Nucleus Sampling）パラメータ。temperature サンプリングの代替手段です

説明：

範囲：[0.01, 1.0]、小数第 2 位まで
モデルは累積確率が top_p に達する候補語彙のみを考慮します。例えば 0.1 は上位 10% の確率の語彙のみを考慮することを意味します
小さい値ほど絞り込まれた一貫性のある出力になり、大きい値ほど多様性が増します
GLM-5.2 のデフォルト値：0.95

推奨：temperature と top_p を同時に調整しないでください

必須範囲: 0.01 <= x <= 1

例:

0.95

max_tokens

integer

モデル出力の最大 token 数の制限

説明：

GLM-5.2 は最大 131,072 tokens（128K）の出力長に対応します。1024 以上の設定を推奨します
thinking が有効な場合、思考連鎖の token もこの上限に含まれます
生成が length の理由で中断された場合は、この値を引き上げてみてください

必須範囲: 1 <= x <= 131072

例:

1024

tools

(Function ツール · object | Retrieval ツール（ナレッジベース検索） · object | Web Search ツール（ウェブ検索） · object | MCP ツール · object)[]

モデルが呼び出せるツールのリスト

説明：

関数呼び出し（function）、ナレッジベース検索（retrieval）、ウェブ検索（web_search）、MCP（mcp）に対応します
最大 128 個の関数に対応します

Maximum array length: 128

Function ツール
Retrieval ツール（ナレッジベース検索）
Web Search ツール（ウェブ検索）
MCP ツール

Show child attributes

tool_choice

enum<string>

デフォルト:auto

モデルがどの関数を呼び出すかを選択する方法を制御します

説明：ツールの種類が function の場合のみ有効で、デフォルトかつ auto のみに対応します（ツールを呼び出すかどうかをモデルが自動で判断します）

利用可能なオプション:

auto

例:

"auto"

stop

string[]

停止ワードのリスト

説明：

モデルが生成テキスト中に指定した文字列に遭遇すると、ただちに生成を停止します（停止ワード自体は返却テキストに含まれません）
現在は単一の停止ワードのみに対応し、形式は ["stop_word1"]、例えば ["Human:"] です

Maximum array length: 4

例:

["Human:"]

response_format

object

モデルのレスポンス出力形式を指定します。デフォルトは text

説明：

{ "type": "json_object" } で JSON モードを有効化すると、モデルは有効な JSON 形式のデータを返します。構造化データの抽出などのシナリオに適しています
JSON モードを使用する場合は、system または user メッセージで JSON 出力をはっきりと要求することを推奨します

Show child attributes

request_id

string

リクエストの一意の識別子

説明：

ユーザー側から渡し、長さは 6〜64 文字です。一意性を確保するため UUID 形式を推奨します
指定しない場合は、プラットフォームが自動で生成します

Required string length: 6 - 64

例:

"req-7f3a2c1e8b9d4f0a"

user_id

string

エンドユーザーの一意の識別子

説明：長さは 6〜128 文字です。機密情報を含まない一意の識別子の使用を推奨します。プラットフォームによる不正利用の監視と検出に役立ちます

Required string length: 6 - 128

例:

"user-abc123456"

レスポンス

対話生成に成功

string

タスク ID

例:

"chatcmpl-a6613b56-c61c-94ba-9a9f-43d4cdc7d77a"

object

enum<string>

レスポンスの種類

利用可能なオプション:

chat.completion

例:

"chat.completion"

request_id

string

リクエスト ID（リクエストで request_id を指定した場合に返送されます）

例:

"req-7f3a2c1e8b9d4f0a"

created

integer

リクエストの作成時刻。Unix タイムスタンプ（秒）

例:

1777021417

model

string

モデル名

例:

"glm-5.2"

choices

object[]

モデルレスポンスのリスト

Show child attributes

usage

object

呼び出し終了時に返却される Token 使用統計

Show child attributes

web_search

object[]

ウェブ検索関連情報。web_search ツールを使用し検索がヒットした場合に返却されます

Show child attributes

content_filter

object[]

コンテンツ安全関連情報

Show child attributes

MiniMax-M2.5 - 完全なAPIリファレンスクレジット使用量の取得