GLM-5.2 - Anthropic 互換 API
- Anthropic Messages プロトコルを使用して GLM-5.2 モデルを呼び出します
- リクエスト / レスポンス構造は Anthropic API と一致します
- システムプロンプト:トップレベルの
systemで渡します - 思考モード:GLM-5.2 はデフォルトで思考が有効で、思考内容は
content[type=thinking]block で返却されます。thinking.type=disabledを渡すと無効化されます - ストリーミング出力:SSE イベントストリーム
- ツール呼び出し:Anthropic の
tool_use/tool_resultフローに対応します - ⚠️ マルチモーダル非対応:GLM-5.2 はプレーンテキストモデルであり、画像 / 動画のコンテンツブロックは無視されます
https://direct.evolink.ai で、テキストモデルへの対応が優れており、長時間接続をサポートします。https://api.evolink.ai はマルチモーダルサービスの主力エンドポイントで、テキストモデルに対しては代替アドレスとして使用されます。承認
##すべての API は Bearer Token 認証が必要です##
API キーの取得:
API キー管理ページにアクセスして API キーを取得してください
リクエストヘッダーに追加:
Authorization: Bearer YOUR_API_KEY備考:EvoLink は /v1/messages に対して一律で Bearer Token 認証を採用しています。
ボディ
呼び出すモデル
glm-5.2 "glm-5.2"
対話メッセージのリスト。ターンごとに user / assistant が交互になります
説明:
- 少なくとも 1 件のメッセージを含みます
- 最後のメッセージは通常
role=userです - マルチターンの文脈に対応し、モデルは過去のメッセージを参照します
1生成内容の長さの上限(Token 数)を指定します
説明:
- thinking が生成する token もこの上限に含まれます
- 上限に達すると内容が切り詰められ、レスポンスは
stop_reason=max_tokensになります
x >= 11024
システムプロンプト。AI の役割と振る舞いを設定するために使用します
説明:
- 文字列またはコンテンツブロック配列に対応します
- トップレベルの
systemフィールドで渡します(messages には入れないでください) - モデルは system の制約に従います
- ⚠️ 長すぎる system は切り詰められる可能性があります:長い文脈が必要な場合は
messagesに入れ、すべてをsystemに詰め込まないでください
"You are a helpful assistant."
サンプリング温度
説明:
- 値が高いほど出力が発散的になり、低いほど確定的になります
- 推奨範囲
[0, 1]
0 <= x <= 11
核サンプリングのしきい値
説明:
- 範囲
[0, 1] - temperature と top_p を同時に調整しないことを推奨します
0 <= x <= 10.9
確率が最も高い K 個の token のみからサンプリングします(Anthropic 固有のパラメータ)
説明:
- 値が小さいほど出力が確定的になり、大きいほど候補が多様になります
x >= 010
カスタム停止シーケンス:生成がいずれかの文字列にヒットすると停止します
説明:
- ヒットすると切り詰められ、ヒット箇所より前の内容は正常に返却されます
- ⚠️ 注意:停止シーケンスにヒットした場合、GLM-5.2 の
stop_reasonはend_turnを返し(Anthropic 標準のstop_sequenceではなく)、レスポンスにもstop_sequenceフィールドは含まれません。クライアントがstop_reason=="stop_sequence"でヒットを判定している場合は、特別な処理が必要です
["\n\n"]SSE でストリーミング返却するかどうか
true:Server-Sent Events でストリーミング返却します(標準的な Anthropic イベントシーケンス:message_start / content_block_start / content_block_delta / message_delta / message_stop)false:完全なレスポンスを生成してから一括で返します(デフォルト)
false
深い思考を制御します
説明:
- GLM-5.2 は推論モデルであり、このフィールドを渡さない場合はデフォルトで思考が有効です
- 有効な場合、レスポンスの
content配列にtype="thinking"の推論過程 block が現れます(output token として課金され、signatureは空文字列になることがあります) {"type":"disabled"}を渡すと思考を無効化でき、output token を大幅に削減できます- ⚠️
typeの二値スイッチのみ有効:budget_tokens、effortなどの思考予算 / レベルのパラメータは効果がなく(無視されます)、思考量を細かく制御することはできません
ツール定義のリスト
説明:
- Anthropic の tool 定義仕様に従います
input_schemaは JSON Schema オブジェクトを使用します- モデルは標準的な
tool_useblock を返し、stop_reason=tool_useになります
ツール選択戦略
リクエストのメタデータ
レスポンス
メッセージオブジェクト
Anthropic スタイルのメッセージレスポンス
メッセージの一意の ID(形式:msg_<uuid>)
レスポンスオブジェクトの種類
message assistant 実際に使用されたモデル
"glm-5.2"
レスポンスのコンテンツブロックのリスト
含まれる可能性のある block type:
thinking:推論過程(思考が有効な場合、デフォルトで有効)text:最終的な回答テキストtool_use:モデルが発起したツール呼び出し
停止理由
end_turn:自然終了(⚠️ stop_sequences にヒットした場合もこの値を返します)max_tokens:max_tokens の上限に到達tool_use:モデルがツール呼び出しをトリガー
end_turn, max_tokens, tool_use Token 使用統計(Anthropic 仕様)