GLM-5.2 - API compatible con Anthropic
- Invoca el modelo GLM-5.2 mediante el protocolo Anthropic Messages
- La estructura de solicitud / respuesta está alineada con la API de Anthropic
- Indicación de sistema: se transfiere mediante el campo
systemde nivel superior - Modo de pensamiento: GLM-5.2 activa el pensamiento de forma predeterminada, el contenido del pensamiento se devuelve mediante un bloque
content[type=thinking]; pasathinking.type=disabledpara desactivarlo - Salida en streaming: flujo de eventos SSE
- Llamada a herramientas: compatible con el flujo
tool_use/tool_resultde Anthropic - ⚠️ No admite multimodalidad: GLM-5.2 es un modelo de solo texto, los bloques de contenido de imagen / video se ignoran
https://direct.evolink.ai, que ofrece mejor compatibilidad con los modelos de texto y las conexiones de larga duración. https://api.evolink.ai es el endpoint principal para los servicios multimodales y sirve como dirección de respaldo para los modelos de texto.Autorizaciones
##Todas las API requieren autenticación con Bearer Token##
Obtener la API Key:
Visita la Página de gestión de API Keys para obtener tu API Key
Añadir al encabezado de la solicitud al usarla:
Authorization: Bearer YOUR_API_KEYNota: EvoLink usa de forma unificada la autenticación con Bearer Token para /v1/messages.
Cuerpo
Modelo a invocar
glm-5.2 "glm-5.2"
Lista de mensajes de la conversación, alternando user / assistant por turnos
Notas:
- Debe contener al menos 1 mensaje
- El último mensaje suele ser
role=user - Admite contexto de múltiples turnos, el modelo hará referencia a los mensajes históricos
1Especifica el límite superior de longitud del contenido generado (número de Tokens)
Notas:
- Los tokens producidos por el thinking también se contabilizan en este límite
- Al alcanzar el límite, el contenido se trunca y la respuesta devuelve
stop_reason=max_tokens
x >= 11024
Indicación de sistema, usada para definir el rol y el comportamiento de la IA
Notas:
- Admite una cadena o un array de bloques de contenido
- Se transfiere mediante el campo
systemde nivel superior (no lo incluyas en messages) - El modelo respetará las restricciones de system
- ⚠️ Un system demasiado largo puede truncarse: si necesitas un contexto largo, colócalo en
messages, no lo amontones todo ensystem
"You are a helpful assistant."
Temperatura de muestreo
Notas:
- Cuanto más alto el valor, más diversa la salida; cuanto más bajo, más determinista
- Rango recomendado
[0, 1]
0 <= x <= 11
Umbral de muestreo por núcleo
Notas:
- Rango
[0, 1] - Se recomienda no ajustar temperature y top_p simultáneamente
0 <= x <= 10.9
Muestrea solo entre los K tokens de mayor probabilidad (parámetro exclusivo de Anthropic)
Notas:
- Cuanto más pequeño el valor, más determinista la salida; cuanto más grande, más diversos los candidatos
x >= 010
Secuencias de parada personalizadas: la generación se detiene cuando se encuentra cualquiera de estas cadenas
Notas:
- Al encontrarla se trunca, el contenido anterior al punto de coincidencia se devuelve con normalidad
- ⚠️ Atención: al encontrar una secuencia de parada, el
stop_reasonde GLM-5.2 devuelveend_turn(en lugar delstop_sequenceestándar de Anthropic), y la respuesta tampoco incluye el campostop_sequence. Si el cliente se basa enstop_reason=="stop_sequence"para detectar la coincidencia, necesitarás un manejo especial
["\n\n"]Si se devuelve en streaming mediante SSE
true: devolución en streaming mediante Server-Sent Events (secuencia de eventos estándar de Anthropic: message_start / content_block_start / content_block_delta / message_delta / message_stop)false: devuelve la respuesta completa de una sola vez (predeterminado)
false
Controla el pensamiento profundo
Notas:
- GLM-5.2 es un modelo de razonamiento, cuando no se transfiere este campo, el pensamiento está activado de forma predeterminada
- Cuando está activado, en el array
contentde la respuesta aparece un bloque de proceso de razonamiento contype="thinking"(se factura como output token,signaturepuede ser una cadena vacía) - Pasa
{"type":"disabled"}para desactivar el pensamiento, reduciendo notablemente los output tokens - ⚠️ Solo el interruptor binario
typetiene efecto: parámetros de presupuesto/nivel de pensamiento comobudget_tokensoeffortno surten efecto (se ignoran), no se puede controlar con precisión la cantidad de pensamiento
Lista de definiciones de herramientas
Notas:
- Sigue la especificación de definición de tool de Anthropic
input_schemausa un objeto JSON Schema- El modelo devuelve un bloque
tool_useestándar, constop_reason=tool_use
Estrategia de selección de herramientas
Metadatos de la solicitud
Respuesta
Objeto de mensaje
Respuesta de mensaje al estilo de Anthropic
ID único del mensaje (formato: msg_<uuid>)
Tipo de objeto de respuesta
message assistant Modelo realmente utilizado
"glm-5.2"
Lista de bloques de contenido de la respuesta
Posibles block type:
thinking: proceso de razonamiento (cuando el pensamiento está activado, activado de forma predeterminada)text: texto de la respuesta finaltool_use: llamada a herramienta iniciada por el modelo
Motivo de la parada
end_turn: finalización natural (⚠️ también devuelve este valor al encontrar stop_sequences)max_tokens: se alcanzó el límite de max_tokenstool_use: el modelo activó una llamada a herramienta
end_turn, max_tokens, tool_use Estadísticas de uso de tokens (especificación de Anthropic)