##Todas las APIs requieren autenticación Bearer Token##
Obtener API Key:
Visita la Página de gestión de API Key para obtener tu API Key
Agregar al encabezado de la solicitud:
Authorization: Bearer YOUR_API_KEYNombre del modelo para completado de chat
kimi-k2-thinking, kimi-k2-thinking-turbo "kimi-k2-thinking"
Lista de mensajes para la conversación, soporta diálogo de múltiples turnos y entrada multimodal
1Si se transmite la respuesta en streaming
true: Respuesta en streaming, devuelve contenido fragmento a fragmento en tiempo realfalse: Esperar la respuesta completa y devolverla de una sola vezfalse
Número máximo de tokens a generar en la respuesta
Nota:
x >= 12000
Temperatura de muestreo, controla la aleatoriedad de la salida
Nota:
0 <= x <= 21
Parámetro de muestreo nucleus
Nota:
Sugerencia: No ajustes temperature y top_p simultáneamente
0 <= x <= 10.9
Parámetro de muestreo Top-K
Nota:
x >= 140
Número de completaciones a generar por cada mensaje de entrada
Nota:
1 <= x <= 51
Penalización de presencia, número entre -2.0 y 2.0
Nota:
-2 <= x <= 20
Penalización de frecuencia, número entre -2.0 y 2.0
Nota:
-2 <= x <= 20
Configuración del formato de respuesta
Nota:
Secuencias de parada, la generación se detiene cuando se encuentran estas secuencias
Nota:
Lista de herramientas para Tool Use o Function Calling
Nota:
128Completado de chat exitoso
Identificador único para la completación de chat
"cmpl-04ea926191a14749b7f2c7a48a68abc6"
El modelo utilizado para el completado
"kimi-k2-thinking"
Tipo de respuesta
chat.completion "chat.completion"
Marca de tiempo Unix cuando se creó el completado
1698999496
Lista de opciones de completado
Estadísticas de uso de tokens