• EnglishEspañol日本語한국어Português
  • Inicia sesiónComenzar ahora

Te ofrecemos esta traducción automática para facilitar la lectura.

In the event of any inconsistency between the English version and the translated version, the English versionwill take priority. Please visit this page for more information.

Crea una propuesta

Comprender el uso de la CPU de Ktranslate

Problema

Tiene ktranslate contenedor alcanzando el 100% de utilización de la CPU o, en general, es mayor de lo esperado.

Sugerencia

Un detalle con el que hay que tener cuidado es que para ktranslate es importante centrarse en el porcentaje máximo de CPU en lugar del promedio. Ktranslate utiliza un alto porcentaje de CPU cerca del comienzo de un ciclo de sondeo y mucho menos al final del ciclo. Cuando observa el uso promedio, es posible que vea un 60% y pase por alto el hecho de que ktranslate dedica tiempo cerca del 100%, lo cual es un problema potencial. Debe asignar suficientes recursos para que el consumo máximo de CPU no alcance el 100%.

Solución

Las causas del uso de la CPU varían según el tipo de contenedor ktranslate con el que esté trabajando.

SNMP

El contenedor SNMP ve principalmente aumentos en el uso de la CPU debido a la cantidad de puntos de datos que necesitamos recopilar de los dispositivos de destino y la cantidad de tiempo dedicado a intentar recopilar cada punto de datos.

Los dispositivos con alta latencia al responder eficazmente a solicitudes SNMP requieren más recursos. Tener un timeout o más retries hace que sea más probable que obtenga los datos de estos dispositivos lentos para evitar brechas en los gráficos, pero también aumenta la cantidad requerida de recursos que debe proporcionar para su contenedor. También es posible que entre un gran número de eventos de captura SNMP; como estimación general, debería poder ingerir aproximadamente 1000 eventos por segundo para cada CPU.

Con un uso elevado, sus opciones son estas:

  • Agregue más CPU al host para manejar la carga de trabajo existente.
  • Aumente el intervalo de sonido teniendo un número mayor en las poll_time_sec configuraciones globales o específicas del dispositivo.
  • Reduzca la cantidad de dispositivos que se sondean eliminándolos de la sección de dispositivos del yaml de configuración de ktranslate y asegurándose de que no estén incluidos en un redescubrimiento automático.
  • Excluya los MIB que no necesita de la lista global mibs_enabled (menos típica).
  • Posiblemente reduzca el volumen de capturas SNMP ruidosas o de menor valor cambiando la configuración en los dispositivos de red para no enviarlas.

Fluir

El contenedor de flujo ve principalmente aumentos en el uso de CPU debido a la cantidad de eventos de flujo entrante. Como estimación general, debería poder ingerir alrededor de 2000 flujos por segundo para cada CPU, pero las cargas varían ligeramente para los diferentes protocolos de flujo.

Con un uso elevado, sus opciones son estas:

  • Agregue más CPU al host para manejar la carga de trabajo existente.
  • Reduzca el volumen de flujos entrantes cambiando la configuración en el dispositivo de red, como recolectar solo flujo en interfaces críticas o usar flujos de muestra si es posible.

Syslog - registro del sistema

El contenedor Syslog ve principalmente aumentos en el uso de CPU debido a la cantidad de eventos syslog entrantes. Como estimación general, debería poder ingerir alrededor de 2000 mensajes por segundo.

Con un uso elevado, sus opciones son estas:

  • Agregue más CPU al host para manejar la carga de trabajo existente.
  • Reduzca el volumen de eventos syslog ruidosos o de menor valor cambiando la configuración en los dispositivos de red para no enviar ciertos tipos de mensajes o gravedad. Consulte la documentación del proveedor de su dispositivo para saber cómo realizar estos cambios.
Copyright © 2024 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.