KTranslate Docker contêiner monitoramento de saúde
Ao executar o contêiner Docker KTranslate para Monitoramento de rede New Relic , você pode monitor a integridade do contêiner para detectar proativamente possíveis problemas.
A imagem do contêiner do KTranslate possui as configurações -tee_logs=true e -metrics=jchf disponíveis durante a execução, que permitem enviar métricas de saúde diretamente para New Relic. Eles são habilitados por padrão ao instalar o Monitoramento de rede por meio da instalação guiada New Relic . Recomendamos que você os configure ao instalar o Monitoramento de rede manualmente.
Log do KTranslate
Dica
Se quiser verificar o log localmente no host Docker , execute docker logs $CONTAINER_NAME. Por exemplo, docker logs ktranslate-snmp.
A opção -tee_logs=true envia log para New Relic ao pesquisar dispositivos. Para vê-los, faça o seguinte:
FROM Log SELECT*WHERE`collector.name`='ktranslate'AND`message`NOTLIKE'%[Info]%'
Com uma regra de análise aplicada ao seu log
Interface de registro:
bash
$
collector.name:"ktranslate" severity:-"Info"
NRQL:
FROM Log SELECT*WHERE`collector.name`='ktranslate'AND`severity`!='Info'
Resultados esperados:
bash
$
KTranslate>cisco-7513 There was an SNMP polling error with the CustomDeviceMetrics walking OID .1.3.6.1.2.1.4.31.1.1.21 after 0 retries: request timeout(after 0 retries).
Dica
O KTranslate tem os seguintes níveis de gravidade de log: Info, Warn e Error.
FROM Log SELECT*WHERE`collector.name`='ktranslate'AND`message`LIKE'%Match Attribute%'
Resultados esperados:
bash
$
KTranslate>cisco-7513 Added 1 Match Attribute(s)
Espera-se que todos os dispositivos tenham pelo menos um atributo de correspondência herdado da configuração monitor_admin_shut: true padrão. Você deve esperar que um valor 2 seja mostrado para um dispositivo ao qual você adicionou um único atributo de correspondência.
Dica
Você pode filtrar ainda mais esses resultados adicionando o nome do dispositivo à sua consulta: collector.name:"ktranslate" message:"*$DEVICE_NAME*Match Attribute*".
Métrica do KTranslate
A opção -metrics captura a seguinte métrica de desempenho ao pesquisar dispositivos:
Métrica
Granularidade
Descrição
baseserver_healthcheck_execution_total
Nível superior
Taxa de verificações de saúde internas. Mostra principalmente que as coisas não estão em conflito e devem sempre ser maiores que 0.
inputq
Nível superior
Mensagens por segundo (msg/s) recebidas nos últimos 60 segundos de todas as entradas SNMP, Flow e VPC combinadas.
jchfq
Nível superior
Taxa do medidor com número de buffers pré-alocados disponíveis. Deveria ser cerca de 8.000.
delivery_metrics_nr
Entrega para New Relic
Lotes por segundo (lotes/s) enviados nos últimos 60 segundos de todas as métricas para o New Relic.
delivery_logs_nr
Entrega para New Relic
Log por segundo (log/s) enviado nos últimos 60 segundos para todos os logs para New Relic.
delivery_wins_nr
Entrega para New Relic
Vitórias por segundo (vitórias/seg) de 200 códigos HTTP recebidos nos últimos 60 segundos do envio de métricas e eventos para New Relic.
device_metrics
SNMP
Pesquisas por segundo (pesquisas/s) de pesquisa SNMP nos últimos 60 segundos para métrica de nível de dispositivo.
interface_metrics
SNMP
Pesquisas por segundo (pesquisas/s) de pesquisa SNMP nos últimos 60 segundos para métrica de nível de interface.
snmp_fail
SNMP
Medidor para monitor se a pesquisa SNMP está funcionando faceada por device_name. Onde 1 significa bom e 2 significa fracasso.
netflow.flows
Netflow
Fluxos por segundo (fps) recebidos nos últimos 60 segundos para todos os dados de fluxo do dispositivo: IPFIX, NetFlow ou sFlow.
syslog_queue
Registro de sistema
Medidor de mensagens syslog aguardando para serem processadas.
syslog_errors
Registro de sistema
Erros por segundo (erros/s) nos últimos 60 segundos durante o processamento de mensagens syslog.
syslog_messages
Registro de sistema
Mensagens por segundo (msg/seg) recebidas nos últimos 60 segundos para todos os dados do syslog.