A integração de APM e dados de infraestrutura permite que você veja a integridade de todo o seu sistema em uma única página. Na página Summary do APM você pode monitor hosts, aplicativos, eventos e atividades e usar o Monitoramento de Alterações incorporado para comparar seus dados com qualquer implantação recente. Em uma página você pode responder a um alerta, identificar uma causa raiz e resolver rapidamente quaisquer impactos no desempenho do host.
Primeiro, este documento orientará você no processo de resolução de problemas de infraestrutura com APM. Em seguida, será aprofundado alguns dos principais recursos de APM e monitoramento de infraestrutura.
Integre APM e dados de infraestrutura
Para que e os dados de infraestrutura sejam integrados, todas as condições a seguir devem ser verdadeiras:
O agente APM e o agente de infraestrutura devem ser instalados no mesmo host.
Ambos os agentes devem usar o mesmo
ou usar chave de licença de contas na mesma organização.
Um usuário que visualiza a página APM
Summary
deverá ter acesso a ambas as contas se uma chave de licença separada for usada para APM e agente de infraestrutura.
Eles devem usar o mesmo nome do host.
Para aplicativos hospedados Kubernetes , também são necessárias etapas adicionais de integração para vincular o aplicativo APM-instrumentado ao Kubernetes .
Se a integração não estiver funcionando, consulte resolução de problemas no APM-infraestrutura integração.
Responder a um alerta
Neste exemplo, digamos que você seja o engenheiro responsável pelo aplicativo Billing Service
e receba um alerta que diz: "Porcentagem de erro > 45% por pelo menos cinco minutos em Billing Service
."
A primeira coisa que você fará é acessar o aplicativo
Billing Service
no APM e abrir a páginaSummary
para obter uma visão geral da integridade do seu sistema. Uma pontuação alta no Apdex, que mede a satisfação do usuário, pode indicar que há um problema no seu sistema. Aqui você pode ver que a pontuação é 0,79 e desencadeou um incidente crítico.
A seguir você irá verificar sua taxa de erros. Aqui você pode ver que a taxa de erros atingiu 100%.
Com base nesses dois indicadores, você sabe que tem um problema. Agora você só precisa descobrir onde e por quê.
Determine a origem dos seus erros
Role para baixo até a seção Infrastructure da página de resumo do APM. Aqui você verá uma tabela que lista cada host conectado ao aplicativo Billing Service
e um registro de seus Response time, Throughput, Error rate, CPU%. e Memory %. Abaixo do gráfico estão histogramas que destacam dois desses sinais clássicos. As seleções padrão são CPU % e Memory %, mas você também pode clicar no menu dropdown no canto superior esquerdo e selecionar uma visualização diferente.
Você pode alternar entre os diferentes sinais clássicos que deseja inspecionar.
Ao observar o histograma da CPU, você pode ver que a% de CPU de todos os seus hosts disparou por volta das 11h30. Você também pode ver que essa alteração na CPU ocorreu ao mesmo tempo que uma implantação recente. Se você clicar no marcador de implantação, ele informará quem lançou uma alteração e o que essa alteração implicou.
Aprofunde-se em um host específico
Agora que você sabe que uma implantação recente em seu aplicativo Billing Service
causou um aumento nos erros e incidentes críticos do Apdex, você pode querer procurar um host específico para obter mais clareza. Clique no nome do host que você deseja inspecionar. Irá revelar uma barra lateral que importa todas as informações relevantes da página Infrastructure . Isso permite que você acesse todas as informações necessárias sobre seu host e quaisquer erros de serviço sem deixar o resto dos seus dados.
Inspecione seu host sem sair da página de resumo do APM.
Agora que você sabe como solucionar problemas de APM e monitoramento de infraestrutura, exploraremos como integrar APM e dados de infraestrutura e colocá-los em prática.
Visualize o log do seu APM e dados de infraestrutura
Você também pode reunir os dados do seu log e da aplicação para tornar a resolução de problemas mais fácil e rápida. Com os logs contextualizados, você pode ver a mensagem do log relacionada aos seus erros e rastrear diretamente na interface do seu aplicativo. Você também pode ver o logs contextualizados dos dados da sua infraestrutura, como cluster do Kubernetes. Não há necessidade de mudar para outra página de interface.
Filtrar por dados do aplicativo
Quando os dados do e da infraestrutura estiverem vinculados, você poderá filtrar os dados do host exibidos pesquisando o aplicativo específico que deseja inspecionar. No caso acima, você deseja filtrar por Billing Service
.
Dados APM em páginas de inventário e interface de eventos
Quando seus dados e de infraestrutura estiverem vinculados, você poderá visualizar e filtrar os dados do aplicativo na páginaInventory da interface de monitoramento de infraestrutura e na páginaEvents .
Solucionar problemas de dados APM ausentes
A integração /infraestrutura APMdeverá acontecer automaticamente se você tiver o agente e o agente de infraestrutura instalados no(s) mesmo(s) host(s) e eles usarem a mesma ou um par de chave de licença da mesma organização e tiverem o mesmo nome do host set.
Caso você não veja os dados APM em monitoramento de infraestrutura, consulte resolução de problemas.