Em seu sistema Kubernetes, cada pod contém serviços e aplicativos que fornecem a funcionalidade real suportada por seu sistema Kubernetes. O sistema pode suportar computação, um aplicativo da web ou qualquer coisa intermediária.
Seu sistema pode estar íntegro como um todo, mas aplicativos e serviços individuais podem falhar ou gerar erros. As etapas a seguir guiam você por uma estratégia geral para monitor e fazer a triagem de seu aplicativo e serviços:
Navegue até o dashboard do APM Kubernetes
Vá para one.newrelic.com > All capabilities > APM & Services > select your application > Kubernetes.
Faça a triagem do seu aplicativo
Esta página mostra uma visão geral de toda a instância dessa aplicação dentro do seu cluster do Kubernetes. Existem vários quadros e gráficos úteis aqui, mas observe atentamente o fluxo de atividades na extrema direita. Isso destacará qualquer evento importante de desempenho desses aplicativos. Aumente o intervalo de tempo conforme necessário para obter uma visão completa do histórico de desempenho.
Só você pode decidir o que é aceitável, mas vários eventos por dia indicam que você pode melhorar o desempenho. Por exemplo, na imagem acima há vários avisos do Apdex em apenas algumas horas. Os avisos do Apdex indicam uma experiência do usuário degradada.
Identifique a causa dos problemas de desempenho
Role para baixo até ver quatro gráficos. No canto superior esquerdo de cada gráfico, selecione o dropdown e defina os gráficos da seguinte forma:
Taxa de erros de serviço
Taxas de serviço de transferência
Tempo de serviço de resposta
Contagem de reinicialização do contêiner
Os três primeiros gráficos mostrarão a saúde do seu aplicativo. O gráfico de contagem de reinicializações ajuda a correlacionar se o seu desempenho tem algum efeito na integridade geral do pod.
Na captura de tela acima podemos observar algumas coisas:
A taxa de erros permanece em zero, o que significa que os erros não afetam o desempenho
O serviço taxas de transferência aumenta com muita frequência
O tempo de resposta do serviço oscila regularmente perto de 70ms
O gráfico de reinicialização do contêiner permanece em zero, o que significa que o desempenho do meu aplicativo não está causando falhas críticas no meu cluster
Neste caso, você pode identificar as taxas de transferência e o tempo de resposta como os principais indicadores do seu desempenho degradado. Há muitas maneiras de resolver isso, desde otimizar o próprio aplicativo ou simplesmente adicionar mais potência de CPU ao contêiner que hospeda o aplicativo.
Qual é o próximo?
Agora que você aprendeu como usar o New Relic para monitor o Kubernetes, você pode explorar nossos outros tutoriais:
- Seu aplicativo está lento? Aprenda como fazer a triagem e diagnosticar a latência em seu aplicativo com nosso tutorial Meu aplicativo é lento .
- Se você tiver um dia de pico de demanda chegando, saiba como a New Relic pode ajudá-lo com o planejamento de capacidade.
- Quer criar alertas de alta qualidade? Nosso tutorial de alerta pode ajudá-lo a configurar um sistema de alerta.