서비스 및 애플리케이션 계층 이해 및 모니터링

kubernetes 시스템에서 각 포드에는 kubernetes 시스템이 지원하는 실제 기능을 제공하는 서비스와 애플리케이션이 포함되어 있습니다. 시스템은 계산, 웹 앱 또는 그 사이의 모든 것을 지원할 수 있습니다.

시스템이 전체적으로 정상일 수 있지만 개별 애플리케이션 및 서비스가 실패하거나 오류가 발생할 수 있습니다. 다음 단계는 애플리케이션과 서비스를 모니터링하고 분류하는 일반적인 전략을 안내합니다.

APM Kubernetes 대시보드로 이동

one.newrelic.com > All capabilities > APM & Services > (애플리케이션 선택) > Kubernetes 로 이동합니다.

애플리케이션 분류

이 페이지에는 Kubernetes 클러스터 내 해당 애플리케이션의 모든 인스턴스에 대한 일반 개요가 표시됩니다. 여기에는 다양한 유용한 차트와 그래프가 있지만 맨 오른쪽에 있는 활동 스트림을 자세히 살펴보세요. 그러면 해당 응용 프로그램의 중요한 성능 이벤트가 강조 표시됩니다. 성능 기록에 대한 전체 보기를 수집하려면 필요에 따라 시간 범위를 늘립니다.

무엇이 허용 가능한지는 사용자만이 결정할 수 있지만 하루에 여러 번 이벤트가 발생하면 성능을 향상할 수 있음을 나타냅니다. 예를 들어 위 이미지에는 단 몇 시간 내에 여러 개의 Apdex 경고가 있습니다. Apdex 경고는 사용자 경험이 저하되었음을 나타냅니다.

The main overview dashboard for an APM service in a Kubernetes cluster

성능 문제의 원인 파악

4개의 그래프가 나타날 때까지 아래로 스크롤합니다. 각 그래프의 왼쪽 상단에서 드롭다운을 선택하고 그래프를 다음과 같이 설정합니다.

서비스 오류율
서비스 처리량
서비스 응답 시간
컨테이너 재시작 횟수
처음 세 개의 그래프는 애플리케이션의 상태를 보여줍니다. 재시작 횟수 그래프는 성능이 일반 포드 상태에 영향을 미치는지 상관 관계를 파악하는 데 도움이 됩니다.
위 스크린샷에서 몇 가지 사항을 확인할 수 있습니다.
오류율은 0으로 유지됩니다. 이는 오류가 성능에 영향을 미치지 않음을 의미합니다.
서비스 처리량이 매우 자주 급증합니다.
서비스 응답 시간은 70ms에 가깝게 주기적으로 변동됩니다.
컨테이너 다시 시작 그래프가 0으로 유지됩니다. 이는 내 애플리케이션의 성능이 내 클러스터에서 심각한 오류를 일으키지 않음을 의미합니다.
이 경우 처리량과 응답 시간을 성능 저하의 주요 지표로 식별할 수 있습니다. 애플리케이션 자체를 최적화하거나 애플리케이션을 호스팅하는 컨테이너에 더 많은 CPU 성능을 적용하는 등 이러한 문제를 해결하는 방법은 많습니다.

다음은 뭐지?

New Relic을 사용하여 Kubernetes를 모니터링하는 방법을 배웠으므로 이제 다른 튜토리얼을 탐색할 수 있습니다.

앱이 느리게 실행되고 있나요? 내 앱은 느립니다 튜토리얼을 통해 앱의 대기 시간을 분류하고 진단하는 방법을 알아보세요.
수요가 가장 많은 날이 다가오면 New Relic이 용량 계획 에 어떻게 도움이 되는지 알아보십시오.
고품질 알림을 생성하시겠습니까? 경고 자습서는 경고 시스템을 설정하는 데 도움이 될 수 있습니다.

이전 단계

Kubernetes 배포 및 Pod를 모니터링합니다.