APM 과 Infrastructure [인프라] 데이터의 통합으로 단일 페이지에서 전체 시스템의 상태를 볼 수 있습니다. APM Summary [요약] 페이지에서 호스트, 앱, 이벤트 및 경고 활동을 모니터링하고 내장된 변경 추적을 사용하여 데이터를 최근 배포와 비교할 수 있습니다. 한 페이지에서 경고에 대응하고 근본 원인을 식별하고 호스트 성능에 미치는 영향을 신속하게 해결할 수 있습니다.
먼저 이 문서는 APM으로 인프라 문제를 해결하는 과정을 안내합니다. 그런 다음 APM 및 인프라 모니터링의 주요 기능 중 일부에 대해 자세히 알아봅니다.
APM과 인프라 데이터 통합
을 위한 통합할 인프라 데이터는 다음 사항이 모두 참이어야 합니다.
APM 에이전트와 인프라 에이전트는 동일한 호스트에 설치해야 합니다.
두 에이전트는 동일한 것을 사용해야 합니다.
.
동일한 호스트 이름 을 사용해야 합니다.
통합이 작동하지 않는 경우 APM-인프라 통합 문제 해결을참조하십시오.
경고에 응답
이 예에서 귀하가 Billing Service
애플리케이션을 담당하는 엔지니어이고 " Billing Service
에서 최소 5분 동안 오류 비율 > 45%"라는 알림을 받았다고 가정해 보겠습니다.
가장 먼저 할 일은 APM의
Billing Service
애플리케이션으로 이동하고 Summary [요약] 페이지를 열어 시스템 상태에 대한 개요를 보는 것입니다. 사용자 만족도의 척도인 높은 Apdex 점수는 시스템에 문제가 있음을 나타낼 수 있습니다. 여기서 점수가 .79임을 알 수 있습니다. 중요한 위반을 촉발했습니다.다음으로 오류율을 확인합니다. 여기에서 오류율이 100%에 도달한 것을 볼 수 있습니다.
이 두 가지 지표를 기반으로 문제가 있음을 알 수 있습니다. 이제 위치와 이유를 파악하기만 하면 됩니다.
오류의 원인 파악
APM 요약 페이지의 Infrastructure [인프라] 섹션까지 아래로 스크롤합니다. 여기에서 Billing Service
애플리케이션에 연결된 각 호스트와 해당 Response time [응답 시간], Throughput [처리량], Error rate [오류율], CPU%레코드를 나열하는 테이블을 볼 수 있습니다. 및 Memory % [메모리 %]. 차트 아래에는 이러한 황금 신호 중 두 가지를 강조 표시하는 히스토그램이 있습니다. 기본 선택 항목은 CPU % 및 Memory % [메모리 %] 이지만 왼쪽 상단의 드롭다운 메뉴를 클릭하고 다른 보기를 선택할 수도 있습니다.
검사하려는 다른 황금 신호 간에 전환할 수 있습니다.
CPU 히스토그램을 보면 모든 호스트의 CPU %가 오전 11시 30분경에 급증한 것을 볼 수 있습니다. 이 CPU 변경이 최근 배포와 동시에 발생했음을 확인할 수도 있습니다. 배포 마커를 클릭하면 변경 사항을 발표한 사람과 해당 변경 사항이 무엇인지 알려줍니다.
이제 APM 및 인프라 모니터링으로 문제를 해결하는 방법을 알았으므로 APM 및 인프라 데이터를 통합하고 실행하는 방법을 살펴보겠습니다.
APM 및 인프라 데이터에 대한 로그 보기
또한 로그와 애플리케이션의 데이터를 함께 가져와 더 쉽고 빠르게 문제를 해결할 수 있습니다. 컨텍스트의 로그를 사용하면 앱의 UI에서 직접 오류 및 추적과 관련된 로그 메시지를 볼 수 있습니다. Kubernetes 클러스터와 같은 인프라 데이터 컨텍스트에서 로그를 볼 수도 있습니다. 다른 UI 페이지로 전환할 필요가 없습니다.
애플리케이션 데이터로 필터링
당신의 인프라 데이터가 연결되어 있으면 검사하려는 특정 애플리케이션을 검색하여 표시된 호스트 데이터를 필터링할 수 있습니다. 위의 경우 Billing Service
에 대해 필터링할 수 있습니다.
인벤토리 및 이벤트 UI 페이지의 APM 데이터
당신의 인프라 데이터가 연결되어 있으면 인프라 모니터링 UI의 인벤토리 페이지 및 이벤트 페이지에서 애플리케이션 데이터를 보고 필터링할 수 있습니다.
누락된 APM 데이터 문제 해결
APM/인프라 통합은 두 가지가 모두 있는 경우 자동으로 발생해야 합니다. 에이전트와 인프라 에이전트는 동일한 호스트에 설치되며 동일한 호스트를 사용합니다. 동일한 호스트 이름이 설정되어 있습니다.
인프라 모니터링에 APM 데이터가 표시되지 않으면 문제 해결을참조하십시오.