APM 요약 페이지에서 인프라 데이터 보기

APM 과 인프라 데이터의 통합을 통해 단일 페이지에서 전체 시스템의 상태를 확인할 수 있습니다. APM Summary 페이지에서 호스트, 앱, 이벤트 및 활동을 모니터링하고 포함된 추적을 사용하여 데이터를 최근 변경된 배포와 비교할 수 있습니다. 한 페이지에서 공지 사항에 대응하고, 근본 원인을 식별하며, 호스트 성능에 미치는 영향을 신속하게 해결할 수 있습니다.

먼저 이 문서는 APM으로 인프라 문제를 해결하는 과정을 안내합니다. 그런 다음 APM 및 인프라 모니터링의 주요 기능 중 일부에 대해 자세히 알아봅니다.

APM과 인프라 데이터 통합

및 인프라 데이터를 통합하려면 다음 사항이 모두 충족되어야 합니다.

APM 에이전트와 인프라 에이전트는 동일한 호스트에 설치해야 합니다.
두 에이전트 모두 동일한 사용하거나 동일한 조직에 있는 계정의 인스턴스 키를 사용해야 합니다.
- APM Summary 페이지를 보는 사용자는 APM 및 에이전트 에이전트에 별도의 인스턴스 키가 사용되는 경우 두 계정 모두에 액세스할 수 있어야 합니다.
동일한 호스트 이름 을 사용해야 합니다.
Kubernetes 호스팅 애플리케이션의 경우 APM 계측 애플리케이션을 Kubernetes에 연결하기 위한 추가 통합 단계도 필요합니다.
통합이 작동하지 않는 경우 APM-인프라 통합 문제 해결을참조하십시오.

경고에 응답

이 예에서 귀하가 Billing Service 애플리케이션을 담당하는 엔지니어이고 " Billing Service에서 최소 5분 동안 오류 비율 > 45%"라는 알림을 받았다고 가정해 보겠습니다.

가장 먼저 할 일은 APM의 Billing Service 애플리케이션으로 이동하여 Summary 페이지를 열어 시스템 상태에 대한 개요를 확인하는 것입니다. 사용자 만족도를 측정하는 Apdex 점수가 높으면 시스템에 문제가 있음을 나타낼 수 있습니다. 여기서 점수가 .79임을 알 수 있습니다. 그리고 중요한 인시던트를 촉발시켰습니다.
다음으로 오류율을 확인합니다. 여기에서 오류율이 100%에 도달한 것을 볼 수 있습니다.
이 두 가지 지표를 기반으로 문제가 있음을 알 수 있습니다. 이제 위치와 이유를 파악하기만 하면 됩니다.

오류의 원인 파악

APM 요약 페이지의 Infrastructure 섹션까지 아래로 스크롤합니다. 여기서는 Billing Service 애플리케이션에 연결된 각 호스트와 해당 호스트의 Response time, Throughput, Error rate, CPU% 레코드를 나열하는 표를 볼 수 있습니다. 그리고 Memory %. 차트 아래에는 골든 아이콘 2개를 강조한 히스토그램이 있다. 기본 선택은 CPU % 및 Memory % 이지만 왼쪽 상단의 드롭다운 메뉴를 클릭하고 다른 보기를 선택할 수도 있습니다.

A screenshot depicting how you can toggle between histograom views

검사하려는 다른 황금 신호 간에 전환할 수 있습니다.

CPU 히스토그램을 보면 모든 호스트의 CPU %가 오전 11시 30분경에 급증한 것을 볼 수 있습니다. 이 CPU 변경이 최근 배포와 동시에 발생했음을 확인할 수도 있습니다. 배포 마커를 클릭하면 변경 사항을 발표한 사람과 해당 변경 사항이 무엇인지 알려줍니다.

A screenshot depicting a CPU incident that corresponds to a deployment marker.

특정 호스트에 대해 자세히 알아보기

이제 Billing Service 구성의 최근 배포로 인해 오류가 급증하고 중요한 Apdex 인시던트가 발생했다는 사실을 알았으므로 더 명확하게 하기 위해 특정 호스트를 살펴보는 것이 좋습니다. 검사하려는 호스트의 이름을 클릭합니다. Infrastructure 페이지에서 모든 관련 정보를 가져오는 사이드바가 표시됩니다. 이를 통해 나머지 데이터를 남기지 않고도 호스트 및 서비스 오류와 관련하여 필요한 모든 정보에 액세스할 수 있습니다.

A gif depicting a deeper inspection of a host with critical incidents

APM 요약 페이지를 떠나지 않고 호스트를 검사하십시오.

이제 APM 및 인프라 모니터링으로 문제를 해결하는 방법을 알았으므로 APM 및 인프라 데이터를 통합하고 실행하는 방법을 살펴보겠습니다.

APM 및 인프라 데이터에 대한 로그 보기

또한 로그와 애플리케이션의 데이터를 함께 가져와 더 쉽고 빠르게 문제를 해결할 수 있습니다. 컨텍스트의 로그를 사용하면 앱의 UI에서 직접 오류 및 추적과 관련된 로그 메시지를 볼 수 있습니다. Kubernetes 클러스터와 같은 인프라 데이터 컨텍스트에서 로그를 볼 수도 있습니다. 다른 UI 페이지로 전환할 필요가 없습니다.

애플리케이션 데이터로 필터링

및 인프라 데이터가 연결되면 검사하려는 특정 애플리케이션을 검색하여 표시된 호스트 데이터를 필터링할 수 있습니다. 위의 경우 Billing Service(를) 필터링하려고 합니다.

A screenshot showing you how to filter the infrastructure page by application

인벤토리 및 이벤트 UI 페이지의 APM 데이터

및 인프라 데이터가 연결되면 인프라 모니터링 UI의 Inventory 페이지 및 Events 페이지 에서 애플리케이션 데이터를 보고 필터링할 수 있습니다.

누락된 APM 데이터 문제 해결

APM/인프라 통합은 에이전트와 배포 에이전트가 모두 동일한 호스트에 설치되어 있고 동일한 또는 동일한 조직의 인스턴스 키 쌍을 사용하고 동일한 경우 자동으로 발생해야 합니다. 호스트명 세트.

인프라 모니터링에 APM 데이터가 표시되지 않으면 문제 해결을참조하십시오.

사용자의 편의를 위해 제공되는 기계 번역입니다.