APM 요약 페이지에서 인프라 데이터 보기

APM 과 인프라 데이터의 통합을 통해 단일 페이지에서 전체 시스템의 상태를 확인할 수 있습니다. APM Summary 페이지에서 호스트, 앱, 이벤트 및 활동을 모니터링하고 포함된 추적을 사용하여 데이터를 최근 변경된 배포와 비교할 수 있습니다. 한 페이지에서 공지 사항에 대응하고, 근본 원인을 식별하며, 호스트 성능에 미치는 영향을 신속하게 해결할 수 있습니다.

먼저 이 문서는 APM으로 인프라 문제를 해결하는 과정을 안내합니다. 그런 다음 APM 및 인프라 모니터링의 주요 기능 중 일부에 대해 자세히 알아봅니다.

APM과 인프라 데이터 통합

및 인프라 데이터를 통합하려면 다음 사항이 모두 충족되어야 합니다.

APM 에이전트와 인프라 에이전트는 동일한 호스트에 설치해야 합니다.
두 에이전트 모두 동일한 사용하거나 동일한 조직에 있는 계정의 인스턴스 키를 사용해야 합니다.
- APM Summary 페이지를 보는 사용자는 APM 및 에이전트 에이전트에 별도의 인스턴스 키가 사용되는 경우 두 계정 모두에 액세스할 수 있어야 합니다.
동일한 호스트 이름 을 사용해야 합니다.
Kubernetes 호스팅 애플리케이션의 경우 APM 계측 애플리케이션을 Kubernetes에 연결하기 위한 추가 통합 단계도 필요합니다.
통합이 작동하지 않는 경우 APM-인프라 통합 문제 해결을참조하십시오.

경고에 응답

이 예에서 귀하가 Billing Service 애플리케이션을 담당하는 엔지니어이고 " Billing Service에서 최소 5분 동안 오류 비율 > 45%"라는 알림을 받았다고 가정해 보겠습니다.

먼저 APM에서 Billing Service 애플리케이션으로 이동하여 Summary 페이지를 열어 시스템 상태에 대한 개요를 확인하세요. 사용자 만족도를 측정하는 지표인 Apdex 점수가 높다는 것은 시스템에 문제가 있을 가능성을 시사합니다. 여기서 점수가 0.79임을 확인할 수 있습니다. 중요한 알림 이벤트가 발생했습니다.
다음으로 오류율을 확인합니다. 여기에서 오류율이 100%에 도달한 것을 볼 수 있습니다.
이 두 가지 지표를 기반으로 문제가 있음을 알 수 있습니다. 이제 위치와 이유를 파악하기만 하면 됩니다.

오류의 원인 파악

APM 요약 페이지의 Infrastructure 섹션까지 아래로 스크롤합니다. 여기서는 Billing Service 애플리케이션에 연결된 각 호스트와 해당 호스트의 Response time, Throughput, Error rate, CPU% 레코드를 나열하는 표를 볼 수 있습니다. 그리고 Memory %. 차트 아래에는 골든 아이콘 2개를 강조한 히스토그램이 있다. 기본 선택은 CPU % 및 Memory % 이지만 왼쪽 상단의 드롭다운 메뉴를 클릭하고 다른 보기를 선택할 수도 있습니다.

A screenshot depicting how you can toggle between histograom views

검사하려는 다른 황금 신호 간에 전환할 수 있습니다.

CPU 히스토그램을 보면 모든 호스트의 CPU %가 오전 11시 30분경에 급증한 것을 볼 수 있습니다. 이 CPU 변경이 최근 배포와 동시에 발생했음을 확인할 수도 있습니다. 배포 마커를 클릭하면 변경 사항을 발표한 사람과 해당 변경 사항이 무엇인지 알려줍니다.

A screenshot depicting a CPU alert event that corresponds to a deployment marker.

특정 호스트에 대해 자세히 알아보기

이제 최근 구현, Billing Service 구성의 배포로 인해 오류가 급증하고 중요한 Apdex 공지 이벤트가 발생했다는 사실을 알았으므로 더 명확하게 하기 위해 특정 호스트를 살펴보는 것이 좋습니다. 검사하려는 호스트 이름을 클릭하세요. 그러면 Infrastructure 페이지에서 모든 관련 정보를 가져오는 사이드바가 표시됩니다. 이를 통해 나머지 데이터를 그대로 둔 채 호스트 및 서비스 오류와 관련된 필요한 모든 정보에 액세스할 수 있습니다.

A gif depicting a deeper inspection of a host with critical alert events

APM 요약 페이지를 떠나지 않고 호스트를 검사하십시오.

이제 APM 및 인프라 모니터링으로 문제를 해결하는 방법을 알았으므로 APM 및 인프라 데이터를 통합하고 실행하는 방법을 살펴보겠습니다.

APM 및 인프라 데이터에 대한 로그 보기

또한 로그와 애플리케이션의 데이터를 함께 가져와 더 쉽고 빠르게 문제를 해결할 수 있습니다. 컨텍스트의 로그를 사용하면 앱의 UI에서 직접 오류 및 추적과 관련된 로그 메시지를 볼 수 있습니다. Kubernetes 클러스터와 같은 인프라 데이터 컨텍스트에서 로그를 볼 수도 있습니다. 다른 UI 페이지로 전환할 필요가 없습니다.

애플리케이션 데이터로 필터링

및 인프라 데이터가 연결되면 검사하려는 특정 애플리케이션을 검색하여 표시된 호스트 데이터를 필터링할 수 있습니다. 위의 경우 Billing Service(를) 필터링하려고 합니다.

A screenshot showing you how to filter the infrastructure page by application

인벤토리 및 이벤트 UI 페이지의 APM 데이터

및 인프라 데이터가 연결되면 인프라 모니터링 UI의 Inventory 페이지 및 Events 페이지 에서 애플리케이션 데이터를 보고 필터링할 수 있습니다.

누락된 APM 데이터 문제 해결

APM/인프라 통합은 에이전트와 배포 에이전트가 모두 동일한 호스트에 설치되어 있고 동일한 또는 동일한 조직의 인스턴스 키 쌍을 사용하고 동일한 경우 자동으로 발생해야 합니다. 호스트명 세트.

인프라 모니터링에 APM 데이터가 표시되지 않으면 문제 해결을참조하십시오.

사용자의 편의를 위해 제공되는 기계 번역입니다.