인프라 모니터링 UI에서 Hosts UI 페이지는 인프라 관련 문제를 이해하고 해결할 수 있는 주요 장소입니다.
팁 이 문서에서는 2023년 4월에 추가된 새로운 Hosts UI에 대해 설명합니다. 새 보기와 Classic 보기 간에 전환할 수 있습니다.
one.newrelic.com > All capabilities > Infrastructure
사용 사례 예시 Hosts 페이지는 인프라의 문제를 조사하기 위해 이동하는 곳입니다. 다음은 고객이 문제를 진단하기 위해 사용하는 일반적인 워크플로우의 한 예입니다.
APM 요약 페이지 에서 Kafka 서비스에 문제가 있음을 확인합니다. 처리량이 떨어졌고 많은 오류가 있습니다.
APM에 표시된 인프라 데이터를 토대로 호스트 문제라고 생각하여 클릭하여 인프라
Hosts
페이지로 이동했습니다.
Hosts
페이지는 Kafka 서비스로 자동 필터링됩니다. 해당 서비스를 실행하는 호스트 중 절반이 CPU %를 최대로 사용했음을 알 수 있습니다.
호스트 설정 변경이 문제의 원인일 수 있다고 의심되면
Inventory
탭으로 이동하여 호스트별 시스템 설정을 확인하세요.
호스트 탐색 및 분석을 위한 UI 기능 Hosts UI 전체에서 사용할 수 있는 몇 가지 중요한 UI 기능이 있습니다. 이러한 사용 방법을 이해하면 이 UI를 최대한 활용하는 데 도움이 됩니다.
A.
필터 표시줄: 보고 싶은 호스트를 필터링합니다. 팁을 보려면 필터 막대 를 참조하세요.
B.
저장된 보기: 원하는 보기(필터, 맞춤 차트 및 표 선택 항목 포함 가능)를 생성한 후
Save
클릭합니다.
C.
차트 옵션: 각 차트에 대해 다른 지표로 전환할 수 있으며, ...
클릭하면 공유 가능한 링크 가져오기, 해당 지표에 대한 알림 생성 등 더 많은 차트 옵션을 볼 수 있습니다.
D.
그룹화 기준: 특정 속성별로 차트 결과를 그룹화하는 데 사용합니다. 예를 들어, CPU 사용량이 가장 높은 AWS 지역을 awsRegion
기준으로 그룹화하여 표시할 수 있습니다.
E.
속성 필터: 특정 속성 값을 가진 호스트로 호스트를 필터링할 수 있습니다. 예를 들어,
F.
호스트 테이블: 기본적으로 25개의 호스트가 표시되도록 선택됩니다. 테이블 열과 속성 필터를 사용하여 호스트를 탐색하고 표시할 다른 호스트를 선택합니다. 테이블을 CSV로 내보낼 수 있습니다.
G.
호스트 세부정보: 호스트 테이블의 특정 호스트에 대해
로그 보기, 엔터티 맵 보기 등의 옵션을 포함하여 이에 대해 알아볼 수 있는 추가 옵션을 보려면 아이콘을 클릭하세요.
호스트 UI 페이지의 탭 Hosts UI 페이지에서 사용할 수 있는 탭에 대한 자세한 내용은 다음과 같습니다.
요약 탭 Hosts 페이지의 Summary 탭은 호스트 성능에 대한 개요를 제공합니다.
one.newrelic.com > All capabilities > Infrastructure
이 페이지 상단의 타일은 호스트, 애플리케이션, 이벤트 및 알림에 대한 개요를 제공합니다. 이 타일을 사용하면 호스트에 대한 자세한 내용을 보거나 전체 Summary 페이지를 특정 호스트로 필터링할 수 있습니다.
Summary 페이지의 타임 피커는 지표 타일과 차트만 조정하고 호스트 테이블은 조정 하지 않습니다 . Hosts UI의 다른 탭에는 타임 피커에서 설정한 시간 범위를 반영하는 테이블이 있습니다.
시스템 UI System 탭에서는 시스템 개요를 제공합니다. 이는 Summary 탭과 다소 유사하지만 시스템의 일부 측면에 대한 보다 심층적인 세부정보를 검색할 수 있습니다.
one.newrelic.com > All capabilities > Infrastructure > Hosts > System
다음은 System 페이지에 표시되는 기본 차트입니다.
CPU %
: 이는 SystemSample
이벤트의 다른 여러 지표에서 파생된 지표입니다. 특히, cpuPercent
속성은 cpuUserPercent
, cpuSystemPercent
, cpuIoWaitPercent
및 cpuStealPercent
의 집합입니다.
Load average five minute
: 지난 5분 동안 시스템에서 작업을 대기 중인 평균 작업 수를 나타냅니다.
Memory free %
: 사용 가능한 메모리 바이트의 양과 사용된 메모리 바이트의 양을 비교합니다.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 SystemSample 을 참조하십시오.
네트워크 UI Network 페이지에서는 개별 호스트, 웹 서버 또는 네트워크 전체의 기타 리소스 그룹의 상태와 성능에 대한 실시간 가시성을 제공합니다. 기본 차트에는 패킷별 대역폭 메트릭, 바이트별 대역폭 및 초당 오류가 표시됩니다.
one.newrelic.com > All capabilities > Infrastructure > Hosts > Network
개별 인터페이스에 대한 세부 정보는 다음을 수행하는 데 도움이 될 수 있습니다.
네트워크 전체 또는 선택한 호스트의 포화 수준을 검사합니다.
특정 리소스 간의 부하 분산을 비교합니다.
유사한 호스트 간의 용량 패턴에서 예상치 못한 차이를 식별합니다.
감지된 상위 5개 네트워크 오류를 평가합니다.
이 실시간 네트워크 데이터는 구매 결정을 내리기 전에 네트워크를 재구성하거나 부하를 재조정하거나 기타 예방적 유지 관리 조치를 취하여 오류를 해결할지 여부를 결정하는 데 도움이 될 수 있습니다.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 NetworkSample 을 참조하십시오.
프로세스 UI 호스트에서 실행 중인 프로세스에 대한 정보를 얻고 프로세스 지표에 대한 알림을 설정하려면 Processes 탭을 사용하세요. Processes 탭에는 개별 프로세스나 프로세스 그룹에 대한 CPU 비율, I/O 바이트, 메모리 사용량과 같은 데이터가 표시됩니다.
one.newrelic.com > All capabilities > Infrastructure > Hosts > Processes
Processes 탭에서 CPU 비율은 호스트가 아닌 개별 프로세스로 범위가 지정됩니다. 이로 인해 CPU 백분율 메트릭은 전체 시스템의 리소스를 고려하지 않습니다. 대신 각 프로세스가 차지하는 단일 CPU 코어의 양을 보여줍니다.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 ProcessSample 을 참조하십시오.
다음은 문제를 정확히 찾아내고 경고를 설정하는 방법의 예입니다.
Hosts
페이지에서 클러스터의 CPU 비율이 평소보다 훨씬 높다는 것을 알 수 있습니다.
Processes
페이지로 이동하여 해당 클러스터의 프로세스를 필터링합니다.
동일한 프로세스의 여러 인스턴스에 과도한 CPU 백분율이 있음을 알 수 있습니다.
문제를 수정한 후 해당 프로세스 유형에 대한 CPU 백분율이 특정 임계값을 초과할 때 트리거되는 경고 조건을 생성하기로 결정합니다.
스토리지 UI one.newrelic.com > All capabilities > Infrastructure > Hosts > Storage
Storage 탭을 사용하면 기기의 전체 사용률, 디스크 사용량 또는 I/O 작업을 포함하여 리소스의 용량과 효율성을 모니터링할 수 있습니다. 이는 다음을 수행하는 데 도움이 될 수 있습니다.
예상치 못한 패턴을 조사하십시오. 예를 들어 I/O 작업을 균일하게 처리하지 않는 미러링된 시스템의 클러스터입니다.
디스크 공간이 완전히 소진되기 전에 사용량 수준을 모니터링하십시오.
하나 이상의 호스트에 문제가 있는 경우 알림 조건을 설정합니다. 예를 들어 읽기 또는 쓰기 작업을 위한 긴 처리 시간, 백분율 또는 바이트를 기반으로 한 디스크 가용성 또는 사용률 등
일반 처리 요청보다 높거나 낮은 호스트를 재배포할 위치에 대해 정보에 입각한 결정을 내립니다.
비상 사태가 발생하기 전에 데이터를 사용하여 인프라 예산에 대한 추가 또는 변경 계획을 세우십시오.
이러한 차트를 생성하는 데 사용되는 데이터에 대한 자세한 내용은 StorageSample 을 참조하십시오.
컨테이너 호스트에서 실행 중인 컨테이너에 대한 정보를 얻고 컨테이너 지표에 대한 알림을 설정하려면 Containers 탭을 사용하세요. 이 탭에는 개별 컨테이너 또는 컨테이너 그룹에 대한 CPU 비율, I/O 바이트, 메모리 사용량과 같은 데이터가 표시됩니다. 이 정보를 사용하여 다음을 수행하십시오.
인프라 데이터 인프라 데이터에 대해 자세히 알아보려면 인프라 데이터를 참조하십시오.