인프라 모니터링 모범 사례 가이드

더욱 오랫동안 방해받지 않고 잠을 자고 싶으신가요? 다음은 뉴렐릭의 피규어 모니터링을 통해 대칭 동작 및 서버 모니터링을 더욱 쉽게 만들어주는 8개의 경쟁 경쟁입니다.

팁

튜토리얼을 찾고 있다면 인프라 호스트 데이터 문제 해결을 위한 연습을 확인하세요. 튜토리얼 시리즈는 인시던트를 해결하고 호스트에 대한 리소스 결정을 내리기 위해 인프라 UI에서 데이터를 찾는 방법을 안내합니다.

1. 전체 환경에 인프라 에이전트 설치

당사의 인프라 모니터링 솔루션은 엔터프라이즈 고객이 동적으로 변화하는 대규모 환경을 대규모로 모니터링할 수 있도록 설계되었습니다. 이를 용이하게 하기 위해 UI는 많은 수의 서버에 대해 집계된 메트릭, 이벤트 및 인벤토리를 시각화할 수 있는 태그로 완전히 구동됩니다. 인프라 모니터링을 최대한 활용하려면 전체 환경, 가급적이면 여러 지역 및 클러스터에 설치하는 것이 좋습니다. 이는 호스트 생태계의 상태와 인프라가 애플리케이션에 미치는 영향에 대한 보다 정확한 그림을 제공합니다.

더 빠른 MTTR(평균 해결 시간)을 원하십니까? 데이터베이스 서버, 웹 서버 및 애플리케이션을 지원하는 기타 호스트에 인프라 에이전트를 설치합니다. 에이전트를 배포할 때 사용자 지정 속성을 활용하여 호스트에 태그를 지정하면 UI에 표시된 데이터를 필터링하고 경고를 설정하는 데 사용할 수 있습니다. 이는 EC2 통합을 활성화할 때 자동으로 가져오는 사용 중인 Amazon EC2 태그에 추가됩니다. 구성을 통해 수행할 수 있는 시스템 로그와 별도로 에이전트 로그를 유지하는 것도 선호할 수 있습니다.

그것을하는 방법

Chef, Puppet 및 Ansible과 같은 구성 관리 도구용 설치 모듈을 활용하여 모든 인프라에 에이전트를 쉽게 배포하십시오.
위의 링크에서 참조된 구성 관리 도구에 대한 github 리포지토리의 지침을 읽고 호스트에 태그를 지정하는 데 사용할 custom_attributes 를 정의하십시오.
인프라 에이전트 로그에 대해 원하는 위치로 log_file 속성을 설정합니다.

팁

단일 호스트에 에이전트를 설치하는 경우 프로세스는 몇 분 밖에 걸리지 않으며 설명서 에서 자세한 지침을 찾을 수 있습니다.

2. 기본 EC2 통합 구성

AWS 환경이 있는 경우 EC2 인스턴스에 인프라 에이전트를 설치하여 모니터링하는 것 외에도 New Relic이 AWS 인스턴스와 연결된 모든 태그 및 메타데이터를 자동으로 가져올 수 있도록 EC2 통합을 구성하는 것이 좋습니다.

이를 통해 동일한 AWS 태그(예: ECTag_Role='Kafka')를 사용하여 인프라의 일부만 필터링하고 여러 가지 방법으로 데이터를 세분화할 수 있습니다. 또한, 우리의 및 부품 필터 보기는 태그 기반 동적이므로 이러한 태그와 일치하는 태그를 자동으로 추가/제거하여 클라우드 콘솔에 맞춰 확장되는 가장 최근 보기를 사용자에게 제공합니다.

3. 통합 활성화

인프라 모니터링은 CPU, 메모리, 스토리지 활용에만 국한되지 않습니다. 그렇기 때문에 뉴렐릭은 호스트를 지원하는 모든 서비스를 모니터링할 수 있는 기본 통합 기능을 제공합니다. AWS CloudWatch, AWS Billing, AWS ELB, MySQL, NGINX 등을 포함한 통합을 활성화하여 AWS 또는 호스트 애플리케이션에 대한 모니터링을 확장하고 각 애플리케이션에 대해 표시되는 사전 구성된 에 액세스하세요.

4. 호스트 그룹 보기 생성

엔터티 필터를 사용하여 유용한 엔터티 보기를 저장할 수 있습니다. 이를 통해 집중된 보기를 사용하여 문제를 사전에 모니터링, 감지 및 해결함으로써 리소스를 최적화할 수 있습니다. 또한 저장된 보기 내에서 색상으로 구분된 각 호스트의 상태를 볼 수 있으므로 인프라에서 문제가 있는 영역을 빠르게 식별할 수 있습니다.

5. 경고 조건 생성

New Relic을 사용하면 모니터링 대상의 컨텍스트 내에서 직접 경고 조건을 생성할 수 있습니다. 예를 들어 많은 수의 호스트로 구성된 저장된 보기를 보고 문제를 발견한 경우 내부의 모든 호스트에 대해 개별 경고 조건을 생성할 필요가 없습니다. 대신 보고 있는 메트릭의 차트에서 직접 경고 조건을 시작하고 필터 태그를 기반으로 생성하는 것이 좋습니다.

이렇게 하면 해당 태그와 일치하는 모든 호스트에 대한 경고 조건이 생성되어 인프라 모니터링이 오프라인으로 전환되는 호스트를 자동으로 제거하고 해당 태그와 일치하는 경우 경고 조건에 새 호스트를 추가할 수 있습니다. 적절한 태그에 대해 한 번 구성된 경고는 향후 모든 호스트에서 올바르게 확장됩니다. 또한 인프라 경고 조건에 대해 기존 경고 정책을 활용할 수도 있습니다.

6. APM 데이터와 함께 인프라 데이터 보기

APM 과 인프라 모니터링 간의 통합을 통해 APM 데이터와 인프라 데이터를 나란히 볼 수 있으므로 문제가 발생한 위치에 관계없이 문제의 근본 원인을 보다 빠르게 찾을 수 있습니다. 이를 통해 사용자는 호스트와 호스트에서 실행되는 애플리케이션의 성능 관계를 볼 수 있으므로 문제를 더 빨리 진단하고 비즈니스 상태에 미치는 영향을 확인할 수 있습니다.

상태 맵을 사용하여 애플리케이션 상태 및 지원 인프라에 연결하는 방법과 관련된 문제 또는 경고를 신속하게 찾아냅니다. 왼쪽 상단에서 시작하는 첫 번째 상자는 주의가 필요한 상자입니다.

7. 메트릭 및 이벤트를 사용하여 인프라 데이터에 액세스

여러 New Relic 기능을 사용하는 팀은 단일 대시보드를 생성하여 인프라의 상태를 애플리케이션, 브라우저 및 합성 지표와 시각적으로 연관시키는 것이 유용하다는 것을 알게 됩니다. 바로 여기에서 데이터 탐색 기능이 제공됩니다. 인프라 모니터링을 통해 수집된 모든 세분화된 데이터는 New Relic에 저장되며 즉시 액세스할 수 있습니다. 원시 메트릭에 액세스할 수 있다는 것은 NRQL을 사용하여 더 많은 사용자 지정 쿼리를 실행할 수 있고 대시보드를 생성하여 팀과 인프라 메트릭을 공유할 수 있음을 의미합니다.

8. 에이전트를 정기적으로 업데이트

New Relic의 소프트웨어 엔지니어링 팀은 전반적인 모니터링 경험을 개선하기 위해 지속적으로 개선 사항과 새로운 기능을 제공하고 있습니다. 우리가 제공하는 모든 기능을 활용 하려면 최신 버전의 인프라 에이전트로 정기적으로 업데이트하는 것이 좋습니다.

더 많은 사용자 팁을 원하십니까?

New Relic University 에서 교육 비디오를 보십시오.
설명서 를 읽으십시오.
튜토리얼을 확인하십시오.
New Relic 지원 포럼 에 질문을 하십시오.

사용자의 편의를 위해 제공되는 기계 번역입니다.