팁
NRQL 조건 안내 모드는 인프라 "호스트 비보고"(HNR) NRQL 조건을 생성하기 위한 큐레이션된 경험을 제공합니다. 이는 인프라 "호스트 보고 없음" 조건을 생성하는 것보다 선호되는 대안입니다.
인프라 에이전트로부터 데이터 수신이 중단되면 알림을 받으려면 인프라 모니터링의 Host not reporting 조건을 사용하세요. 이를 통해 호스트 그룹에 대해 동적으로 공지하고, 기능 기능을 5-60분으로 구성하고, 공지를 최대한 활용할 수 있습니다.
특징
가장 중요한 호스트 집합을 기반으로 조건을 정의하고, 필터링된 각 호스트 집합에 적합한 청년 값을 구성할 수 있습니다. 인프라 에이전트의 데이터가 지정한 시간 내에 수집기에 도달하지 않으면 Host not reporting 이벤트가 트리거됩니다.
주의
태그 또는 레이블을 사용하여 Host Not Reporting
조건을 필터링한 다음 대상 호스트에서 중요한 태그 또는 레이블을 제거한 경우 시스템은 해당 호스트가 연결이 끊어진 것으로 특성화하므로 호스트 보고 안 함 사건을 엽니다.
이 기능의 유연성을 통해 모니터링 대상과 선택한 개인 또는 팀에 통지할 시기를 쉽게 사용자 지정할 수 있습니다. 또한 이메일 알림에는 상황을 신속하게 해결하는 데 도움이 되는 링크가 포함되어 있습니다.
Host not reporting condition | Features |
---|---|
모니터링 대상 | 엔터티 필터 표시줄을 사용하여 경고 조건으로 모니터링할 호스트를 선택할 수 있습니다. 이 조건은 이러한 필터와 일치하는 나중에 추가하는 모든 호스트에도 자동으로 적용됩니다. |
통지하는 방법 | 조건은 정책 에 포함되어 있습니다. 인프라 모니터링 UI에서 이메일 알림으로 기존 정책을 선택하거나 새 정책을 생성할 수 있습니다. 다른 유형의 알림 채널 로 새 정책을 만들려면 UI를 사용하십시오. |
통지할 때 | 정책의 인시던트 기본 설정 에 따라 적용한 필터와 일치하는 모든 호스트의 임계 값 인시던트에 대해 이메일 주소(정책에서 식별됨)에 자동으로 통지됩니다. |
문제 해결 위치 | 공지 이메일 상단의 링크를 누르면 호스트 연결이 끊어진 시간을 중심으로 장식품 Events 페이지 로 이동됩니다. 이메일에 포함된 추가 링크를 통해 추가 세부정보를 확인할 수 있습니다. |
"호스트가 보고하지 않음" 조건 생성
Host not reporting 조건 기준을 정의하려면 다음을 수행하십시오.
표준 절차에 따라 기반 시설 조건을 만드 십시오.
Alert type 로 Host not reporting 선택합니다.
공지를 트리거하기 위한 Critical 레버 값을 정의합니다: 최소 5분, 최대 60분.
명령줄을 통해 호스트를 종료하도록 설정한 경우 잘못된 알림이 전송되는 것을 방지하려면 Don't trigger alerts for hosts that perform a clean shutdown 옵션을 활성화하세요. 현재 이 기능은 systemd를 사용하는 모든 Windows 시스템과 Linux 시스템에서 지원됩니다.
팁
또한, 위에서 언급한 옵션을 체크하는 것과 함께 호스트에hostStatus: shutdown
태그를 추가할 수 있습니다. 이렇게 하면 에이전트 버전이나 OS에 관계없이 태그가 있는 한 해당 호스트에 대한 모든 Host not reporting 인시던트가 열리지 않습니다. 태그를 제거하면 시스템이 해당 호스트에 대한 Host not reporting 인시던트를 다시 열 수 있습니다.팁
hostStatus: shutdown
태그 대신 호스트 엔터티에termination: expected
태그를 추가할 수 있습니다. 이는 New Relic에게 호스트가 종료될 것으로 예상되었으며 Don't trigger alerts for hosts that perform a clean shutdown [완전한 종료를 수행하는 호스트에 대해 경고를 트리거하지 않음]을 수행하는 한 모든 Host not reporting [호스트가 보고하지 않음] 사고가 열리는 것을 중지함을 알려줍니다. Strong> 옵션이 조건에서 선택되었습니다.
정책의 인시던트 기본 설정 에 따라 조건에 대해 정의된 Critical 주니어 값, 참조가 통과될 때 사용할 공지 채널을 정의합니다. '오탐'을 방지하려면 호스트는 인시던트가 개설되기 전 전체 기간 동안 신고를 중단해야 합니다.
Example: 필터링된 호스트 집합 중 하나라도 seven 분 동안 데이터 보고를 중지하면 인시던트를 개시하는 조건을 생성합니다.
- 호스트가 5분 동안 보고를 중지한 후 보고를 재개하면 조건 does not 이 인시던트를 엽니다.
- 호스트가 7분 동안 보고를 중지하면 다른 호스트는 괜찮더라도 조건 does 이 인시던트를 시작합니다.
문제 조사
호스트가 데이터를 보고하지 않는 이유를 자세히 조사하려면 다음을 수행하십시오.
- 이메일 알림의 세부정보를 검토하세요.
- 전자 메일 공지의 링크를 사용하여 어셈블리 의 Events 페이지 에서 환경의 진행 중인 변경 UI 사항을 모니터링할 수 있습니다. 예를 들어, Events 페이지를 사용하면 루트 사용자가 호스트에 대한 설정을 변경한 직후 호스트 연결이 끊어졌는지 확인하는 데 도움이 됩니다.
- 선택 사항: 이메일 공지의 Acknowledge 링크를 사용하여 알림 인시던트를 인지하고 있으며 이에 대한 소유권을 갖고 있는지 확인하세요.
- 이메일 링크를 사용하여 Incident details 페이지 의 추가 세부정보를 검토하세요.
의도적 중단
Don't trigger alerts for hosts that perform a clean shutdown 옵션을 사용하면 예상치 못한 상황과 계획된 상황을 구분할 수 있습니다. 다음과 같은 상황에서는 이 옵션을 사용하십시오.
- 호스트가 의도적으로 오프라인 상태가 되었습니다.
- 호스트가 유지 관리를 위해 계획된 가동 중지 시간이 있습니다.
- 호스트가 종료되었거나 폐기되었습니다.
- 호스트를 자동 확장하거나 클라우드 콘솔에서 인스턴스를 종료합니다.
우리는 완전한 종료를 표시하기 위해 Linux 및 Windows 종료 신호에 의존합니다.
에이전트가 다음 시나리오를 감지했음을 확인했습니다.
- systemd를 사용하는 EC2 인스턴스의 AWS Auto-scaling 이벤트(Amazon Linux, CentOs/RedHat 7 이상, Ubuntu 16 이상, Suse 12 이상, Debian 9 이상)
- Windows 시스템의 사용자 시작 종료
- systemd를 사용하는 Linux 시스템의 사용자 시작 종료(Amazon Linux, CentOs/RedHat 7 이상, Ubuntu 16 이상, Suse 12 이상, Debian 9 이상)
에이전트가 다음 시나리오를 감지 하지 못한다 는 것을 알고 있습니다.
- systemd를 사용하지 않는 Linux 시스템의 사용자 시작 종료(CentOs/RedHat 6 이하, Ubuntu 14, Debian 8). 여기에는 여전히 Upstart 또는 SysV init 시스템을 사용하는 다른 최신 Linux 시스템이 포함됩니다.
- systemd를 사용하지 않는 EC2 인스턴스의 AWS Auto-scaling 이벤트(CentOs/RedHat 6 이하, Ubuntu 14, Debian 8). 여기에는 여전히 Upstart 또는 SysV init 시스템을 사용하는 다른 최신 Linux 시스템이 포함됩니다.