• /
  • EnglishEspañolFrançais日本語한국어Português
  • 로그인지금 시작하기

사용자의 편의를 위해 제공되는 기계 번역입니다.

영문본과 번역본이 일치하지 않는 경우 영문본이 우선합니다. 보다 자세한 내용은 이 페이지를 방문하시기 바랍니다.

문제 신고

수준 1 - 중요 알림 적용 범위 스코어카드 규칙

중요 알림 범위는 모니터링 전략에서 중요 알림과 경고 알림 간의 균형을 측정합니다. 이 스코어카드 규칙은 모든 문제에 대해 중요한 알림에 지나치게 의존하지 않도록 하여 공지 사항을 방지하는 데 도움이 됩니다.

이 점수카드 규칙에 관하여

이 중요한 알림 적용 범위 규칙은 비즈니스 업타임 성숙도 모델 의 레벨 1(반응형)의 일부입니다. 귀사의 공지 전략에 중요한 공지와 경고 공지가 적절히 혼합되어 있는지 평가합니다.

이것이 중요한 이유: 중요한 알림이 너무 많으면 팀이 긴급 공지에 둔감해지는 공지 구역으로 이어질 수 있습니다. 균형 잡힌 경보 전략은 팀이 다양한 심각도 수준에 적절하게 대응하는 데 도움이 됩니다.

이 규칙의 작동 방식

이 규칙은 공지 인시던트의 7일 샘플을 분석하여 중요한 공지 조건과 경고 공지 조건에 의해 트리거되는 비율을 계산합니다. 귀하의 계정에 있는 모든 모니터 부분의 비율을 측정합니다.

점수 이해하기

  • 통과(녹색): 알림 중 25% 이하가 중요 알림으로 분류됨
  • 실패(빨간색): 알림의 25% 이상이 중요로 분류됨
  • 구역, 목표: 중요한 알림이 실제 긴급 상황을 나타내는 균형 잡힌 공지 전략을 유지합니다.

이는 무엇을 의미합니까?

  • 합격 점수: 적절한 에스컬레이션 수준을 갖춘 균형 잡힌 경고 전략이 있습니다.
  • 불합격 점수 : 중요한 알림을 과도하게 사용하고 있어 공지사항 발생 및 대응 효율성 저하가 발생할 수 있습니다.

균형 잡힌 정보 전략 구축

잘 설계된 알림 전략에는 세 가지 유형의 알림이 포함되어야 합니다.

즉시 실행 가능한 알림(중요)

  • 목적: 즉각적인 대응이 필요한 비즈니스에 영향을 미치는 이벤트를 나타냅니다.
  • 예: 서비스 중단, 중요 시스템 장애, 보안 침해
  • 응답 시간: 몇 분 이내
  • 응답자: 대기 엔지니어 또는 인시던트 대응 팀

예상통보(경고)

  • 목적: 당장은 비즈니스에 영향을 미치지 않지만 향후 조치가 필요할 수 있는 신호 조건
  • 예: 오류율 증가, 용량 한계 접근, 성능 저하
  • 응답 시간: 몇 시간 이내 또는 영업 시간 중
  • 응답자: 개발팀 또는 시스템 관리자

회고적 알림(정보)

  • 목적: 주기적 분석 및 장기 시스템 최적화를 위한 데이터 제공
  • 예: 주간 성능 요약, 용량 계획 지표, 추세 분석
  • 응답 시간: 예약된 검토 기간 동안
  • 응답자: 계획된 분석 세션 중 운영 팀

중요 알림 적용 범위를 개선하는 방법

점수에 중요 알림이 너무 많다고 나타나면 다음 단계에 따라 전략을 재조정하세요.

1. 현재 알림을 감사하세요

  1. 모든 중요 알림 검토: 현재 중요로 설정된 모든 공지 조건을 나열합니다.
  2. 비즈니스 영향 평가: 중요한 알림마다 "비즈니스에 영향을 미치지 않도록 즉각적인 대응이 필요합니까?"라고 질문합니다.
  3. 다운그레이드 후보 식별: 경고일 수 있는 알림을 찾으세요.

2. 알림을 적절하게 재분류합니다.

다음과 같은 경우 경고로 다운그레이드됩니다.

  • 이 문제는 고객에게 즉시 영향을 미치지 않습니다.
  • 응답은 영업시간까지 기다릴 수 있습니다.
  • 공지는 잠재적 문제에 대한 조기 경고를 제공합니다.
  • 수동 개입이 긴급히 필요하지 않습니다.

다음과 같은 경우 중요 사항으로 간주합니다.

  • 고객 대면 서비스가 제공되지 않습니다.
  • 데이터 손실이나 보안 문제가 발생
  • 수익 창출 시스템 실패
  • 즉각적인 조치로 연쇄 실패를 방지합니다.

3. 점진적 알림 구현

공지 에스컬레이션 경로 생성:

  1. 레벨 관련 지표에 접근하면 경고 공지가 먼저 발생합니다.
  2. 상황이 악화되거나 지속되면 중요 알림이 표시됩니다.
  3. 시간 기반 에스컬레이션을 사용하여 팀이 에스컬레이션 전에 대응할 수 있도록 합니다.

에스컬레이션 예시:

  • 경고: 5분 동안 응답 시간 > 2초
  • 중요: 2분 동안 응답 시간이 5초 이상인 경우 또는 경고가 30분 동안 지속되는 경우

4. 변경 사항 검증

알림을 재분류한 후:

  1. 놓친 문제를 모니터링하세요. 중요한 문제가 여전히 감지되는지 확인하세요.
  2. 응답 시간 측정: 팀이 다양한 심각도 수준에 적절하게 대응하는지 확인
  3. 팀 피드백 수집: 응답자에게 새로운 분류가 적절하다고 생각되는지 물어보세요.

개선 측정

다음 지표를 추적하여 공지 재조정 노력을 확인하세요.

  • 중요 알림 비율: 25%를 향해 감소해야 함, 목표
  • 대응 효과: 팀은 정말 긴급한 알림에 더 빨리 대응해야 합니다.
  • 공지사항 축소 : 공지분류에 대한 신뢰도 조사팀원들
  • 인시던트 감지 범위: 중요한 문제를 조기에 포착하고 있는지 확인하세요.

일반적인 시나리오 및 솔루션

중요로 표시된 모든 항목:

  • 문제: 팀은 주의를 끌기 위해 모든 알림을 중요 알림으로 표시합니다.
  • 해결책: 중요 및 경고 분류에 대한 명확한 기준을 설정하고 적절한 사용에 대한 팀 교육을 실시합니다.

중요한 문제를 놓칠까봐 두려워요:

  • 문제: 팀은 경고 알림이 무시될까봐 걱정합니다.
  • 해결책: 정기적인 경고 검토를 위한 프로세스를 만들고 다양한 심각도 수준에 대한 SLA를 설정합니다.

휴게소 공지 설정:

  • 문제: 이전 알림은 심각도 수준을 고려하지 않고 설정되었습니다.
  • 솔루션: 모든 기존 알림에 대한 체계적인 감사를 수행하고 현재 비즈니스 영향에 따라 재분류합니다.

25% 레버값을 조정해야 하는 경우

기본 25% 레버 값은 대부분의 조직에서 작동하지만 다음과 같은 경우 조정해야 할 수도 있습니다.

  • 더 높은 비율 허용 가능: 귀하의 조직은 주로 중요한 생산 시스템을 모니터링합니다.
  • 더 낮은 백분율이 필요합니다. 개발 및 스테이징 환경을 포함한 광범위한 모니터링이 필요합니다.
  • 산업 요구 사항: 규제 또는 준수 요구 사항에 따라 다양한 경고 전략이 필요합니다.

중요한 고려 사항

  • 비즈니스 맥락이 중요합니다. 중요 알림은 비즈니스 우선순위와 고객 영향에 맞춰야 합니다.
  • 팀 역량: 다양한 공지 볼륨 및 심각도에 대응할 수 있는 팀의 역량을 고려하세요.
  • 에스컬레이션 절차: 다양한 공지 유형에 대해 명확한 에스컬레이션 경로가 있는지 확인하십시오.
  • 정기 검토: 공지 분류는 시스템 및 비즈니스 우선순위가 변경됨에 따라 발전해야 합니다.

다음 단계

  1. 즉각적인 조치: 현재 점수 실패에 영향을 미치는 모든 알림을 검토하고 재분류합니다.
  2. 지속적인 모니터링: 균형 잡힌 경고를 유지하려면 이 점수표 규칙을 매주 확인하세요.
  3. 2단계 진출 : 공지 취재가 최적화된 후 선제적인 모니터링 실천에 집중

공지 전략에 대한 포괄적인 지침은 공지 품질 관리 구현 가이드를 참조하세요.

Copyright © 2025 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.