시간이 지남에 따라 알림 수가 증가합니다. 제대로 관리되지 않으면 조직에 문제가 발생할 수 있습니다. 또한 경고는 시스템을 개선하는 데 사용할 수 있는 중요한 정보를 제공하며 해당 정보를 활용하지 않으면 경고를 최대한 활용할 수 없습니다.
알림 피로 등을 방지하기 위해 알림 품질을 관리하는 방법과 사용 방법을 알아볼 수 있습니다. 아래 프로세스에 따라 데이터를 수집하고 조직에 긍정적인 영향을 미치세요.
알림 최적화
불필요한 알림을 줄이면 수신하는 알림이 가장 관련성이 높은 알림인지 확인하는 데 도움이 됩니다. 이를 쉽게 하기 위해 경고 품질 관리 대시보드를 만들었습니다. 기본적으로 대시보드를 설치하고 정보를 수집한 다음 수집한 정보를 기반으로 변경합니다. 알림에서 원하는 결과를 보다 쉽게 얻을 수 있도록 이 프로세스의 각 단계를 설명했습니다.
알림 최적화를 시작하려면 다음을 수행해야 합니다.
AQM 대시보드 설치
- Alert Quality Management[경고 품질 관리] 즉시 관찰 가능성 페이지로 이동합니다.
- Install now [지금 설치를]클릭합니다.
- 대시보드를 설치할 계정을 선택하세요.
- 대시보드를 봅니다.
KPI 분석
대시보드는 4가지 KPI(핵심 성과 지표)를 사용하여 어떻게 하고 있는지 이해하는 데 도움이 됩니다.
Incident count [사건 수]: 사건 수가 많은 경보
Accumulated incident time [누적 사고 시간]: 누적 지속 시간이 높은 경보
Mean time to close [종료까지의 평균 시간]: 인시던트가 종료될 때까지 걸리는 시간
Percent under 5 minutes [5분 미만 백분율]: 5분 미만 동안 열린 인시던트의 양
대시보드의 Alerting Count by Policy [정책별 경고 수] 창은 이러한 경고 정책을 식별하고 관련 패턴을 결정하는 데 도움이 됩니다.
기준선 설정
AQM 대시보드는 개선 프로세스를 시작하는 데 사용할 수 있는 KPI의 기준을 제공합니다. 귀하(및 귀하의 팀 구성원)는 이전 단계에서 가장 활성화된 정책을 검토하여 경고 소음을 줄일 수 있습니다. 데이터가 알려주는 내용과 데이터를 수정할 수 있는 방법에 대해 다음과 같은 질문을 해보세요.
경고가 수정해야 하는 리소스에 대해 알려줍니까? 그렇다면 문제를 해결하고 경고 볼륨이 감소하는지 확인하십시오.
경고가 실제로 즉각적인 응답이 필요한 사항에 대해 알려줍니까? 그렇지 않은 경우 정책을 조정하거나 비활성화합니다.
정책 임계값이 올바르게 설정되어 있습니까? 그렇지 않은 경우 임계값 조정을 고려하십시오.
기준선을 설정한 후 다음 지침을 사용하여 사건 경보를 처리해야 합니다.
- 경보를 보고 추가 조사 조치를 취하기로 결정한 경우 경보를 확인하십시오.
- 일반적으로 다른 작업을 수행하지 않고 경고를 닫는 경우 경고를 확인하지 마십시오.
- 인시던트 경고가 항상 켜져 있으면 닫거나 확인하지 마십시오.
데이터 수집
대시보드에서 알림 데이터를 누적하는 데 시간이 걸립니다. 이 데이터를 수집하려면 최소 2주를 기다려야 하지만 경보에 대한 사고 대응자가 이전 단계에서 설명한 지침을 따르고 있는지 정기적으로 확인하십시오.
기준선과 비교하여 데이터 확인
2주 후 경고 개선 프로세스를 분석하고 시작하기에 충분한 데이터가 있어야 합니다. 경고 데이터를 사용하여 시스템을 개선하려면 아래 단계를 따르십시오.
- KPI에서 주간 추세를 분석합니다. 수정해야 할 영역을 찾고 이를 개선할 방법을 찾기 시작할 수 있습니다.
- 데이터를 사용하여 알림의 현재 품질을 매핑합니다. 개선이 비즈니스에 긍정적인 영향을 미친 영역과 문제로 인해 부정적인 결과가 발생한 영역을 식별할 수 있습니다.
- 대시보드를 사용하여 가장 시끄러운 인시던트 정책을 식별합니다.
- 이전 단계에서 식별된 정책을 검토합니다. 각 정책에 대해 경고가 관련이 있는지, 적절하게 구성되었는지, 해결해야 할 수 있는 문제에 대해 경고가 무엇을 알려주는지 확인하십시오.
- 검토한 정책을 개선하기 위해 작업할 수 있는 영역을 식별합니다. 이것은 기술적 분석이어야 하며 경고를 트리거하는 시스템 문제를 해결하는 방법, 개선이 필요한 정책을 조정하는 방법 또는 계측의 격차를 해결하는 방법에 대한 권장 사항으로 끝나야 합니다.
위의 절차를 완료하면 경고를 사용하여 시스템을 개선하고 조직에 긍정적인 영향을 줄 수 있습니다. 하지만 이것은 시작에 불과합니다. 여기에서 다룬 것보다 훨씬 더 많은 경고 사용 가능성이 있습니다. 알림 품질 및 KPI에 대한 자세한 내용은 알림 품질 관리 문서 를참조하세요.