Com o passar do tempo, seu número de alertas aumentará. Isso pode causar problemas para sua organização se não forem gerenciados corretamente. Além disso, seu alerta lhe dará informações cruciais que você pode usar para melhorar seu sistema e, se você não aproveitar essas informações, não usará seu alerta em todo o seu potencial.
Você pode descobrir como gerenciar a qualidade do seu alerta para evitar situações como excesso de alertas e também como usar para coletar dados e gerar um impacto positivo em sua organização seguindo o processo abaixo.
Otimize seu alerta
Reduzir alertas desnecessários ajuda a garantir que os alertas recebidos sejam os mais relevantes. Criamos um dashboard de gerenciamento de qualidade de alerta para facilitar isso. Basicamente, você instalará um dashboard, coletará informações e, em seguida, fará alterações com base nas informações coletadas. Descrevemos cada etapa deste processo para facilitar a obtenção dos resultados desejados com seu alerta.
Para começar a otimizar seu alerta, você precisa fazer o seguinte:
Instale o dashboard AQM
Acesse a página de observabilidade instantânea
.
Clique em
Install now
.
Escolha uma conta para instalar o dashboard .
Visualize seu dashboard.
Analise seus KPIs
O dashboard ajudará você a entender como está seu desempenho usando quatro KPIs (principais indicadores de desempenho):
Incident count
: alerta com elevado número de incidentes
Accumulated incident time
: alerta com durações cumulativas altas
Mean time to close
: a quantidade de tempo que leva até que o incidente seja encerrado
Percent under 5 minutes
: a quantidade de incidente aberto por menos de 5 minutos
O painel Alerting Count by Policy no dashboard ajuda a identificar essas políticas de alertas e a determinar quaisquer padrões relevantes.
Estabeleça sua linha de base
O dashboard AQM fornece uma baseline de KPIs que você pode usar para iniciar o processo de melhoria. Você (e qualquer pessoa da sua equipe) pode revisar as políticas mais ativas da etapa anterior para reduzir o ruído de alerta. Faça perguntas a si mesmo sobre o que os dados estão dizendo e como você pode corrigi-los, como:
O alerta está nos dizendo algo sobre um recurso que precisa ser consertado? Nesse caso, corrija o problema e veja se o volume do alerta diminui.
O alerta está nos informando sobre algo que realmente requer uma resposta imediata? Caso contrário, ajuste ou desative a política.
O limite da política está definido corretamente? Caso contrário, considere ajustar o limite.
Você deve lidar com o incidente alerta usando as seguintes diretrizes após estabelecer sua linha de base:
- Se você observar um alerta e decidir tomar qualquer tipo de ação investigativa adicional, reconheça o alerta.
- Se você normalmente fecha um alerta sem fazer mais nada, não reconheça o alerta.
- Se o alerta de incidente estiver sempre ativado, não o feche nem o reconheça.
Reúna seus dados
Leva algum tempo para acumular seus dados de alerta no dashboard. Você deve esperar pelo menos duas semanas para coletar esses dados, mas verifique regularmente para garantir que os respondentes do seu alerta estejam seguindo as diretrizes descritas na etapa anterior.
Verifique seus dados em relação à sua linha de base
Após duas semanas, você deverá ter dados suficientes para analisar e iniciar seu processo de melhoria de alerta. Para melhorar seu sistema usando os dados de alerta, siga as etapas abaixo:
- Analise as tendências semanais em seus KPIs. Encontre as áreas que você pode precisar corrigir e comece a encontrar maneiras de melhorá-las.
- Use os dados para mapear a qualidade atual do seu alerta. Você pode identificar áreas onde as melhorias impactaram positivamente os negócios e áreas onde os problemas resultaram em resultados negativos.
- Use o dashboard para identificar as políticas de incidentes mais barulhentas.
- Revise as políticas identificadas na etapa anterior. Para cada política, tente determinar se o alerta é relevante, está configurado corretamente e o que o alerta informa sobre os problemas que talvez você precise resolver.
- Identifique em quais áreas você pode trabalhar para melhorar as políticas que você revisou. Esta deve ser uma análise técnica e deve terminar com recomendações sobre como corrigir problemas no seu sistema que acionam o alerta, como ajustar políticas que precisam de melhorias ou como corrigir quaisquer lacunas na sua instrumentação.
Depois de concluir o procedimento acima, você estará no caminho certo para usar seu alerta para melhorar seu sistema e causar um impacto positivo em sua organização. Mas isso é apenas o começo: há muito mais possibilidades de usar o alerta do que as que abordamos aqui. Para obter informações mais detalhadas sobre a qualidade do alerta e KPIs, consulte nossos documentos de gerenciamento de qualidade do alerta.