• /
  • EnglishEspañolFrançais日本語한국어Português
  • EntrarComeçar agora

Esta tradução de máquina é fornecida para sua comodidade.

Caso haja alguma divergência entre a versão em inglês e a traduzida, a versão em inglês prevalece. Acesse esta página para mais informações.

Criar um problema

Nível 1 - Regra do placar de ruído de alerta

O ruído de alerta ocorre quando os sistemas de monitoramento geram muitos alertas, dificultando a identificação de problemas reais. Esta regra do scorecard ajuda você a identificar políticas que criam alertas excessivos para que você possa se concentrar em problemas reais.

Sobre esta regra do scorecard

Esta regra de ruído de alerta faz parte do Nível 1 (Reativo) no modelo de maturidade do tempo de operação do negócio. Ele ajuda você a identificar políticas de alerta que geram muitos incidentes, o que pode sobrecarregar sua equipe e mascarar problemas críticos.

Por que isso é importante: o excesso de alertas reduz o tempo de resposta e pode fazer com que as equipes deixem de identificar problemas realmente críticos. Equipes que recebem muitos alertas geralmente ficam insensíveis e podem ignorar ou atrasar respostas a problemas legítimos.

Como funciona esta regra

Esta regra avalia incidentes ao longo de um período de 7 dias para identificar políticas de alerta que geram mais de 14 incidentes durante esse período. Esse limite representa aproximadamente 2 incidentes por dia, o que a maioria das equipes consegue lidar efetivamente sem sofrer excesso de alertas.

Compreendendo sua pontuação

  • Aprovado (Verde): Nenhuma política de alertas gerou mais de 14 incidentes nos últimos 7 dias
  • Falha (Vermelho): Uma ou mais políticas excederam o limite de 14 incidentes
  • destino: Todas as políticas de alerta devem gerar volumes de incidentes gerenciáveis aos quais sua equipe possa responder com eficácia

O que isso significa para sua equipe:

  • Nota de aprovação: suas políticas de alerta estão bem ajustadas e gerando alertas acionáveis
  • Pontuação negativa: algumas políticas podem ser muito sensíveis ou precisar de ajustes para reduzir falsos positivos

Como reduzir o ruído de alerta

Se sua pontuação indicar ruído de alerta excessivo, siga estas etapas para otimizar sua política de alertas:

1. Identificar políticas problemáticas

  1. Revise as políticas com falhas: veja quais políticas específicas desencadearam mais de 14 incidentes
  2. Analisar padrões de incidentes: verificar se os incidentes ocorrem em intervalos regulares ou durante condições específicas
  3. Avalie a validade do incidente: determine se os incidentes representam problemas genuínos que exigem atenção

2. Otimize a condição do alerta

Ajustar limite:

  • Aumente os valores limite para reduzir a sensibilidade se os alertas forem acionados em flutuações normais
  • Use limite baseado em porcentagem em vez de valores absolutos quando apropriado
  • Considere a faixa operacional normal dos seus sistemas

Modificar janelas de avaliação:

  • Prolongue a janela de tempo para evitar alertas sobre picos temporários
  • Use períodos de avaliação mais longos para métricas que flutuam naturalmente

Implemente uma detecção mais inteligente:

  • Considere usar detecção de anomalias em vez de limite estático
  • Use comparações baseline para métrica com padrões previsíveis

3. consolidar e agilizar alertas

  • Condições relacionadas ao grupo: Combine diversas condições do alerta relacionadas em uma única política
  • Use correlação de alerta: configure regras para agrupar incidentes relacionados e reduzir notificações duplicadas
  • Priorizar alertas críticos: garantir que os alertas de alta prioridade sejam claramente diferenciados dos informativos

4. Valide suas alterações

Após fazer os ajustes:

  1. Monitore o volume de incidentes pelos próximos 7 dias
  2. Verifique se problemas legítimos ainda estão sendo detectados
  3. Confirme se sua equipe pode responder efetivamente aos alertas restantes

Medindo a melhoria

Monitore essas métricas para verificar se seus esforços de otimização de alerta estão funcionando:

  • Volume de incidentes reduzido: Menos incidentes totais gerados por sua política de alertas
  • Tempo de resposta aprimorado: as equipes podem responder mais rápido quando os alertas são mais focados
  • Maior confiança nos alertas: os membros da equipe confiam nos alertas e respondem adequadamente
  • Menos falsos positivos: incidentes que exigem ação genuína em vez de demissão

Cenários e soluções comuns

Alertas de alta frequência e baixo impacto:

  • Problema: alertas disparam em pequenas flutuações métricas
  • Solução: Aumente o limite ou use janelas de avaliação mais longas

Alertas em cascata:

  • Problema: Um problema aciona vários alertas relacionados
  • Solução: Implementar correlação de alerta ou criar alertas baseados em dependência

Padrões sazonais ou previsíveis:

  • Problema: alertas disparam durante períodos de maior movimento
  • Solução: Use linha de base dinâmica ou condição do alerta baseada em tempo

Considerações importantes

  • Equilibre a sensibilidade com o ruído: garanta que a redução do ruído não elimine a detecção de problemas genuínos.
  • Revisão regular: as políticas de alerta devem ser revistas e ajustadas à medida que os seus sistemas evoluem
  • Feedback da equipe: envolva sua equipe de resposta na avaliação da eficácia do alerta
  • Limite personalizado: o limite de 14 incidentes pode precisar de ajuste com base no tamanho da sua equipe e na capacidade de resposta.

Próximos passos

  1. Ação imediata: abordar quaisquer políticas que atualmente não cumpram esta regra
  2. Monitoramento contínuo: revise esta regra do scorecard semanalmente para detectar novas fontes de ruído de alerta
  3. Avance para o Nível 2: Uma vez que o ruído de alerta esteja sob controle, concentre-se em práticas de monitoramento proativo

Para obter orientações adicionais sobre a otimização do alerta, consulte nosso guia de implementação do Alert Quality Management.

Copyright © 2025 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.