Ao criar uma condição, você define thresholds personalizados que determinam o que abrirá um incidente. Este documento explica o que são limites e como defini-los.
Anomaly: um limite de anomalia usa dados passados para prever dinamicamente o comportamento dos dados no futuro próximo. Isso se ajustará ao longo do tempo à medida que aprende os padrões dos seus dados.
Exemplos de limite:
O tempo médio de resposta da web de um aplicativo é superior a 5 segundos por 15 minutos.
A taxa de erros por minuto de um aplicativo atinge 10% ou mais pelo menos uma vez a cada hora.
O tempo de resposta AJAX de um aplicativo se desvia um pouco do comportamento esperado.
Além de um nível de limite crítico, você também pode definir limites para um nível de alerta menos sério.
Visualize e atualize o limite das condições existentes
Para visualizar o limite de uma condição: encontre essa condição na interface. Para atualizar o limite, selecione o limite de uma condição e faça as alterações.
Para saber mais sobre tipos específicos de condição do alerta (como anomalia e NRQL), consulte Tipos de condições.
Você pode definir limites para dois níveis: crítico e aviso. Pelo menos um limite deve ser definido.
Nível limite
Detalhes
Crítico (vermelho)
Opcional. Ele abrirá um incidente de nível de prioridade crítica e enviará uma notificação dependendo da configuração de preferência de criação de problemas da política e de qualquer fluxo de trabalho que você possa ter configurado. Limite de sinal perdido, quando acionado, também abre incidente de nível de prioridade crítica. Veja abaixo mais detalhes.
Aviso (amarelo)
Opcional. Ele abrirá um incidente de nível de alta prioridade e poderá enviar notificações dependendo da configuração de preferência de criação de problemas da política e de qualquer fluxo de trabalho que você possa ter configurado. Use um limite de aviso se quiser monitor quando um comportamento do sistema é preocupante ou digno de nota, mas não é importante o suficiente para exigir um limite de nível crítico.
Uma perda de sinal é um período de tempo em que nenhum dado é recebido pela New Relic. Isso pode ser o resultado de uma entidade ou serviço ficar off-line, um problema com um agente ou coletor ou problemas de rede em um data center ou na Internet. Você pode usar a detecção de perda de sinal para criar um novo incidente se um sinal parar e você esperar que um serviço seja estável. Você também pode querer usar isso para determinar quando um serviço efêmero é interrompido e definir a ação para fechar qualquer incidente aberto que exista para esta condição.
Talvez você também precise configurar a perda de sinal se estiver usando count(*) ou uniqueCount(*) em sua consulta. Consulte Condições NRQL e ordem de consulta das operações para obter mais detalhes.
Diferentes tipos de condições têm diferentes intervalos de tempo mínimos. Por exemplo, alguns tipos de condição têm um intervalo de tempo mínimo de 5 minutos (por exemplo, condição métrica do alerta) e outros têm um intervalo de tempo mínimo de 1 minuto (por exemplo, NRQL condição do alerta). O mesmo acontece com o intervalo de tempo máximo, onde o valor é de 120 minutos.
Para saber como definir isso por meio da interface do usuário, consulte instruções do Runbook.