Detección de anomalías

La detección de anomalías le permite a su equipo la mayor versatilidad al detectar comportamientos inusuales en su sistema. La detección de anomalías le brinda a su equipo la capacidad de alertar sobre cualquier entidad o señal y ajustar y optimizar su umbral de sensibilidad. La detección de anomalías utiliza el mismo canal de alertas de transmisión que las alertas umbral estáticas y comparte la misma configuración de ajuste avanzada. Esto garantiza que el procesamiento de la transmisión esté alineado con las características de su señal de telemetría para reducir las alertas falsas.

Puede enriquecer su configuración de detección de anomalías con metadatos adicionales para proporcionar más contexto y agregar descripciones personalizadas de eventos de alerta que brinden instrucciones adicionales a sus ingenieros de guardia. De forma predeterminada, las condiciones de anomalía aprovechan la detección automática de estacionalidad de New Relic. Alternativamente, puede establecer una configuración de estacionalidad personalizada.

Configurar umbral de sensibilidad de anomalía

Puede crear un umbral de sensibilidad de anomalía a partir de una condición de alerta. A continuación se ofrecen algunos consejos para configurar el umbral de anomalía:

Establezca la dirección de la anomalía para monitorear los eventos de alerta que ocurren por encima o por debajo de la anomalía.
Establezca la estacionalidad para especificar un patrón de estacionalidad conocido.
Utilice la barra deslizante para ajustar el umbral de sensibilidad de Critical, representado en el gráfico de vista previa por el área gris claro alrededor de la señal. Cuanto más estrecha sea la banda alrededor de la señal, más sensible será y más eventos de alerta generará.
Puede crear un umbralWarning (el área gris más oscura alrededor de la anomalía).

Siga estos pasos para crear una condición de alerta de detección de anomalías:

Vaya a one.newrelic.com > All capabilities > Alerts > Alert Conditions.
Haga clic en + New alert condition > Use guided mode (o en el modo de consulta más avanzado).
Siga los pasos guiados hasta llegar a Set thresholds.
Seleccione Anomaly.
Seleccione una opción para calcular la estacionalidad de la condición de alerta. Para comprender la estacionalidad y cómo afecta su condición de alerta, consulte Estacionalidad.
Configure los ajustes para uno o más umbrales. La detección de anomalías hace una predicción sobre cuál será el siguiente punto de datos en función de la actividad anterior. El valor umbral para la detección de anomalías controla la sensibilidad de la condición de alerta para tolerar qué tan lejos está el valor real del valor previsto. El umbral es el número de desviación estándar que el valor de su señal está alejado del valor predicho. Realizamos un seguimiento de la desviación estándar entre el valor previsto y el valor real de los datos de los 7 días anteriores.
Para configurar el umbral, necesitará:
- Configura la 'dirección del umbral' en superior, inferior o ambas. Esto significa que solo crearemos un evento de alerta si el valor de la señal (la salida de la consulta) está por encima del valor predicho, por debajo del valor predicho o cualquiera de los dos, respectivamente.
  Este campo determina cuántos de los puntos de datos durante un período de tiempo especificado deben estar fuera del umbral. Las opciones son for at least y at least once in. Seleccionar for at least significa que TODOS los puntos de datos de su señal deben estar fuera del umbral durante el período de tiempo especificado antes de que se abra un evento de alerta. Lo inverso debe ser verdadero para cerrar el evento de alerta. La opción at least once in simplemente significa que tan pronto como cualquiera de los puntos de datos de su señal esté fuera del umbral, se abrirá un evento de alerta. Con esta opción, la duración no es relevante para determinar cuándo abrir un evento de alerta. Sin embargo, es relevante para cerrar eventos de alerta. Todos los puntos de datos de su señal deben estar dentro del umbral durante el período de tiempo especificado
- Establezca la 'duración del umbral'. Considere esto como el tiempo que el valor de la señal debe permanecer fuera del umbral antes de que se abra un evento de alerta. Por el contrario, también es el tiempo que una señal debe estar dentro del umbral para que se cierre un evento de alerta.
  Este campo responde al periodo de tiempo mencionado anteriormente. Es cuánto tiempo la señal excede el umbral que se está definiendo. Esta es la duración del umbral real.
- Establezca el 'nivel umbral'. Para la detección de anomalías personalizada, este es el número de desviación estándar que el punto de datos de la señal es del valor que predijimos que sería.
Agregue los detalles de la condición de alerta y haga clic en Save condition.

Configuración de umbral para condiciones de múltiples señales (consulta facetada)

Dependiendo de cómo definió su consulta en el paso 1, la condición de alerta puede estar monitoreando muchas señales, no solo una. Al trabajar con NRQL, estas consultas emplean la cláusulaFACET . El número máximo de señales que una condición de alerta puede monitorear es 20 000. Los ajustes de umbral que especifique se aplican de la misma manera a todas las señales monitoreadas por esta condición. Cada señal se monitorea y evalúa individualmente, pero las configuraciones se aplican consistentemente a todas las señales. Solo mostraremos un máximo de 500 señales en el gráfico de vista previa. Pero no mostramos las bandas de señal y umbral previstas cuando hay más de una señal mostrada en el gráfico. Para mostrar esa información mientras se determina el valor de umbral ideal, seleccione una de las señales de seriales de tiempo de la leyenda para filtrar el gráfico hasta un solo serial de tiempo.

Dirección de anomalía: seleccione rangos superior o inferior

Puede elegir si desea que la condición busque un comportamiento que supere el valor previsto ("superior") o que vaya por debajo del valor previsto ("inferior"), o que vaya por encima o por debajo. Los eliges con el selector de dirección de predicción.

Casos de uso de ejemplo para esto:

Puede usar la configuración Superior para una fuente de datos como tasa de errores, porque generalmente solo le preocupa si sube y no si baja.
Puede utilizar la configuración Inferior para una fuente de datos como el rendimiento, porque las fluctuaciones repentinas ascendentes son bastante comunes, pero una gran caída repentina indicaría un problema.

A continuación se muestran ejemplos de cómo se tratarían las grandes fluctuaciones en sus datos según las diferentes configuraciones de dirección de anomalías. Las áreas rojas representan eventos de alerta.

A screenshot demonstrating how to select upper and lower ranges for anomalies

Reglas que rigen el cálculo del valor previsto.

El algoritmo para calcular la predicción es matemáticamente complejo. Estas son algunas de las reglas principales que rigen sus capacidades predictivas:

Age of data En la creación inicial, la predicción se calcula utilizando entre 1 y 4 semanas de datos, según la disponibilidad de datos y el tipo de predicción. Actualmente, las consultas que utilizan la cláusula FACET no están entrenadas en datos almacenados. Después de su creación, el algoritmo tiene en cuenta las fluctuaciones de datos en curso durante un largo período de tiempo, aunque se da mayor peso a los datos más recientes. Para datos que han existido por poco tiempo, el valor predicho probablemente fluctuará mucho y no será muy preciso. Esto se debe a que no hay datos suficientes para determinar sus valores y comportamiento habituales. Cuanto más historial tengan los datos, más precisa será la predicción.
Consistency of data Para los valores métricos que permanecen en un rango constante o que tienen una tendencia lenta y constante, su comportamiento más predecible significa que su umbral de sensibilidad se volverá más estricto en torno a la predicción. Los datos que sean más variados e impredecibles tendrán un umbral de sensibilidad más flexible (más amplio).
Regular fluctuations Para fluctuaciones cíclicas de menos de una semana (como el despliegue semanal de los miércoles a la 1:00 p. m. o informes nocturnos), el algoritmo de predicción busca estas fluctuaciones cíclicas e intenta adaptarse a ellas.

Estacionalidad

Para abordar fluctuaciones recurrentes en sus señales, como picos de tráfico entre semana, puede especificar la estacionalidad de una condición. De forma predeterminada, la detección de anomalía calcula automáticamente la estacionalidad de cada señal empleando ** New Relic calculation**. Sin embargo, puede optar por establecer el cálculo de estacionalidad en un valor específico o deshabilitarlo por completo. Las opciones disponibles son:

New Relic calculation (predeterminado): determina automáticamente la estacionalidad de cada señal en función de varios factores, incluida la antigüedad de los datos, la consistencia de los datos y las fluctuaciones regulares.
Ejemplo: Una arquitectura de microservicios dinámica donde monitorea docenas de servicios distintos en una sola condición. Los servicios orientados al usuario podrían experimentar picos de tráfico diarios, mientras que los servicios de trabajo en segundo plano podrían no tener ningún patrón predecible. Esta configuración permite que el sistema se adapte a cada señal específica sin ajuste manual.
Hourly:Aplica un patrón horario a todas las señales dentro de la condición para la detección de anomalía.
Ejemplo: Un servidor que ejecuta un trabajo cron con uso intensivo de recursos al inicio de cada hora, como un script de sincronización de datos por hora o un procesador de colas por lotes. Esta configuración ayuda a detectar anomalías en los patrones de uso de CPU y memoria.
Daily:Aplica un patrón diario a todas las señales dentro de la condición para la detección de anomalías.
Ejemplo: Una aplicación corporativa interna, como un portal de RR. HH. o una intranet, que registra constantemente altas tasas de inicio de sesión a partir de las 8:00 a. m. y cae drásticamente después de las 5:00 p. m. todos los días.
Weekly:Aplica un patrón semanal a todas las señales dentro de la condición de detección de anomalía.
Ejemplo: Una plataforma de software B2B que experimenta un pico de tráfico de lunes a jueves, una caída notable los viernes y un tráfico casi nulo durante el fin de semana.
None:Desactiva la estacionalidad por completo, lo que garantiza que no se consideren patrones estacionales al evaluar señales.
Ejemplo: Un monitor de tasa de errores críticos del sistema, como los HTTP 500 o los tiempos de espera de conexión a la base de datos. Idealmente, estas métricas deberían permanecer en una línea base plana cerca de cero en todo momento. Un pico a las 2:00 PM es una anomalía, independientemente de si también ocurrió ayer a las 2:00 PM.

Sugerencia

La solución actual no admite opciones de estacionalidad mensual y anual debido a limitaciones computacionales, incluidos factores como retención de datos, cálculo y evaluación en tiempo real.