Después de crear sus SLI, puede utilizarlos para mejorar periódicamente su sistema de muchas maneras diferentes. A continuación, verá cómo utilizar sus SLI en muchas áreas diferentes de la plataforma New Relic.
Seguimiento de sus objetivos de nivel de servicio
Debes tratar el nivel de servicio como una práctica recurrente, al igual que las pruebas, las alertas, los días de juego y otros. Podría considerarlos como una herramienta que utiliza para medir la "salud" de sus sistemas. Pero como todas las herramientas, el nivel de servicio requiere calibración.
Incluya la práctica del nivel de servicio en el proceso de su equipo. Recomendamos lo siguiente según nuestra experiencia en el uso de nivel de servicio, y debe ajustarlos a los requisitos específicos de su equipo:
Haga una revisión periódica del nivel de servicio y preste mucha atención a:
¿Los SLI reflejan incidentes y páginas?
¿Cuál es su presupuesto de errores para una semana?
- Si es demasiado bajo, investigue qué causó la caída, usando la característica "Analizar" para encontrar el evento malo que la causó.
- Si es 100%, asegúrese de que su indicador sea correcto y que el SLO sea lo suficientemente agresivo. Estar al 100 % indica que el SLO es demasiado seguro.
- Cuál es la tendencia que observas en varios periodos de tiempo (1d/7d/28d).
Esté atento a los SLI durante los días de juego. Los SLI deben reflejar el impacto, tal como lo hace su alerta.
Cuando tenga una caída en el presupuesto de errores en producción, evalúe por qué no sucedió en la prueba.
Valor de negocio
En última instancia, la administración a nivel de servicio se centra en reducir el costo de los incidentes que afectan el negocio. Sin embargo, el nivel de servicio también lo ayuda a cuantificar la pérdida de ingresos estimada durante el incidente, así como los ingresos estimados en riesgo para las empresas basadas en suscripción.
Por ejemplo, puede estimar la pérdida de ingresos generados por transacciones, como el comercio minorista en línea, así como las multas pagadas si su empresa tiene contratos de acuerdo de nivel de servicio con penalizaciones incorporadas.
Los ingresos en riesgo corresponden a los modelos de negocio basados en suscripción (SaaS), donde cada cliente tiene un valor de suscripción mensual o anual. Puede estimar fácilmente la cantidad de clientes afectados y sus ingresos por suscripción por período para calcular los "ingresos en riesgo".
Sugerencia
Las empresas de suscripción también pueden tener sanciones dentro de un contrato de acuerdo de nivel de servicio, que deben incluirse como se indica a continuación.
Automatización
Una vez que haya establecido qué funciona y qué no funciona para sus partes interesadas, puede comenzar a escalar SLM con la automatización. Puede comenzar a aprender sobre la automatización de la administración a nivel de servicio estudiando la biblioteca New Relic Terraform.
Gestión de calidad alerta
La gestión de calidad alerta es otra práctica de madurez de observabilidad que cumple con la administración a nivel de servicio. El valor de los datos de calidad de las alertas combinados con los datos del nivel de servicio proviene de ver si su política de alertas se alinea con un impacto real o simplemente genera ruido. Podrás validar alertas buenas, alertas faltantes y alertas simplemente ruidosas.
Puede hacerlo creando un panel personalizado con una consulta de cumplimiento SLI junto con una consulta de calidad de alerta. Simplemente consulte nuestro documento de gestión de calidad alerta para obtener más detalles.
Cuantificar el costo directo de los incumplimientos del acuerdo de nivel de servicio
Determinar el costo de incumplimientos anteriores. Por ejemplo, las empresas minoristas en línea conocen la pérdida estimada de ingresos por minuto durante la pérdida del servicio (tiempo de inactividad). Legal puede informarle los costos de penalización por incumplimientos de contrato del acuerdo de nivel de servicio (SLA). Ambas pérdidas se pueden estimar fácilmente en tiempo real utilizando datos de New Relic sobre violaciones del nivel de servicio.
Cuantificar los costos de oportunidad de ingresos de las violaciones del nivel de servicio
Determine las tres variables siguientes.
- (A) número de infracciones que provocan sanciones o pérdida de ingresos
- (B) duración media de las infracciones
- (C) penalización promedio o pérdida de ingresos por minuto/hora
Multiplique esas tres variables (A _B _C) para calcular la oportunidad de recuperación de ingresos totales.
Cuantificar la fuga de ingresos
Determine las dos variables siguientes.
- (A) Ingresos totales (por período)
- (B) Total de pagos de multas realizados a clientes (por el mismo período que A)
Divida B/A para calcular la tasa de porcentaje de pérdida de ingresos.
¿Que sigue?
Si desea profundizar aún más en la administración a nivel de servicio, le recomendamos encarecidamente nuestro curso interactivo gratuito en línea sobre nivel de servicio.