Le temps de disponibilité des entreprises est une mesure essentielle pour toute organisation, reflétant la fiabilité et la disponibilité des services qui ont un impact direct sur la satisfaction des clients et les résultats commerciaux. La plateforme d'observabilité New Relic fournit une suite complète d'outils et de pratiques pour améliorer les temps de disponibilité des entreprises grâce à une meilleure prestation de services. Ce document décrit un modèle de progression de la maturité qui s'appuie sur les pratiques d'observabilité pour générer des résultats axés sur l'entreprise, ciblant spécifiquement les temps de disponibilité de l'entreprise.
Modèle de progression de la maturité
Le modèle de progression de la maturité est conçu pour guider l'organisation à travers un parcours structuré allant du réactif au proactif et, en fin de compte, à la maîtrise des niveaux d'observabilité. Chaque niveau est caractérisé par des pratiques et des métriques spécifiques que vous retrouverez dans le dashboard associé pour vous aider à mesurer et à améliorer les temps de disponibilité des entreprises.b
Niveau 1 : Approche réactive
Au niveau réactif, l’organisation réagit aux incidents au fur et à mesure qu’ils se produisent, souvent sans avertissement préalable. L’accent est mis sur la mise en place de mécanismes d’alerte de base pour garantir que les problèmes soient détectés rapidement. Les règles suivantes sont utilisées pour évaluer l’efficacité d’une approche réactive :
- Couverture des alertes d'infrastructure: garantit que les définitions d'alerte sont présentes pour l'entité INFRA-HOST ou INFRA-Kubernetes-pod. L’absence d’alertes entraîne un score d’échec.
- Couverture des alertes de prestation de services: vérifie les définitions d'alerte sur l'entité APM-APPLICATION, BROWSER-APPLICATION, MOBILE-APPLICATION ou SYNTH-MONITOR. Les alertes manquantes entraînent un score d'échec.
- alerte critique Couverture: Évalue un échantillon de 7 jours d'incidents d'alerte par entité cible pour déterminer le pourcentage dû à une violation critique par rapport à une violation d'avertissement.
- Alerte Bruit: Évalue l'incident sur une période de 7 jours pour déterminer si une politique spécifique est responsable de plus de 14 incidents pendant cette période.
Niveau 2 : Approche proactive
Le niveau proactif consiste à anticiper les problèmes potentiels avant qu’ils n’affectent les opérations commerciales. À ce stade, l'organisation utilise des pratiques d'observabilité pour améliorer continuellement la prestation de services. Les règles et métriques suivantes sont évaluées :
- niveau de service Couverture: Évalue si l'entité a défini des SLI (SLI) lors de la dernière récolte de l'entité. Les SLI définis indiquent monitoring proactive.
- Alertes Temps moyen de clôture: mesure le temps nécessaire pour clôturer l'incident, les résolutions de moins de 30 minutes étant considérées comme réussies. Cette métrique reflète l’efficacité des processus de gestion incident .
- Couverture de l'étiquette de criticité APM: évalue l'attribution de notes de criticité (faible, moyenne, élevée) à l'entité, en soulignant leur importance pour les opérations commerciales.
Niveau 3 : Maîtrise
Au niveau de la maîtrise, les organisations obtiennent des avantages commerciaux directs grâce à leurs pratiques d'observabilité, dépassant la simple correction incident . L’accent est mis sur l’atteinte du niveau de service :
- Niveau de service atteint: évalue le dernier score de conformité du niveau de service pour chaque SLI défini. Un taux de réussite supérieur à 95 % est considéré comme réussi, indiquant une fiabilité et un temps de disponibilité élevés.
Pratiques d'observabilité
Les pratiques d'observabilité sont les composants exploitables du modèle de maturité, permettant à l'organisation de réaliser la valeur potentielle de la plateforme New Relic. Ces pratiques comprennent :
- Gestion de la qualité des alertes (AQM): réduit la fatigue due aux alertes auxiliaires en se concentrant sur les alertes ayant un véritable impact sur l'entreprise. AQM améliore le temps de réponse et augmente la sensibilisation aux événements critiques, conduisant à des temps de disponibilité et de disponibilité plus élevés.
- Gestion des niveaux de service (SLM): normalise les données dans un langage universel, améliorant ainsi la communication entre les parties prenantes informatiques et commerciales. SLM améliore la fiabilité en réduisant les incidents ayant un impact sur l’entreprise et leur durée.
Prochaines étapes
Les organisations sont encouragées à explorer les ressources et les guides de New Relic pour adapter leur parcours d'observabilité en fonction de leurs besoins spécifiques. En tirant parti du modèle de progression de la maturité et des pratiques d'observabilité, les entreprises peuvent libérer tout le potentiel de la plateforme New Relic et atteindre leurs objectifs de temps de disponibilité.