ビジネス稼働時間はあらゆる組織にとって重要なメトリクスであり、顧客の満足度と業績に直接影響を与えるサービスの信頼性と可用性を反映します。 New Relicオブザーバビリティ プラットフォームは、サービス提供の改善を通じてビジネスの実行時間を向上させるためのツールとプラクティスの包括的なスイートを提供します。 この文書では、オブザーバビリティの実践を活用してビジネスに焦点を当てた結果を推進し、特にビジネスの稼働時間を目標とする成熟度進行モデルの概要を説明します。
成熟度進行モデル
成熟度進行モデルは、事後対応型からプロアクティブ型への構造化された移行を通じて組織を導き、最終的には観察レベルの習得に導くように設計されています。 各レベルは、ビジネスの稼働時間を測定および改善するのに役立つ、関連するスコアカードに表示される特定のプラクティスとメトリクスによって特徴付けられます。
レベル1: 反応型アプローチ
対応レベルでは、組織は多くの場合事前の警告なしに、インシデントが発生したときに対応します。問題が速やかに検出されることを保証するための基本的な集計メカニズムを確立することに重点が置かれています。 反応型アプローチの有効性を評価するために、次のルールが使用されます。
- インフラストラクチャ一括カバレッジ: INFRA-HOST または INFRA- Kubernetes -Pod エンティティの一括定義が存在することを確認します。 アラートがない場合は失敗スコアになります。
- Service Delivery 一括カバレッジ: APM - アプリケーション、BROWSER-アプリケーション、MOBILE-アプリケーション、または SYNTH-モニター エンティティの一括定義をチェックします。 アラートが見つからない場合、スコアは失敗となります。
- 重大なアラート カバレッジ:目標エンティティごとにアラートインシデントの 7 日間のサンプルを評価し、重大と警告による割合を決定します。
- 集中ノイズ: 7 日間にわたってインシデントを評価し、特定のポリシーがその期間中に 14 を超えるインシデントの原因となっているかどうかを判断します。
レベル2: 積極的なアプローチ
プロアクティブレベルでは、潜在的な問題が業務運営に影響を与える前にそれを予測します。この段階の組織は、サービス提供を継続的に改善するためにオブザーバビリティ手法を使用します。 次のルールとメトリクスが評価されます。
- サービスレベル カバレッジ:最新のエンティティ収集中にエンティティがサービスレベル インジケーター (SLI) を定義したかどうかを評価します。 定義された SLI はプロアクティブな監視を示します。
- アラートの平均クローズ時間:インシデントのクローズにかかった時間を測定します。30 分未満の解決は成功とみなされます。このメトリクスは、インシデント管理プロセスの効率を反映しています。
- APM 重要度タグの範囲:エンティティへの重要度評価 (低、中、高) の割り当てを評価し、ビジネス オペレーションにおける重要性を強調します。
レベル3: 習熟
熟練レベルでは、組織は単なるインシデント修復を超えて、オブザーバビリティの実践から直接的なビジネス上の利益を達成します。 サービスレベルの達成に重点が置かれています。
- サービスレベル達成度:定義された各 SLI の最新のサービスレベル コンプライアンス スコアを評価します。 成功率が 95% を超えると成功とみなされ、高い信頼性と稼働時間を示します。
観察の実践
観察プラクティスは成熟度モデルの実行可能なコンポーネントであり、組織がNew Relicプラットフォームの潜在的な価値を実現できるようにします。 これらのプラクティスには次のものが含まれます。
- まとめ品質管理 (AQM) : ビジネスに真の影響を与えるアラートに焦点を当てることで、アラートの疲れを軽減します。 AQM は応答時間を改善し、重要なイベントに対する認識を高め、稼働時間と可用性の向上につながります。
- サービスレベル管理 (SLM) : データを共通言語に標準化し、IT とビジネス関係者の間のコミュニケーションを改善します。 SLM は、ビジネスに影響を与えるインシデントとその期間を削減することで信頼性を高めます。
次のステップ
組織は、 New Relicのリソースとガイドを調べて、特定のニーズに応じて観察の旅を調整することが推奨されます。 成熟度進行モデルとオブザーバビリティの実践を活用することで、企業はNew Relicプラットフォームの可能性を最大限に引き出し、稼働時間の目標を達成できます。