このドキュメントでは、インシデントをクローズするさまざまな方法について説明します。
インシデントが自動的にクローズされる方法
インシデントは、条件のしきい値で指定された期間、対象のシグナルが違反していない状態に戻ると、自動的にクローズされます。この待ち時間は回復期間と呼ばれます。
例: 違反行為が「少なくとも 5 分間に 1 回、Apdex スコアが 0.80 未満」である場合、Apdex スコアが 5 分間連続して .80 以上になると、インシデントは自動的にクローズされます。同じことが「少なくとも x 分間」のしきい値にも当てはまります。インシデントを自動的にクローズするには、違反していない行動が x 分間必要です。
インシデントが自動的にクローズされる場合:
- クロージングのタイムスタンプは、リカバリー期間の開始時にさかのぼって表示されます。
- 評価はリセットされ、前のインシデントが終了した時点から再開されます。
すべての条件には、長期にわたるインシデントを自動的に強制終了するインシデントの時間制限設定があります。
長く続く違反のために時間制限を設ける
インシデントの時間制限設定により、選択した日数/時間数が経過すると、長期にわたるインシデントが自動的に強制終了されます。これは、消えると自動的に閉じられない継続的なインシデントを引き起こす一時的なエンティティに最も役立ちます。
限界と既定値
- すべてのアラート インシデントには、インシデントの時間制限が適用されます。ほとんどのアラート条件では、このフィールドを編集できます。
- 設定時に指定しなかった場合のデフォルト値は3日(インフラ条件では24時間)です。
- 非インフラストラクチャ条件のインシデント時間制限は、最短で 5 分、最長で 30 日に設定できます。なんらかの理由で、シグナルが 30 日経過しても違反している場合、インシデントはクローズされ、新しいインシデントがオープンします。インフラストラクチャ条件は、1、2、4、8、12、24、48、または 72 時間に設定できます。
ヒント
この設定は、 非アクティブな問題の設定に関連しています。
これら 2 つの設定の期間が異なる場合、設定に関係なく短い方の期間が使用されます。たとえば、クローズ オープン インシデントの時間設定が 2 日で、非アクティブな問題の時間設定が 3 日の場合、システムは問題をクローズする前に 2 日間待機します。
例:
- インシデントの時間制限を 12 時間に設定します。そのインシデントが 12 時間続く場合、インシデントは 12 時間でクローズされ、そのエンティティの条件の評価がリセットされます。
- JVM に CPU スパイクがあり、これによりインシデントが発生します。その後、JVM がクラッシュし、新しい JVM に置き換えられます。インシデントの時間制限を設定していない場合、クラッシュした JVM のインシデントは閉じられません。