条件を作成すると、インシデントを開くかどうかを判断するパーソナライズされたthresholdsを設定することになります。このドキュメントでは、閾値とは何か、またその設定方法について解説します。
閾値とは何か?
条件において、閾値とはインシデントを開くかどうかを判断するための設定になります。ポリシーの問題作成設定、および設定したワークフローによっては、インシデントによって次の結果が生じる可能性があります。
閾値には2つのタイプがあります。
- Static: ユーザーが設定した値
- Anomaly:異常閾値は過去のデータを使用して、データの近い将来の動作を動的に予測します。 データのパターンを学習するにつれて、時間の経過に伴い調整されます。
閾値の例:
- アプリケーションのウェブ レスポンスタイム平均は、15分間にわたって5秒以上である。
- アプリケーションの1分あたりエラー率は、最低でも1時間に1回10%以上である。
- アプリケーションのAJAXレスポンスタイムは、その予想行動から一定量逸脱している。
重要閾値以外にも、深刻度の低い警告レベルに対して閾値を設定できます。
閾値を表示して設定する
閾値の設定は、条件の作成プロセス中に行われます:
目標 | 解説 |
---|
新規条件の閾値の設定 | 条件を作成するプロセスの一環として閾値を設定。 |
既存の条件の閾値を表示して更新する | 条件の閾値を表示するには:UIでその条件を見つけます。閾値を更新するには、条件の閾値を選択して、変更を行います。 |
具体的なアラート条件の種類(異常やNRQL)の詳細に関しては、条件の種類を参照してください。
その他の機能性およびルールに関する詳細:
閾値は、クリティカルと警告の2つのレベルに設定できます。1つ以上の閾値を設定する必要があります。
閾値 | 詳細 |
---|
クリティカル(赤) | オプション。優先度が「重大」のインシデントを開き、ポリシーのイシューの作成プリファレンスと構成したワークフローに応じて通知を送信します。信号損失の閾値がトリガーされると、優先度が「重大」のインシデントも開きます。詳細については以下をご覧ください。 |
警告(黄) | オプション。優先度が「高」のインシデントを開き、ポリシーの問題作成の設定と構成したワークフローに応じて通知を送信することがあります。システムの挙動に不安があるか注意を要するものの、クリティカルレベルの閾値を必要とするほどの重要性がない場合に監視する場合は、警告による閾値を使用します。 |
信号損失とは、New Relicでデータを受信できない期間を指します。これは、エンティティまたはサービスがオフラインになるか、エージェントまたはコレクターに問題があるか、データセンターまたはインターネットのネットワークに問題があることが原因である可能性があります。信号損失検出は、想定外の信号停止が発生した場合に使用できます。また、この機能を使用して、短命のサービスがいつ停止するかを判断し、この状態に存在する未解決のインシデントを閉じるアクションを設定することもできます。信号損失設定は、信号が終了することが予想される場合にインシデントを開かないように設定することもできます。詳細については、 信号損失に関するドキュメントを参照してください。
また、count(*)
またはuniqueCount(*)
をクエリで使用している場合は、信号損失を設定する必要があります。詳細については、NRQL条件および演算のクエリ順序を参照してください。
最低時間間隔は、条件の種類によって異なります。たとえば、一部の条件の種類は最低時間間隔が5分(メトリクスアラート条件など)である一方、最低時間間隔が1分(NRQLアラート条件)のものもあります。同じことが最大時間間隔でも発生し、時間は120分です。