条件を作成すると、何が違反を開くかを判断する閾値を設定することになります。このドキュメントでは、閾値とは何か、またその設定方法について解説します。
閾値とは何か?
条件において、閾値とは何が違反を開くかを判断するための設定になります。ポリシーのインシデント選好次第では、違反は以下をもたらす可能性があります:
閾値の例:
- アプリケーションのWebレスポンスタイム平均は、15分間にわたって5秒以上である。
- アプリケーションの1分あたりエラー率は、最低でも1時間に1回10%以上である。
- アプリケーションのAJAXレスポンスタイムは、その予想ベースライン行動から一定量逸脱している。
必須の重要閾値以外にも、深刻度の低い警告レベルに対して閾値を設定できます。これは、インシデントを作成せず、通知も送信しません。
閾値を表示して設定する
閾値の設定は、条件の作成プロセス中に行われます:
目標 | 解説 |
---|
新規条件の閾値の設定 | 条件を作成するプロセスの一環として閾値を設定。 |
既存の条件の閾値を表示して更新する | 条件の閾値を表示するには:UIでその条件を見つけます。閾値を更新するには、条件の閾値を選択して、変更を行います。 |
具体的なアラートの種類(ベースラインやNRQL)の詳細に関しては条件の種類を参照してください。
その他の機能性およびルールに関する詳細:
閾値は、クリティカル(必須)と警告(オプション)の2つのレベルに設定できます。
閾値 | 詳細 |
---|
 クリティカル(赤) | 必須。違反が発生すると、インシデントプリファレンス設定に基づき通知が送信されます。 |
 警告(黄) | オプション。インシデントを開いたり、通知を生成したりしませんが、すでに開いているインシデントにロールアップします。システムの挙動に不安があるか注意を要するものの、通知を必要とするほどの重要性がない場合に監視した場合は、警告による閾値を使用します。 |
信号喪失とは、New Relicでデータを受信できない期間を指します。これは、エンティティまたはサービスがオフラインになるか、エージェントまたはコレクターに問題があるか、データセンターまたはインターネットのネットワークに問題があることが原因である可能性があります。信号喪失の検出を使用して、信号が停止し、サービスが安定していると予想される場合に、新しい違反と通知を作成できます。また、この機能を使用して、短命のサービスがいつ停止するかを判断し、この状態に存在する未解決の違反を閉じるアクションを設定することもできます。
信号喪失、ギャップの充填、アクセスをリクエストする方法の詳細については、この発表を参照してください。
最低時間間隔は、条件の種類によって異なります。たとえば、一部の条件の種類は最低時間間隔が5分(APMのメトリクスアラート条件など)である一方、最低時間間隔が1分(NRQLアラート条件)のものもあります。同じことが、最大時間間隔でも発生し、時間は120分です。