New Relic のアラート機能と応用インテリジェンス機能を最大限に活用するには、いくつかの基本的な用語と概念を理解するのに役立ちます。
ヒント
最初のアラートはもう作成しましたか?そうでない場合は、開始するために必要なすべての手順について チュートリアル シリーズを 確認してください。
違反の構成 要素を定義するアラート条件の違反がどのように インシデントをもたらし、インシデントがどのように 問題をもたらし、 ワークフロー のロジックがどのように通知をもたらすかを示す図。
テレメトリ データのアラートを設定するには、アラート 条件を構成します。アラート条件は、しきい値を構成して インシデントをトリガーする内容を定義します。たとえば、ホストの CPU が 80% を超えた場合にインシデントを開始するアラート条件を作成できます。インシデントは 問題を引き起こし、実際に通知が発生します。問題は、症状の根本的な問題を説明する インシデント のグループです。新しいインシデントが作成されると、問題が作成されます。インシデントは、システムの「症状」を時間の経過とともに説明する イベント のグループです。これらの症状は、New Relic アラート条件または外部監視ツールによって検出されます。イベントは、New Relic アラート条件または外部監視システムによって定義された状態の変化またはトリガーを示します。イベントには、影響を受けるエンティティに関する情報が含まれます。
条件はアラートポリシー内にあります。ポリシーには、そのポリシーのすべての条件を管理する上位レベルの設定が含まれています。1 つの設定は問題の作成設定で、複数のインシデントを単一の問題にグループ化する方法を管理します。たとえば、すべてのインシデントに独自の問題があると判断したり、条件ごとにグループ化したり、ポリシーごとにグループ化したりすることができます。これは、問題をより大きな問題にグループ化する論理操作です (独自のカスタム決定を作成することもできます)。決定を有効にした場合、他の問題が評価され、それらが新しく作成された問題と関連付けられるかどうかが確認されます。その場合は、関連する問題をまとめてノイズを減らし、根本原因の分析を容易にします。
問題はワークフローをトリガーすることができます。これにより、問題を通知に変換する方法を制御できます。宛先は、通知を受け取るサービスです。Slack、PagerDuty、ServiceNow、シンプルな Web フックなどの一般的なサービスをサポートしています。ユーザーが冗長な宛先を作成しないように、宛先のセットアップを慎重に管理することをお勧めします。
最初のアラートの作成を開始しますか?最初のアラートを参照してください。