自動異常検出は、システム内の異常な動作を検出して分析するための最も簡単な方法です。これは、次の方法を使用して行います。
- 異常検出は、エージェントによって報告されたメトリック データを監視し、典型的なアプリケーション ダイナミクスのモデルを構築し、3 つの主要なゴールデン シグナル (スループット、応答時間、エラー) に焦点を当てます。
- これらのゴールデン シグナルの 1 つが異常な動作を示す場合、システムはその動作にフラグを立て、通常の動作への回復を追跡します。
- お客様のデータの変化に適応し、新しいデータに基づいてモデルを継続的に更新していきます。
自動的にオン: デフォルトでは、異常検出はすべての APM アプリケーションを監視します。ユーザーがアクションを行う必要はありません。異常が検出されると、さまざまなアクティビティ ストリームに自動的に表示され、適用されたインテリジェンスの異常がフィードされ、NRQL を介してクエリを実行できるようになります。
相関: 異常は、相関ロジック ( 意思決定とも呼ばれます) に接続されます。関連付けロジックによって問題が関連していると判断された場合、複数のインシデントから 1 つの問題が作成されます。この相関する問題は問題フィードで確認できます。異常は、問題が発生した前後に何が変更されたかに関する追加のコンテキストを提供するため、チームはパターンを簡単に検出して問題を診断できます。
通知の受信: New Relic がスループット、エラー率、または応答時間の異常な変化を検出した場合、チームはこの動作に関する通知を受け取ることができます。選択した Slack チャネルまたはメール チャネルで通知を送信することをお勧めします。異常が正常に戻ると、回復メッセージが送信されます。通知を受け取りたくない場合でも、 NRQL クエリを使用してデータにアクセスできます。
異常分析:異常ごとに、異常分析ページへのリンクを Slack に提供します。このページは、異常に対する自動洞察を生成します。このページは、最近の異常を一覧表示する異常タブからも利用できます。このページでは、既存の APM と異常検出データを使用して、異常の原因に関する説明を提供します。
アクティビティ ストリーム: New Relic のホームページ、APM の概要ページ、Lookout、Explorer などのさまざまなアクティビティ ストリーム内に、APM で監視されているアプリケーションからの関連する異常が表示されます。アクティビティ ストリーム内のいずれかの異常イベントをクリックすると、その異常の分析ページが表示されます。
アプリケーションは常に異常を生成するとは限らないため、検出を受け取らなくても正常な場合があります。