• ログイン今すぐ開始

本書は、お客様のご参考のために原文の英語版を機械翻訳したものです。

英語版と齟齬がある場合、英語版の定めが優先するものとします。より詳しい情報については、本リンクをご参照ください。

問題を作成する

応用インテリジェンスによる異常検出

応用インテリジェンスの異常検出により、APM で監視されているアプリケーションからの異常が、アクティビティ ストリームと異常フィードに自動的に表示されます。各異常をクリックすると、自動分析が表示されます。

異常の通知は Slack で配信するか、Webhook を設定して必要なときにメッセージを配信できます。これらのイベントは、クエリ、カスタム ダッシュボードの作成、およびアラートに使用できます。異常検出構成 (関心のあるアプリのグループ) をセットアップしたら、この構成をソースとして追加できます。その後、異常はインシデント インテリジェンスを介して他のデータ ソースと自動的に関連付けられます。

異常現象の発生場所、異常現象を利用してインシデントになる前に潜在的な問題を把握する方法、異常現象からアラートを作成する方法については、こちらのショートビデオをご覧ください(約4分15秒)。

要件

異常検出を使用するには、次のものがあることを確認してください。

データ制限については、 Data limits を参照してください。

重要な理由

異常検出により、応用インテリジェンスは、異常の自動分析とともに、本番システムの異常に関する洞察を提供します。追加料金なしで自動的に有効になります。異常が検出されると、適用されたインテリジェンス異常フィードで表示できます。または、Slack チャネルまたは Webhook に直接通知が送信されます。

使い方

異常検出では、次の方法を使用してアプリ データの異常を検出します。

  1. 異常検出は、APM エージェントによって報告されたメトリック データを監視し、典型的なアプリケーション ダイナミクスのモデルを構築し、主要なゴールデン シグナル (スループット、応答時間、およびエラー) に焦点を当てます。
  2. これらのゴールデンシグナルの一つが異常な動作を示した場合、システムはそれにフラグを立て、正常な動作への回復を追跡します。
  3. お客様のデータの変化に適応し、新しいデータに基づいてモデルを継続的に更新していきます。

自動的にオン: デフォルトでは、異常検出はすべての APM アプリケーションを監視します。ユーザーがアクションを行う必要はありません。異常が検出されると、さまざまなアクティビティ ストリームに自動的に表示され、適用されたインテリジェンスの異常がフィードされ、NRQL を介してクエリを実行できるようになります。

Receiving notifications: スループット、エラーレート、または応答時間の異常な変化を検出したときに、通知を送信します。通知は、選択したSlackチャンネルに送信されるか、webhookで送信されます。異常が正常に戻ったときには、回復メッセージが送信されます。通知を受け取りたくない場合でも、 NRQLクエリ を通じてデータにアクセスすることができます。

異常分析:異常ごとに、異常分析ページへのリンクを Slack に提供します。このページは、異常に対する自動洞察を生成します。このページは、最近の異常を一覧表示する異常タブからも利用できます。このページでは、既存の APM と異常検出データを使用して、異常の原因に関する説明を提供します。

アクティビティストリーム: New Relicホームページ、APM概要ページ、Lookout、Explorerなどのさまざまなアクティビティストリーム内に、APMで監視されているアプリケーションからの関連する異常が表示されます。アクティビティストリーム内の異常イベントのいずれかをクリックすると、その異常の分析ページが表示されます。

アプリケーションは常に異常を発生させるわけではないので、検出されないのが普通の場合もあります。

異常検出の通知を設定する

プロアクティブな検出は、追加料金なしで自動的に有効になります。通知を受信したり、インシデント インテリジェンスのソースとして追加できる構成 (アプリのグループ) を用意したりするには、異常検出構成を作成する必要があります。異常検出 UI で構成を作成できます。

  1. From one.newrelic.com , click Alerts& AI.

  2. [プロアクティブ検出]で、[設定]をクリックします。

  3. クリック Add a configuration.

  4. 以下の情報をフォームに入力してください。

    • アカウント内の他の構成と簡単に区別できるように、構成の名前を決めてください。
    • アカウントを選択します。
    • 最大 1,000 件のアプリケーションを選択します。スループットの低い特定のアプリケーションは、少量のデータ変動により敏感になる可能性があるため、異常検出の対象として適していない可能性があることに注意してください。
  5. オプション:異常を監視したいゴールデンシグナルを選択します。

  6. オプション:インシデントインテリジェンスに接続します。

通知のミュート(Slackのみ)

Slackでは、特定のアプリケーションからの検出音を一時的または恒久的にミュートすることができます。また、チャンネル全体を一時的にミュートにすることもできます。この機能は、インシデントが発生した場合や、チャンネルを中断させたくない場合に便利です。

Slackでミュートにするには、 Mute this app's warnings または Mute all warnings を選択し、期間を選択します。ミュートの期間が終了すると、検出された場合の通知の送信が再開されます。

アプリケーションをミュートすると、構成から永久に削除されます。再度追加するには、 one.newrelic.comに移動します。上部のナビゲーションで [ Alerts & AI ] をクリックし、次に [ anomaly detection ] をクリックして、編集する構成を選択します。

異常検出通知をミュートしても、アラートには影響しません。

異常検出 Slack メッセージを使用する

それぞれの異常メッセージには、問題の詳細を把握し、トラブルシューティングを開始するために使用できるいくつかの重要な情報が含まれています。

  • NewRelicUIにあるアプリケーション名とその詳細情報へのリンク。
  • 異常が発生しているメトリックと、NewRelicUIの詳細へのリンク。
  • メトリクスの経時変化をグラフ化し、異常の挙動や程度を視覚的に理解することができます。
  • 適用されたインテリジェンスの分析ページに移動する[分析]ボタン。異常、上流または下流で検出された異常、およびその他の関連する信号に固有の主要な属性を識別します。

異常が正常に戻った時点で、フィードバックを提供するためのオプションを含む回復通知を送信します。お客様からのフィードバックは、開発チームが検出品質を向上させるための情報となります。スループットの異常に関するフィードバックの場合、より適切なモデルに適合させるために、フィードバックに基づいて毎時間評価が実行されます。私たちがお手伝いした場合は、 はい または いいえ を選択してください。

異常の概要を見る

Slackやwebhookを介して情報を提供する異常の通知に加えて、 Alerts& AI OverviewページAnomaliesタブ を介して、自分の環境の異常に関する詳細な情報を見ることができます。そのタブには、選択されたアカウントのすべての構成からの最近のすべての異常のリストが表示され、異常を選択して詳細な分析を行うことができます。

異常の可視化設定

異常は、さまざまなNewRelicアクティビティストリームと適用されたインテリジェンス異常フィードに表示されます。異常の可視性設定を使用して表示内容をカスタマイズできます(たとえば、アクティビティストリームでスループットの異常を非表示にし、異常フィードに保持します)。

これらの設定を見つけるには:[アラートとAI ]の[プロアクティブ検出]で、[設定]をクリックします。

これらの設定を使用する際の注意点

  • これらの設定は、ユーザーレベルで適用されます。あなたが行った変更は、あなたの組織内の他のユーザーには影響しません。
  • これらの設定にかかわらず、異常値は報告され、 NRQL クエリで利用可能です。

これらのUIセクションの詳細。

  • AI overview and anomalies tab: AI overview and anomalies tab の設定で、異常値を非表示にします。また、これらのビューに固有のフィルターも使用できますのでご注意ください。
  • グローバルアクティビティストリーム:グローバルアクティビティストリームセクションを使用して、New Relicホームページ、APMサマリー、LookoutなどのさまざまなNewRelicアクティビティストリームに表示される異常をカスタマイズします。
  • Anomaly types: 特定のタイプの異常を隠すには、ここのチェックボックスを使用します。例えば、 WebスループットNon-Webスループット 異常のチェックを外すと、これらのタイプの異常は、アクティビティストリームとAI概要および異常タブの両方から非表示になります。(ただし、これらの異常はレポートされ、クエリで利用可能です。)

アノマリーデータの照会

NRQLを使用して、 NrAiAnomalyイベントを使用して異常検出データのクエリとグラフ化を行うことができます。例えば:

FROM NrAiAnomaly SELECT *

重要

このデータは、以前にProactiveDetectionイベントに添付されています。このイベントは2021年4月7日に非推奨になります。カスタムグラフでProactiveDetectionを使用する場合は、それらのクエリをNrAiAnomalyを使用するように変換する必要があります。

このイベントに付随する重要な属性は以下の通りです。

属性

説明

closeTime
タイムスタンプ

異常が終了した時刻。例: 1615304100000

configurationType
ストリング

イベントを監視する構成のタイプ。少なくとも1つの構成がエンティティを監視している場合、これはconfigurationに設定されます。それ以外の場合は、 automaticに設定されます。

entity.accountId
番号

エンティティが所属するNew RelicアカウントID。

entity.domain
番号

エンティティのドメイン(現在はAPMのみですが、将来の機能で変更されます)。

entity.guid
ストリング

エンティティのGUID。これは、NerdGraphを介してエンティティに関するデータを識別および取得するために使用されます。 entityGuidと同じです。

entityGuid
ストリング

エンティティのGUID。これは、NerdGraphを介してエンティティに関するデータを識別および取得するために使用されます。 entity.guidと同じです。

entity.name
ストリング

データが異常であると判断されたエンティティの名前。 entityNameと同じです。例: Laura's coffee service

entityName
ストリング

データが異常であると判断されたエンティティの名前。 entity.nameと同じです。

entity.type
ストリング

エンティティのタイプ(現在はAPPLICATIONのみですが、将来の機能で変更されます)。

evaluationType
ストリング

これは常にanomalyです。

event
ストリング

異常データの始まり( open )か終わり( close )かを示します。

openTime
タイムスタンプ

異常が開いた時間。例: 1615303740000

signalType
ストリング

分析されたデータのタイプ。たとえば、 error_rateまたはresponse_time.non_web

timestamp
タイムスタンプ

イベントが書き込まれた時間です。

title
ストリング

異常の説明。例: Error rate was much higher than normal

インシデントインテリジェンスのソースとして異常を追加する

インシデント インテリジェンスを異常検出と統合することで、コンテキストと相関関係を取得できます。インシデント インテリジェンスでこれを行う方法については、「 ソースの構成」を参照してください。

構成内から[インシデントインテリジェンスに接続]を選択することもできます。

Webhookのペイロードと例

プロアクティブ検出は、HTTPSPOSTを介してJSON形式でイベント本文を送信します。システムは、エンドポイントが成功したHTTPコード(2xx)を返すことを期待しています。 Webhookを使用してプロアクティブ検出を構成する場合は、Webhook本体形式とJSONスキーマのこれらの例を使用してください。

属性

説明

category
列挙型

分析対象となったデータのカテゴリー。

カテゴリーには、ウェブ・スループット、非ウェブ・スループット、ウェブ・トランザクション、非ウェブ・トランザクション、エラー・クラスがあります。

data
リスト

検知に至るまでの時系列データです。

data[].timestamp
番号

データポイントのタイムスタンプ(Unix エポックからの ミリ秒) 。例:1584366819000

data[].unit
ストリング

データポイントの値を表す単位。

データ単位には、 countmilliseconds 、およびerror_rateが含まれます。

data[].value
番号

データポイントの値です。例:1.52

detectionType
列挙型

分析されたデータのタイプ。タイプには、 latencythroughput 、およびerror_rateが含まれます。

entity
物体

異常なデータを報告した企業。

entity.accountId
番号

エンティティのアカウントのIDです。

entity.domain
列挙型

エンティティのドメインです。例APMです。

entity.domainId
ストリング

ドメイン内のエンティティを一意に識別するためのID。

entity.guid
ストリング

すべての製品においてエンティティを一意に識別するために使用されるguidです。

entity.name
ストリング

エンティティの名前。例: Laura’s coffee service

entity.link
ストリング

エンティティを表示するためのリンクです。例

https://rpm.newrelic.com/accounts/YOUR_ACCOUNT_ID/applications/987654321”

severity
列挙型

NORMALWARNING 、またはCRITICALを含む、異常な変更がどのように発生したかの説明。

version
ストリング

提供されるデータを説明するために使用されるバージョン。

例:v1

viewChartImageUrl
ストリング

異常データのチャートを示す画像。

anomalyzerUrl
ストリング

NewRelicの異常を分析するために開くことができるURL。

データ制限

要件 に加えて、データ制限があります。

  • 監視対象のAPMアプリケーション:構成ごとに1,000個まで
  • Slackの設定:1アカウントにつき200個まで
  • Webhook構成:1アカウントにつき200個まで
  • 通知のない設定:1アカウントにつき200件まで
Copyright © 2022 New Relic株式会社。

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.