APM Group errorsタブを使用すると、エラーを動的にフィルタリングおよびグループ化して、より詳細な分析を行うことができます。
エラー一覧表示
エラー率チャートから始めて、予期しないスパイク、ディップ、または一般的なエラーのパターンがあるかどうかを一目で確認します。
上位 5 つのエラー グラフの一般的なパターンを、同じ期間に発生したアラートに関連付けます。
Dynamic grouping:
エラー発生のデフォルトのグループ化は、エラーメッセージ、エラー クラス、およびUI名に基づいています。 一度に最大 5 つの属性まで、任意の属性ごとにグループ化オプションを変更することができます。
Filtering:
New Relic の多くの顧客にインストゥルメントされたカスタムアトリビュート。 特定のカスタムアトリビュートでフィルタリングすることは、すべてのエラー発生のノイズをカットする簡単な方法です。
エラープロファイル
エラー プロファイルは、選択した時間枠内のすべてのエラー イベントで最も一般的だったのはどのユーザーかなどの質問に答えるのに役立ちます。または、選択した時間枠内のすべてのエラー イベントで最も一般的だったのはどのセッションですか?
Attribute profiles [属性プロファイルを]クリックして、個々のプロファイルを展開します。
エラーの詳細ビュー
このページでは、特定のエラー グループを詳しく調べることができます。エラー スパイクの原因となっている特定のホスト グループを特定した可能性があります。詳細ビューには、コンテキスト内の詳細が表示されます。
詳細ビューから、右上のトグルを使用して特定のエラーを循環し、エラーの最初のインスタンス、最後のインスタンス、またはその間の任意のインスタンス間を移動できます。
詳細ページの上部にあるFilteredフィールドとGrouped Byフィールドを調べて、情報がどのようにフィルタリングされ、グループ化されているかを確認できます。 特定の出来事のパーマリンクを受け取る場合があります。 発生のコンテキストを理解するには、フィルターとグループ化の選択内容を知ることが重要です。
発生タブ
Occurrencesタブには、エラーの頻度、発生の詳細、スタックトレースだけでなく、トリアージ情報や関連するディストリビューティッド(分散)トレースも含まれます。
トリアージ部門
問題切り分けセクションでは、表示している特定のエラー発生を、一意のフィンガープリントを持つシステム作成のエラー グループにリンクします。 なぜそれが重要なのでしょうか? この一意のフィンガープリントにより、ステータスの更新または割り当てを使用してエラー グループを優先順位付けすることができます。 システムによって作成されたエラー グループは、 Triageタブに表示されます。 エラー グループの生成方法の詳細については、 「エラー グループの仕組み」を参照してください。
ディストリビューティッド(分散)トレーシング
分散トレースを設定しており、エラーに関連するサンプル トレースがある場合は、トレースの詳細を表示するオプションが表示されます。これは、メインの分散トレース ページに移動せずにトレース情報を表示する簡単な方法です。
Distributed tracesというラベルの付いた左側のペインで、見出しを展開すると、このエラー グループ内のエラーに関連付けられているすべてのトレースのリストが表示されます。 または、 Explore allをクリックしてすべてのトレースのリストを開くこともできます。
Distributed traceというラベルの付いた右側のペインに、このページに表示されているエラー発生に関連付けられたトレースが表示されます。 ウォーターフォール ビューでトレースの範囲を表示するには:
トレース名を直接クリックするか、右側にある矢印の付いたアイコンをクリックすると、ウォーターフォール フォーカス ビューが開き、エラーのあるトレース スパンが強調表示されます。
Exploreをクリックすると、フィルタリングされていないウォーターフォールが開き、すべてのスパンをクリックできるようになります。
エラーデータの期間を選択する
タイム ピッカーを使用して、過去 1 週間、1 か月、またはその他の時間範囲のエラー イベントの詳細を調べます。
Group errors
タブのエラー イベント データは、過去 8 日間に収集された最大 7 日間の期間のデータで利用できます。
Triage
タブのエラー イベント メタデータは最大 13 か月間保存されます。
時間枠が「今すぐ終了」に設定されている場合、カウントにわずかな違いがあることに気付くかもしれません。これは、ページが自動更新されるときに、リストとテーブルのカウントがわずかに異なるタイミングで要求される可能性があるために発生します。
想定されたエラー
ノイズの多いエラーを「予想されるエラー」としてマークすることで減らします。このようなエラーは、報告されたエラー率や Apdex 指標には影響しません。詳細については、 エラーの管理を参照してください。
予想されるエラーは、デフォルトではGroup errorsタブに表示されません。 Group byバーの下にあるShow N expected errorsスイッチをオンにすると表示できます。
トランザクション外のエラー
New Relic エージェント API を使用すると、コード実行中の任意の時点で カスタム エラーを記録 できます。このようなカスタム エラーは、HTTP トランザクションを処理しない大量の非同期コードなど、トランザクションが実行されていないときに発生することがあります。
トランザクション の外部のエラーはデフォルトでGroup errorsタブに表示されますが、 トランザクション の外部のエラーのみを表示する場合は、次のフィルターを適用します。
TransactionName = 「不明」
エラートレースの削除
エラー エクスペリエンスから機密情報を削除する必要がある場合は、 個人データの削除リクエストを送信することをお勧めします。
エラーデータ
エラーのデータタイプ:イベントとトレースの詳細
デフォルトでは、APM エージェントはイベントとトレースの詳細の 2 種類のエラー データを収集します。
イベント
エラーイベントのデータタイプには、デフォルトの属性と、サービスに組み込まれたカスタム属性が含まれます。スタックトレースは含まれません。
イベントはサンプリングの対象となります( Caps on error reporting および Charting error rates and count を参照)。エラーイベントデータの詳細については、 APMで報告されたイベント を参照してください。
トレースの詳細
エラーデータタイプの「トレース詳細」には、スタックトレースや属性が含まれており、より多くのデータでイベントを補足しています。 Caps on error reporting を参照してください。
Show only errors with stack trace デフォルトで有効になっており、表示されるエラーをこのタイプのデータが収集されたものだけに制限します。
このデータは、エラーの詳細についての特定の の保持規則によって管理されています 。
エラー報告の制限
New Relicのキャップのエラー報告は以下の通りです。
- エージェント・インスタンスごとに毎分100イベント
- エージェント・インスタンスごとに毎分20件のトレース詳細
これらのキャップは、エラーレポートがアプリケーションのパフォーマンスに悪影響を与えることを防ぎます。
例:
アプリは5つのEC2インスタンスで動作しており、それぞれ1つのJVMを使用しています。New Relicのキャップのエラー報告は
- 毎分100イベント×5インスタンス=毎分500イベント
- 毎分20件のトレース情報×5インスタンス=毎分100件のトレース情報
アプリは1つのホストで10台のインスタンスを実行しています。New Relicのキャップのエラー報告は
- 100イベント/分 x 10インスタンス = 1000イベント/分
- 毎分20件のトレース内容×10インスタンス=毎分200イベント
エラー率とカウントのグラフ化
Error rate chartは、クエリ onmetrictimeslic データによって駆動されます。これは、正確ではあるものの次元が非常に限られている、サンプリングされていない集計データ型です。 このデータは、エラー イベント データほど柔軟にファセット化またはフィルタリングすることはできません。
このグラフをダッシュボードで再現したり、 Error rate chartの...メニューをクリックしてView queryまたはAdd to dashboardオプションを使用することで、metrictimeslic データをさらに詳しく調べることができます。
上位 5 つのエラー チャートのように、イベント データを使用してファセット エラー数をチャート化するには、NRQL イベント クエリを使用します。 上位 5 つのエラー チャートの...メニューをクリックし、チャート作成の開始点としてView queryを選択します。
イベントデータはサンプリングすることができるので( エラー報告に関するキャップス を参照)、 EXTRAPOLATE キーワード を使用すれば、サンプリングが発生していても正確なエラーカウントを得ることができます。
カスタムエラーの報告
デフォルトでは収集されないエラーを、エージェントのAPIを使って報告することができます。詳しくは、APIに関するドキュメント をご覧ください 。
エラーを無視する
通常は New Relic に報告される特定のエラーを、エージェント API やサーバーサイドの設定 UI を使って収集しないようにすることができます。詳細については、 Manage errors in APM をご覧ください。
予想されるエラーでノイズを減らす
場合によっては、エラー データを収集したいが、それらのエラーによってアラートが表示されないようにしたいことがあります。 エージェント APIを使用すると、このようなエラーを「予想」としてマークできます。エラーページには引き続き表示されますが、サービスのエラー率や Apdex メトリクスには影響しません。
エラートレースの無効化
特定のエラーが New Relic に報告されないようにするには、エージェントの設定ファイルでそのエラーを無効にします。ほとんどのエージェントでは、特定のエラーコードを無視したり、エラーを完全に無効にしたりすることができます。詳細については、特定のエージェントの設定ドキュメントを参照してください。