問題のフィード
問題フィード ページでは、すべての問題の概要と、それらに関する役立つ情報を見つけることができます。個々の問題をクリックして、分析の概要、イベント ログ、関連する問題の詳細などの詳細を確認することもできます。
one.newrelic.com > All capabilities > Alerts & AI > Issues & activityに移動します。このスクリーンショットは、問題のステータス、相関関係などを説明する問題フィードの例を示しています。
問題の検索とフィルタリング
検索バーのフリーテキストを使用して、問題を簡単に検索できます。この検索バーを使用すると、次の方法で検索できます。
- 課題名
- 課題ID
- ポリシー名
- 条件名
- エンティティ名
- エンティティID
フィルター アイコンをクリックすると、問題の属性または関連タグでフィルターできます。
- 問題の状態 (作成済み、アクティブ、またはクローズ済み)
- 問題が認められました (真または偽)
- 問題はミュートされました (true または false)
- 関連する問題 (正誤)
- 問題の優先度 (低、中、高、または重大)
- 発行元 (NR アラート、NR 異常、または REST API)
- エンティティ
- アラートポリシー
- アラート条件
- タグ (問題に関連するタグを検索)
フィードの並べ替えオプションを使用すると、たとえば問題の期間や作成時間で並べ替えるなど、探しているものをより早く見つけることもできます。
問題ページ
Issues ページでは、最終的な洞察が提供されるため、最初に問題を理解してから、解決までの時間を最小限に抑えることができます。
ここでは、問題ページのユーザーインターフェイスを順を追って説明する簡単なデモを作成しました。
Issues page[問題ページ] には、次のセクションが含まれています。
Issue payload: [問題ペイロード:] これにより、問題ペイロードの詳細が提供され、ボタンをクリックするだけでペイロードをコピーできます。
Issue destinations: [問題の宛先:] 問題名の下に、通知済みというカテゴリが表示され、宛先が表示されます。目的地の上にマウスを移動すると、目的地の詳細なプレゼンテーションと、開いているチケットへのリンクが表示されます。
Issue duration: [問題の期間:] 問題名の上部に、問題が続いた期間が表示されます。
Number of incidents: [インシデントの数:] インシデント アクティビティ セクションの上部に、問題内のインシデントの合計数が表示されます。
インシデント リスト: インシデント アクティビティ セクションの左側に、インシデント アクティビティ リストが表示されます。ここには、優先度、状態、インシデントの名前、インシデントの作成日時など、各インシデントに関する最も関連性の高い情報が表示されます。 、および期間。また、期間、ミュートされているインシデント、新しいものから古いもの、重大なものから低いインシデントでリストを並べ替えることもできます。最後に、Show open only [オープンのみを表示] ボタンを有効にすることで、オープン インシデントのみでフィルタリングできます。
Incident activity chosen: [選択したインシデント アクティビティ:] インシデント アクティビティ リストからインシデントをクリックすると、右側にインシデントがフル ビュー モードで開きます。これには、アラート ポリシー、アラート条件、アラート条件タイプなどの情報が含まれます。
インシデント グラフ: インシデント アクティビティ リストからインシデントをクリックすると、全範囲のインシデント グラフが開き、劣化、インシデント、および回復期間をより適切に視覚化できるようになります。
ユーザー アクション (グラフの上): インシデント アクティビティ リストからインシデントをクリックすると、実行できる特定のアクションが表示されます。
- この条件に Runbook URL が定義されている場合、Runbook URL がここに表示されます。
- インシデント時間ウィンドウ (任意のエンティティ タイプ) を含むエンティティ概要ページにリダイレクトするエンティティ概要ボタン。
- See errors[エラーを表示] ボタンは、同じエンティティに関連し、インシデントと同じ時間枠で発生したエラー インボックスのエラー グループがある場合にのみ表示されます。
- 3 つのドットがあるアイコンには、特定のインシデントをクローズするオプション (問題に複数のインシデントがある場合のみ) を含むドロップダウン メニューがあり、インシデント ペイロードも表示されます。
Incident entity section (グラフの下): [インシデント エンティティ セクション] インシデント アクティビティ リストからインシデントをクリックすると、次の内容が表示されます。
影響を受けるエンティティ、エンティティ タイプ、およびこのインシデントが属するアカウント名。
タグ (エンティティ & 条件タグ) とその値のリスト。 Show all[すべて表示] ボタンをクリックして、すべてのタグを表示します。
事後分析
事後分析は、チームがインシデントに対応して解決する際に何が機能し、何が機能しなかったかを分析するために使用するレトロスペクティブ プロセスです。
New Relic プラットフォームのポストモーテム機能は、インシデントに関連するデータを自動的に収集するツールであり、チームは将来のインシデントへの対応を改善するための分析とアクション アイテムに集中できます。
事後分析には以下が含まれます。
- 説明を含むインシデントの記録
- 事件のタイムライン
- インシデントの影響
- インシデントの根本原因
- チームが講じた緩和策
- 今後の再発防止のためのフォローアップアクション
事後分析を作成する詳細な手順やウォークスルー デモを見るには、 事後分析のドキュメント ページにアクセスしてください。
根本原因の分析
根本原因分析では、問題とその影響を受けるエンティティの潜在的な原因を自動的に検出します。これにより、未解決の問題が発生した理由、どのデプロイメントが原因となったか、関連するエラーログや属性などが表示されます。これにより、問題を調査し、解決までの平均時間(MTTR)を短縮することができます。
ヒント
なお、根本原因分析は他のNew Relicのデータソースや機能に依存しています。そのため、すべての問題に対して根本原因分析の情報が常に存在するとは限りません。
課題を選択すると、 根本原因分析 の情報が表示されることがあります。
根本原因分析には、主に3つのUIセクションがあります。
- 配置イベント: 配置を設定する際に、問題発生に最も近い配置を提供します。インシデントの根本原因のうち、デプロイメントなどの変更が占める割合は高く、その情報が手元にあれば、問題の診断や解決に役立ちます。
- エラーログ: 何百万ものログメッセージをワンクリックで探索したり、マニュアルクエリを使用して、異常なパターンや見つけにくい問題の発見に役立てることができます。
- 調査する属性: 属性の分布をスキャンし、分布の著しい変化を見つけることで、考えられる原因を表面化します。ここでは、データベースや外部のメトリクスの変化も示します。また、 興味深い属性を照会することができます.
影響を受けるエンティティと問題マップ
エンティティにマウスオーバーすると、そのエンティティの詳細情報が表示されます。
影響を受ける事業体 のセクションでは、2つ以上の事業体が関係する問題について、課題マップを利用できます。 マップ には、影響を受けるエンティティだけでなく、それらのエンティティに直接関連するサービスやリソースも表示されます。
影響を受けたエンティティ: エンティティとは、監視できるデータを持つものを指します。具体的には、New Relic のソースからのインシデントに着目し、エンティティを抽出してサマリーを提供します。各エンティティは固有のものです。エンティティは、リストやマップで確認することができます。
問題のデータに応じて、これら 4 つのセクションすべてが問題ごとにまとめて表示されることも、個別に表示されることもあります。エンティティの横にある 3 つのドットをクリックして、次のようなオプションを含むドロップダウン メニューを開くだけです。
ダッシュボードを見ると、アカウント内のユーザーが、エンティティに関連する作成したダッシュボードを確認して操作するのに役立ちます。さまざまなウィジェットを強化するために実行したクエリは、可能な場合は常にエンティティに自動的にマッピングされ、すばやくアクセスして検出できるようにここに表示されます。
Entity view [エンティティ ビューでは、] アプリケーションの異常ページが開きます。これは、プロアクティブな検出が設定されているアプリケーションでのみ使用できます。
展開イベントには、展開と関連する展開の 2 種類があります。 [Show all deployments] をクリックして、到着したすべての展開イベントを表示するか、特定の展開をクリックしてその展開を表示します。
展開ページ。 APM 展開ページには、 最近の展開と、エンド ユーザーとアプリ サーバーの Apdex スコア、応答時間、スループット、およびエラーへの影響が一覧表示されます。このセクションは、New Relic がデプロイされた影響を受けるエンティティの下にあるアプリケーションを特定した場合にのみ表示されます。
問題のタイムラインとログ
イシューのタイムラインを見ると、以下のような内訳になっています。
- インシデント
- 起こっているトレンド
- どのインシデントがアクティブか
- どのようなインシデントが解決されたか
- 互いに相関しているもの
- 課題レベルに応じた様々なマイルストーン
問題ログの表示に関心がある場合は、問題ログ ボタンに切り替えるだけで、タイムスタンプと通知の詳細を表示できます。「さらに表示」をクリックして、完全な問題ログを表示することもできます。
さらに、タイムラインの上部に灰色の線が表示されます。各インシデントの変更を示す視覚的なタイムラインと比較すると、灰色の線は問題の変更を表しています。
グレーのラインにマウスオーバーすると、イベントの詳細が表示されます。
最後に、インシデントにマウスオーバーすると、特定のインシデントの場所、タイミング、重要度などの情報が表示されます。
この図は、1月11日に入力された特定のインシデントを示しており、そのレベルは Critical となっています。
課題をテキスト形式で表示するには、右端の「 Switch to issue log view」をクリックします。
課題概要
黄金の信号
ここでは、4 つのゴールデン シグナルのどれが問題に関連しているかを示します。これは、1 つ以上の重要な領域で、分散システムのパフォーマンスまたは可用性に影響を与える問題があることを意味します。
関連コンポーネント
タイトルを分析し、それに基づいてリストのコンポーネントから値を取得します。
また、スタック オーバーフロー タグ分析に基づいて、スタック トレースから派生したタグのリストも示します。
使用決定
ノイズをさらに減らしたり、インシデントの相関関係を改善したりするために、決定を変更またはカスタマイズできます。意思決定は、インシデントをグループ化する方法を決定します。
はじめに、 Decisions をご覧ください。