インフラストラクチャ監視 UI では、 Hosts UI ページがインフラストラクチャの問題を理解し、トラブルシューティングを行うための主な場所です。
ヒント
これらのドキュメントでは、2023 年 4 月に追加された新しいHosts UI について説明します。 新しいビューとClassicビューを切り替えることができます。
one.newrelic.com > All capabilities > Infrastructure
使用例の例
Hostsページは、インフラストラクチャの問題を調査するための場所です。 以下は、顧客が問題を診断するために使用する一般的なワークフローの一例です。
- APM の概要ページで、Kafka サービスの問題に気づきました。スループットが低下し、多くのエラーが発生します。
- APM に表示されるインフラストラクチャ データに基づいて、これはホストの問題であると考え、クリックしてインフラストラクチャHostsページに移動します。
- Hostsページは、Kafka サービスに自動的にフィルターされます。 そのサービスを実行しているホストの半分が CPU % を上限に達していることがわかります。
- ホストの設定変更が問題の原因である可能性があると思われる場合は、 Inventoryタブに移動してホストごとのシステムの設定を確認してください。
ホストを探索および分析するための UI 機能
Hosts UI 全体で利用できる重要な UI 機能がいくつかあります。 これらの使用方法を理解すると、この UI を最大限に活用することができます。
- A. フィルター バー: 表示するホストをフィルターします。 ヒントについては、 「フィルター バー」を参照してください。
- B. 保存されたビュー: 好みのビュー (フィルター、カスタムのグラフや表の選択を含めることができます) を作成するときに、 Saveをクリックします。
- C. グラフ オプション: グラフごとに異なるメトリクスに切り替えることができます。また、
...
をクリックすると、共有可能なリンクの取得やそのメトリクスのアラートの作成など、その他のグラフ オプションが表示されます。 - D. グループ化: これを使用して、グラフの結果を特定の属性ごとにグループ化します。 たとえば、CPU 使用率が最も高い AWS リージョンを
awsRegion
でグループ化して表示できます。 - E. 属性フィルター: これにより、ホストを特定のプロパティ値を持つホストにフィルターできます。 例えば、
- F. ホスト テーブル: デフォルトでは、25 個のホストが表示用に選択されています。 テーブルの列と属性フィルターを使用してホストを調べ、表示する別のホストを選択します。 テーブルを CSV としてエクスポートできます。
- G. ホストの詳細: ホストテーブル内の特定のホストについては、 アイコンをクリックすると、ログの表示、エンティティマップの表示などのオプションを含む、それについて学ぶためのその他のオプションが表示されます。
ホスト UI ページのタブ
Hosts UI ページで使用できるタブの詳細は次のとおりです。
HostsページのSummaryタブには、ホストのパフォーマンスの概要が表示されます。
one.newrelic.com > All capabilities > Infrastructure
このページの上部にあるタイルには、ホスト、アプリケーション、イベント、アラートの概要が表示されます。 これらのタイルを使用して、ホストの詳細を表示したり、 Summaryページ全体を特定のホストにフィルタリングしたりできます。
Summaryページのタイムピッカーはメトリクス タイルとグラフのみを調整しますが、ホスト テーブルは調整しません。 Hosts UI の他のタブには、タイムピッカーによって設定された時間範囲を反映するテーブルがあります。
Systemタブには、システムの概要が表示されます。 これはSummaryタブに似ていますが、システムのいくつかの側面についてより詳細な情報を検索できます。
one.newrelic.com > All capabilities > Infrastructure > Hosts > System
Systemページに表示されるデフォルトのグラフは次のとおりです。
CPU %: これは、 SystemSample
イベントに関する他のいくつかのメトリクスから派生したメトリクスです。 具体的には、 cpuPercent
属性はcpuUserPercent
、 cpuSystemPercent
、 cpuIoWaitPercent
およびcpuStealPercent
の集合です。
Load average five minute: 過去 5 分間にシステム上で作業を待機しているタスクの数の平均を表します。
Memory free %: 空きメモリのバイト量と使用されているメモリのバイト量を比較します。
これらのグラフの生成に使用されるデータの詳細については、 「 SystemSample 」を参照してください。
Networkページでは、ネットワーク上の個々のホスト、Web サーバー、またはその他のリソース グループの健全性とパフォーマンスをリアルタイムで確認できます。 デフォルトのグラフには、パケットごとの帯域幅メトリクス、バイトごとの帯域幅、および 1 秒あたりのエラー数が表示されます。
one.newrelic.com > All capabilities > Infrastructure > Hosts > Network
個々のインターフェースに関する詳細は、次のことに役立ちます。
ネットワーク全体または選択したホストの飽和レベルを調べます。
特定のリソース間の負荷分散を比較します。
類似のホスト間の容量パターンの予期しない違いを特定します。
検出された上位 5 つのネットワーク エラーを評価します。
このリアルタイムのネットワークデータは、購入を決定する前に、ネットワークを再構成したり、負荷を再調整したり、その他の予防保守アクションを実行したりして、エラーを解決するかどうかを判断するのに役立ちます。
これらのグラフの生成に使用されるデータの詳細については、 「 NetworkSample 」を参照してください。
Processesタブを使用して、ホスト上で実行されているプロセスに関する情報を取得し、プロセス メトリクスにアラートを設定します。 Processesタブには、個々のプロセスまたはプロセスのグループごとの CPU パーセンテージ、I/O バイト、メモリ使用量などのデータが表示されます。
one.newrelic.com > All capabilities > Infrastructure > Hosts > Processes
Processesタブでは、CPU パーセントの範囲はホストではなく個々のプロセスに限定されます。 このため、メトリクスの CPU パーセントはシステム全体のリソースを考慮していません。 代わりに、各プロセスが 1 つの CPU コアをどれだけ使用しているかを示します。
これらのグラフの生成に使用されるデータの詳細については、 「 ProcessSample 」を参照してください。
問題を正確に突き止め、アラートを設定する方法の例は次のとおりです:
Hostsページを見ると、クラスターの CPU パーセンテージが通常よりも大幅に高いことがわかります。
Processesページに移動し、そのクラスターのプロセスをフィルター処理します。
同じプロセスのいくつかのインスタンスで、CPU使用率が高くなっていることが分かりました。
問題を解決した後、そのプロセスタイプのCPUの使用率が特定の閾値を超えた場合に起動するアラート条件を作成することにしました。
ヒント
UIからプロセスを開始、停止、または再開することはできません。代わりに、標準の手順に従って、インフラストラクチャエージェントを手動で開始、停止、確認、または再起動します。
one.newrelic.com > All capabilities > Infrastructure > Hosts > Storage
Storageタブでは、デバイスの全体的な使用率、ディスク使用率、I/O 操作など、リソースの容量と効率を監視できます。 これは次のことに役立ちます。
予期しないパターンを調べます。たとえば、I/Oタスクを均一に処理しないミラーリングされたマシンのクラスター。
ディスク容量が完全になくなる前に、使用レベルを監視します。
1つ以上のホストの問題について通知するアラート条件を設定します。たとえば、読み取りまたは書き込み操作の処理時間が長い、ディスクの可用性またはパーセンテージまたはバイトに基づく使用率など。
通常の処理要求よりも多いまたは少ないホストをどこに再配布するかについて、十分な情報に基づいて決定します。
データを使用して、緊急事態が発生する前にインフラストラクチャ予算の追加または変更を計画するのに役立ててください。
これらのグラフの生成に使用されるデータの詳細については、 「 StorageSample 」を参照してください。
Containersタブを使用して、ホスト上で実行されているコンテナに関する情報を取得し、コンテナのメトリクスに関するアラートを設定します。 このタブには、個々のコンテナーまたはコンテナーのグループの CPU パーセンテージ、I/O バイト、メモリ使用量などのデータが表示されます。 この情報は次の目的で使用します。
Infrastructureデータ
インフラストラクチャ データの詳細については、 「インフラストラクチャ データ」を参照してください。