APMとインフラストラクチャデータのインテグレーションにより、1つのページからシステム全体の健全性を確認できます。APM Summaryページでは、ホスト、アプリ、イベント、およびアクティビティを監視し、埋め込み変更追跡を使用して、データを最近のデプロイメントと比較できます。1つのページからアラートへの応答、根本原因の特定を行い、ホストのパフォーマンスへの影響を迅速に解決できます。
まず、このドキュメントでは、APMを使用してインフラストラクチャのイシューを解決するプロセスについて説明します。その後、APMとインフラストラクチャのモニタリングの主な機能のいくつかをさらに詳しく説明します。
APMとInfrastructureデータの統合
とInfrastructureデータを統合するには、次の条件をすべて満たす必要があります。
APMエージェントとInfrastructureエージェントは同一のホストにインストールされていること
両方のエージェントは、同じ
を使用するか、または同じ組織内のアカウントのライセンスキーを使用する必要があります。
APMエージェントとInfrastructureエージェントに別のライセンスキーが使用されている場合、APM
Summary
ページを表示するユーザーは、両方のアカウントにアクセスできる必要があります。
両エージェントが同一のホスト名を使用していること
Kubernetesでホストされるアプリケーションの場合、APMがインストゥルメントしたアプリケーションをKubernetesにリンクするための追加のインテグレーション手順も必要です。
インテグレーションがうまくいかない場合は、APM-Infrastructureインテグレーションのトラブルシューティングをご覧ください。
アラートへの応答
この例では、あなたがBilling Service
アプリケーションを担当するエンジニアで、「Billing Service
で少なくとも5分間エラーの割合 > 45%」というアラートを受け取ったとします。
まず、APMの
Billing Service
アプリケーションに移動し、Summary
ページを開いて、システムの健全性の概要を確認してください。ユーザー満足度の尺度であるApdexスコアが高い場合は、システムに問題があることを示している可能性があります。ここでは、スコアが0.79で、重大なインシデントが発生していることがわかります。
次に、エラー率を確認します。ここでは、エラー率が100%に達していることがわかります。
これら2つの指標を考慮すると、問題があることがわかります。問題の場所と理由を特定するだけです。
エラー原因の特定
APM概要ページのInfrastructureセクションまでスクロールダウンします。ここには、Billing Service
アプリケーションに接続されている各ホストと、Response time、 Throughput、 Error rate、 CPU%、Memory %の記録をリストした表が表示されます。チャートの下には、これらのゴールデンシグナルの2つを強調表示するヒストグラムが表示されます。デフォルトの選択はCPU %とMemory %ですが、左上のドロップダウンメニューをクリックすると別のビューを選択することもできます。
検査対象のさまざまなゴールデンシグナルを切り替えることができます。
CPUヒストグラムを見ると、すべてのホストのCPU %が午前11時30分頃に急上昇していることがわかります。このCPUの変化は、最近のデプロイメントと同時に発生したこともわかります。デプロイメントマーカーをクリックすると、誰が変更をリリースしたか、その変更に何が必要かが表示されます。
特定のホストの詳細
Billing Service
アプリケーションに最近デプロイされたことで、エラーや重大なApdexインシデントが急増したことがわかりました。より明確にするために、特定のホストを調べることをお勧めします。検査対象のホスト名をクリックします。Infrastructureページからすべての関連情報をインポートするサイドバーが表示されます。これにより、残りのデータを残すことなく、ホストとサービスエラーに関して必要なすべての情報にアクセスできるようになります。
APM概要ページを離れることなく、ホストを検査します。
APMとInfrastructureモニタリングを使用したトラブルシューティングの方法を学びました。APMとインフラストラクチャのデータを統合して実践する方法を見ていきましょう。
APMおよびインフラストラクチャデータのログを表示
また、ログとアプリケーションのデータを統合して、トラブルシューティングをより簡単かつ迅速にできます。コンテキストのログでは、エラーとトレースに関連するログメッセージをアプリケーションのUIで直接表示できます。また、Kubernetesクラスタなど、インフラストラクチャデータのコンテキストでログを表示することもできます。別のUIページに切り替える必要はありません。
アプリケーションデータ別にフィルタリングする
とInfrastructureのデータがリンクされると、検査する特定のアプリケーションを検索して、表示されるホストデータをフィルタリングできます。上記の場合、Billing Service
をフィルタリングする必要があります。
インベントリとイベントUIページのAPMデータ
とInfrastructureデータがリンクされていると、InfrastructureモニタリングUI InventoryページとEventsページで、アプリケーションデータの表示やフィルタリングができます。
APMデータの欠落をトラブルシューティングする
エージェントとInfrastructureエージェントが同じホストにインストールされており、同じまたは同じ組織のライセンスキーのペアを使用し、同じホスト名が設定されている場合、APM/Infrastructureインテグレーションは自動的に行われます。
InfrastructureモニタリングでAPMデータが表示されない場合は、トラブルシューティングをご覧ください。