Infrastructureモニタリングのベストプラクティスガイド

邪魔されずにぐっすり眠りたい人のために、New Relicのインフラストラクチャモニタリングでダイナミックなインフラストラクチャやサーバーのモニタリングをさらに容易にする、8つのベストプラクティスをご紹介します。

ヒント

チュートリアルをお探しの場合は、Infrastructureホストデータのトラブルシューティングに関するチュートリアルをご覧ください。このチュートリアルシリーズでは、Infrastructure UIでデータを検索しインシデントを解決して、ホストに関するリソースを決定する方法を説明します。

1. Infrastructureエージェントを環境全体にインストールする

Infrastructureモニタリングソリューションは、企業顧客が大規模で動的に変化する環境を大規模にモニターできるよう設計されています。監視を容易にするため、UIは多数のサーバーの集計メトリクス、イベント、インベントリを可視化するタグのみで動作します。Infrastructureモニタリングを最大限に活用するには、環境全体でのインストール、できれば複数の地域やクラスタ全体でのインストールを推奨しています。これにより、ホストエコシステムの健全性や、インフラストラクチャがアプリケーションに与える影響をより正確に把握できます。

平均解決時間（MTTR）の短縮をご希望ですか？データベースサーバー、ウェブサーバー、アプリケーションをサポートするその他のホストに、Infrastructureエージェントをインストールします。エージェントをデプロイする際に、カスタムアトリビュートを使用してホストにタグ付けを行うと、UIに表示されるデータのフィルタリングや、アラート設定にこれらの属性を使用できます。Amazon EC2タグをお使いの場合は、EC2インテグレーションを有効にしたときに自動インポートされます。カスタム属性はこれに加えて使用できます。またエージェントログをシステムログとは別に保存することをご希望の場合も、設定によって行うことができます。

設定方法

Chef、Puppet、Ansibleなどの設定管理ツール用インストールモジュールを活用して、エージェントをすべてのインフラストラクチャに簡単にディプロイできます。
上記のリンクで参照されている設定管理ツールのgithubリポジトリの説明を読んで、ホストのタグ付けに使用するcustom_attributesを定義します。
log_file属性をInfrastructureエージェントのログに適した場所に設定します。

ヒント

単一のホストにエージェントをインストールする場合は、プロセスは数分で完了します。詳細な手順については、ドキュメントを参照してください。

2. ネイティブEC2インテグレーションを設定する

AWS環境を使用している場合は、EC2インスタンスにInfrastructureエージェントをインストールしてモニターするだけでなく、InfrastructureがAWSインスタンスに関連付けられたすべてのタグとメタデータをNew Relicが自動的にインポートするよう、EC2インテグレーションを設定することを推奨しています。

これにより、同じAWSタグ（例：ECTag_Role='Kafka'）を使用してインフラストラクチャの一部に絞り込み、データを複数の方法で細かく分割できます。さらにタグ駆動型で動的なやエンティティフィルタービューは、これらのタグに一致するインスタンスを自動的に追加・削除し、クラウドインフラストラクチャに合わせて最もリアルタイムなビューをユーザーに提供します。

3. インテグレーションを有効にする

インフラストラクチャのモニタリングは、CPU、メモリ、ストレージだけにとどまりません。そのためNew Relicには、ホストに対応したあらゆるサービスをモニターする、革新的なインテグレーション機能も備わっています。AWS CloudWatch、AWS Billing、AWS ELB、MySQL、NGINXなどのインテグレーションを有効にして、AWSまたはホスト上のアプリケーションにモニタリング機能を拡張し、それぞれに表示される事前設定されたにアクセスします。

4. ホストグループビューの作成

エンティティフィルターを使用すると、エンティティの便利なビューを保存できます。これにより、問題の事前監視、検出、解決にフォーカスを当てたビューで、リソースを最適化できます。また、保存済みビュー内で各ホストの稼働ステータスが色分けされて表示されるため、インフラストラクチャで問題のある領域を迅速に特定できます。

5. アラート条件を作成する

New Relicでは、監視対象エンティティのコンテキスト内で直接アラート条件を作成できます。たとえば、多くのホストで構成される保存済みビューを表示している際に問題を見つけた場合、その中のすべてのホストに対して個別のアラート条件を作成する必要はありません。代わりに、表示しているメトリックのチャートから直接アラート条件を開始し、フィルタータグに基づいてアラート条件を作成することが推奨されています。

これによりタグに一致するすべてのホストに対してアラート条件が作成されます。このため、Infrastructureモニタリングはオフラインになったホストを自動的に削除し、タグに一致する新しいホストをアラート条件に追加できます。適切なタグに設定されたアラートは、将来のすべてのホストにわたって正確に適用されます。またInfrastructureのアラート条件の既存のアラートポリシーを活用することもできます。

6. InfrastructureデータをAPMデータとともに表示する

APMとInfrastructureモニタリングのインテグレーションにより、APMデータとInfrastructureデータを並べて表示し、問題の発生箇所にかかわらず根本的な原因を迅速に発見できます。この機能により、ユーザーはお使いのホストとホスト上で実行されるアプリケーションのパフォーマンスについての関係を確認し、問題そのものや、問題がビジネスの健全性に与える影響を迅速に診断することが可能です。

ヘルスマップを使用して、アプリケーションの健全性に関する問題またはアラート、それが対応するインフラストラクチャにどう関連するかを、迅速に発見できます。左上から始まる最初のほうのボックスには注意が必要です。

7. メトリクスとイベントを使用したインフラストラクチャデータへのアクセス

複数のNew Relicの機能を使用する場合、Infrastructureの健全性とアプリケーション、ブラウザ、Syntheticsメトリクスを視覚的に関連付ける単一のダッシュボードを作成すると便利です。ここでは、データ調査機能を使用します。インフラストラクチャモニタリングで収集された詳細なデータはすべてNew Relicに保存され、すぐにアクセスできます。未処理のメトリクスにアクセスできるため、NRQLを使ってより多くのクエリを実行したり、ダッシュボードを作成してInfrastructureメトリクスをチームと共有したりできます。

8. エージェントを定期的に更新する

New Relicのソフトウェア開発チームでは、全体的な監視体験の向上を目指し、常に改良や新機能をリリースしています。これらの改良や新機能を最大限に活かすため、定期的にInfrastructureエージェントを最新バージョンに更新することを推奨しています。

ユーザー用の詳細なヒントが必要ですか？

New Relic Universityでトレーニングビデオをご覧ください。
ドキュメントをお読みください。
チュートリアルをご覧ください。
質問は、New Relicサポートフォーラムでしてください。