• /
  • ログイン

アラートのベストプラクティス

本ドキュメントでは、アラートの設定を最大限活用できるよう、ベストプラクティスと例を紹介します。

重要

本ドキュメントを読む前に、まずはAlertsのコンセプトとワークフローに目を通すことをお勧めします。

エンティティやメンバーのポリシーを定義する

ポリシーを設計する際は以下の点を考慮してください。

  • アーキテクチャのうち、責任者を必要とする部分
  • インフラの1つまたは複数の部分の責任者

1つの組織において、複数のエンティティがAPM、Browser、Infrastructure、Syntheticによって監視されている場合があります。各チームによる検討事例:

  • ソフトウェア開発者はウェブページのレスポンスタイムやページロード時の JavaScript エラーなど、フロントエンドとバックエンド両方のパフォーマンスに対して通知が必要かもしれません。
  • 運用担当者はサーバーのメモリやロードアベレージなど、バックエンドのパフォーマンス悪化時の通知が必要かもしれません。
  • プロダクト所有者(オーナー)は、エンドユーザーのApdexスコア改善やダッシュボードがモニターするセールスの増加といった、ポジティブなフロントエンドパフォーマンスに関する通知を必要とするかもしれません。

こうしたベストプラクティスに従うことで、責任者は彼らにとって重要なメトリックスについて対策を講じるきっかけとなる通知を受け取ることができ、組織はトレンドやパターンをより効率的に特定し対応することができます。

どのくらいの数の通知を受け取るかを制御

定義する条件が多いほど、トリガおよび監視できるインシデントも多くなります。例えば、皆様の組織で広範なITシステムに対応するアラートソリューションが必要かもしれません。1つまたは複数の通知チャネルを介して通知する、複数の監視エンティティ(ターゲット)向けに複数の条件を持ったポリシーを作成できます。インシデントプリファレンスを設定して、違反が通知につながる方法を決定します。

その一方で、広範なアラート構造を必要としない場合もあります。定義する条件の数を少なくして、インシデントプリファレンスを最低限にすることで、より少ない数の違反が開かれます。たとえば、シンプルなアラートソリューションに対しては、メール通知チャネルのみによるシンプルなポリシーを作成できます。

条件の閾値を設定する

ポリシーの条件に対する閾値を現在の環境に有意なレベルに設定します。以下は、いくつかの状況を想定したガイドラインです:

アクション

推奨事項

閾値のレベルの設定

低すぎる閾値を設定することは避けて下さい。 たとえば、CPUの条件の閾値を本稼働サーバーで5分間75%に設定すると、日常的にそのレベルを超え、対応に困るアラートや誤検知が増加します。

設定の試行錯誤

ファイルの編集やソフトウェアの再起動は必要ありません。このため、必要に応じて閾値のレベルを気軽に変更し調整できます。

設定の調整

徐々に条件を調整していく。

  • New Relicの製品を使用してエンティティのパフォーマンスを最適化しながら、パフォーマンスの向上に合わせて閾値を厳しくしていくことができます。
  • 一定期間、パフォーマンスに悪影響を及ぼすことがわかっているものを配備する場合は、これを許容するように閾値の条件を緩和してください。

設定の無効化

ポリシー内の条件は無効化できます。これは、たとえば他のメトリックスや閾値を試しながら、そのポリシーに対する他の条件を使い続けたい場合に便利です。

当社の大半の製品において(Infrastructureを除く)、ユーザーインタフェース内の稼働ステータスインジケータの色は、アラートの閾値を超えた際や正常状態に復帰した際に変わります。これによって、Criticalの閾値を超える前に所定の通知を受信することなく、当社のUIで状況をモニターすることができます。

たとえば、5分間に少なくとも1回はアプリケーションのエラー率が10パーセントとなった時に通知を行うクリティカル(赤)閾値を定義することができます。また、オプションの注意や警告(黄)閾値を異なる基準で定義することもできます。

通知チャネルを選択する

先に通知チャネルを作成し、後でそれらにポリシーを割り当てることも可能です。先にポリシーを作成し、後でそれらポリシーに通知チャネルを割り当てることも可能です。こうした柔軟性により、最も便利なやり方で、誰に通知するかを調整できます。

例えば、以下を行うことができます。

  • 運用チームのSlackチャネルを一般レベルのアラートとして特定し、オンコールのPagerDutyコンタクトを業務時間外やエスカレーションレベルの高いアラートとして使用できます。
  • さまざまな状況やスタッフ用にカスタマイズしたメッセージ付きのウェブフックを作成できます。

ヒント

通知を最も有益なチャネルとポリシーに調整することで、アラート疲れを回避すると共に、適切なスタッフがインシデントを受け取り、体系的なやり方で対処できます。

次のステップ

アラートの使用方法に関する詳細をご希望の場合:

その他のヘルプ

さらに支援が必要な場合は、これらのサポートと学習リソースを確認してください:

問題を作成するこのページを編集する
Copyright © 2020 New Relic Inc.