レベル 0 の計測されていないエンティティ スコアカード ルールは、適切な監視計装が欠如しているシステム内のサービスと依存関係を特定します。 これらの計測されていないエンティティは、監視の盲点を生み出し、サービスの依存関係の全体像とそれがシステム パフォーマンスに及ぼす影響を理解することを困難にします。
この規則が測定するもの
このスコアカード ルールは、HTTP サービスおよびデータベースとの不明な関係を持つエンティティを検出します。エンティティに複数の不明な関連エンティティがある場合、ルールは失敗し、計装範囲が不完全であることを示します。
具体的には、このルールでは次のことを規定しています。
- インストルメント化されていない HTTP サービスまたは API を呼び出すサービス
- 計測されていないデータベースに接続するアプリケーション
- トレースに表示されるが、独自の監視エージェントがない依存関係
- システムに影響を与えるが直接観察できない外部サービス
これらのギャップを理解すると、次のことが可能になります。
- サービス依存関係マッピングの盲点を特定する
- ビジネスへの影響に基づいて計装の取り組みに優先順位を付ける
- サービス提供チェーン全体にわたる包括的な可視性を実現します
- 計測されていない依存関係に関連するリスクをより適切に管理する
スコアの解釈方法
計測されていないエンティティ スコアは、サービスの依存関係がどの程度完全に監視されているかを反映します。 結果を理解する方法は次のとおりです。
- 高スコア (80-100%) : ほとんどのサービス依存関係がインストゥルメント化されており、包括的な可視性を提供します。
- 中程度のスコア(50〜79%) :中程度の計装カバレッジですが、対処すべき盲点がいくつかあります。
- 低スコア(0~49%) : 計画に重大な欠陥があり、問題のトラブルシューティング能力に影響する可能性があります。
このルールは、サービス関係を完了するために追加の計装から恩恵を受けるエンティティを特定するのに役立ちます。 目標は、依存システム間の十分な可視性を実現し、下流の依存関係の制限や問題によってサービスの動作がどのように影響を受けるかを理解し、管理することです。
重要
インストルメント化されていない依存関係は、多くの場合、原因不明のパフォーマンス問題の原因となります。これらのサービスに対する可視性がなければ、問題が発生した場合のトラブルシューティングは非常に困難になります。
推奨されるアクション
計測されていないエンティティのスコアを向上させるには、次の戦略を使用します。
1. ビジネスへの影響と複雑さに応じて優先順位を付ける
計装の取り組みを戦略的に集中させます。
- 計測されていないエンティティをビジネスオペレーションへの重要度でランク付けする
- 計装に必要な複雑さと労力を考慮する
- パフォーマンスの問題を頻繁に引き起こす依存関係を優先する
- 収益を生み出す機能や顧客対応機能をサポートするサービスに重点を置く
2. 繰り返し発生する計測されていない依存関係を特定する
計装ギャップの包括的な目録を作成します。
- トレースで常に計測されていないエンティティをドキュメント化する
- これらの計測されていないエンティティに依存するビジネス サービスをマップします
- 計装が欠けているサービスの種類のパターンを特定する
- インストルメント化されていない依存関係の呼び出し頻度を追跡する
3. 包括的な計装戦略を策定する
計装のギャップを埋めるためのアプローチを計画します。
- 標準のAPMエージェントでどのエンティティをインストゥルメントできるかを決定する
- 代替の監視アプローチを必要とするサードパーティのサービスを特定する
- カスタムインストゥルメンテーション ソリューションが必要となる可能性があるレガシー システムを計画する
- 追加の計装を維持するための運用上のオーバーヘッドを考慮する
4. 代替的な監視アプローチを検討する
計測されていないエンティティの可視性を得るためのさまざまな方法を検討してください。
- 外部監視: 外部サービスと API を外部からテストする
- インフラストラクチャモニタリング: Flexまたはカスタムエージェントを使用してサービス健全性エンドポイントを評価する
- ログ分析: アプリケーションとサービスログからパフォーマンスデータを抽出します。
- ネットワーク監視: トラフィック パターンと応答時間をネットワーク レベルで監視します。
- カスタム テレメトリー: 独自のシステムまたは従来のシステム向けにオーダーメイドのソリューションを開発します。
5. 実装と影響の測定
新しい監視ソリューションを展開し、改善を追跡します。
- 最も優先度の高い未計測エンティティのパイロット実装から開始します
- 価値を証明するために前後の評価を実施する
- 関連するインシデントの平均解決時間(MTTR)の改善を測定します
- 可視性の向上によるビジネスへの影響を文書化する
6. 継続的なガバナンスを確立する
新たな盲点を防ぐためのプロセスを作成します。
- サービス デプロイメント チェックリストに計装要件を含める
- 計装ギャップに対する新しいサービスの依存関係を定期的にレビューする
- サードパーティおよび外部依存関係を監視するための標準を確立する
- 新しいインストルメント化されていない依存関係が検出されたときにアラートを作成する
重要な考慮事項
計測されていないエンティティに対処するときは、次の要素に留意してください。
すべてに計装が必要なわけではありません。ユーザー体験やビジネス運営に影響を与える依存関係に焦点を当てます。 一部の外部サービスでは、包括的な監視に必要な労力が保証されない場合があります。
コストと価値を考慮してください。計装には運用上のオーバーヘッドがあります。 得られた可視性が、追加の監視を実装および維持するために必要なリソースを正当化するかどうかを評価します。
外部依存関係を計画する: サードパーティのサービスや外部 API は、直接インストゥルメントできないことがよくあります。 外形監視やAPIヘルスチェックなどの代替戦略を開発します。
レガシー システムを考慮する: 古いシステムでは計装オプションが制限されている場合があります。 カスタム ソリューションに投資する価値があるかどうか、または代替アプローチで十分な可視性が得られるかどうかを検討します。
完全性と保守性のバランスをとる: 包括的なカバレッジが理想的ですが、チームが長期的に維持できる持続可能なソリューションに重点を置きます。
次のステップ
環境内のインストルメント化されていないエンティティを削減するには:
- クリティカルな依存関係から始める: インストゥルメントで最もビジネスクリティカルな未計測エンティティから始める
- 最初に既存のツールを使用する: カスタム ソリューションを開発する前に、標準のAPMエージェントと組み込みの監視機能を活用します。
- 影響の測定: 改善された計装が問題のトラブルシューティングと解決能力にどのような影響を与えるかを追跡します。
- 体系的に拡張する: 重大なギャップに対処したら、計装を他の依存関係に徐々に拡張します。
完全な計装カバレッジにより死角が排除され、トラブルシューティング時間が短縮され、技術スタック全体にわたって信頼性の高いサービス提供を維持するために必要な可視性が提供されます。