データ インジェスト ガバナンスは、 組織によって収集されたテレメトリ データの最適な価値を得るためのプラクティスです。これは、多数のビジネス ユニットとワーキング グループを持つ複雑な組織にとって特に重要です。これは、New Relic データの取り込みを最適化するための 4 部構成のガイドの最初の部分であり、 オブザーバビリティの成熟度に関するシリーズの一部です。
摂取計画のコンテキストと説明責任のレベルを確保するには、いくつかの明示的な役割と実践を指定する必要があります。少なくとも、ガバナンスチームを選択し、必要に応じて計画と適応を行うために、年間を通じてチェックインをスケジュールします。
始める前に
このガイドには、データの取り込みを最適化するための詳細な推奨事項が含まれています。このガイドを使用する前に、 一般的なデータ管理ドキュメントを確認することをお勧めします。
ステークホルダーと参加者
組織のチームがどのように構成されているかに関係なく、データ取り込みガバナンスプロセスに参加する個人を特定する必要があります。チームの選択は臨時で行うことができますが、優先順位と決定を行う必要がある場合に知識と権限を適切に組み合わせることができるように、チームの十分に広い断面からの代表を含める必要があります。チームには、全体的な可観測性マネージャーと見なすことができる1人の個人が必要です。これは、New Relicアカウントを管理する人、またはNewRelicによって監視されるシステムとインフラストラクチャを担当するオーバーライドチームリーダーである可能性があります。
オブザーバビリティ・マネージャ

これは、対立を解決し、必要に応じて上級管理職とコミュニケーションをとるのに役立つ頼りになる人物です。組織に灰色の所有権領域が含まれている場合、「このkubernetesクラスターの所有者は誰ですか?」などの質問につながる可能性があります。そして「なぜ今週これほど多くのデータを送信するのですか?」、この個人は尽力しています。可観測性マネージャーは、必要に応じて、技術的な個人の貢献者や上級管理職と対話することができます。可観測性管理者は、厳しい決定が必要な場合に、コンセンサスと協力を促進できなければなりません。
ガバナンスチーム

可観測性マネージャーは、このチームのリーダーとして機能します。ガバナンスチームのメンバーは、NewRelicで監視されているシステムとサービスの実用的な技術的知識を持ち込みます。それらは、可観測性マネージャーのピアまたは直属の部下である可能性があります。それらは、組織全体(チームまたはビジネスユニットを超越する)の高品質の可観測性という共通の目標を共有しています。
可観測性センターオブエクセレンス(OCoE)などの既存の構造がある場合、ガバナンスチームは主にコアOCoEチームで構成できます。
OCoEチームの主な責務は、一般的に以下の通りです。
- New Relicとの関係を維持する。
- アカウントとユーザーを管理する。
- 新しいチームや個人を受け入れる。
- 観測可能な知識ベースを維持する。
- チーム間のコラボレーションと共有を促進する。
データ取り込みガバナンスを組み込むと、次の責任が追加されます。
- 観測可能なマネージャーと協力して、毎月のインジェスト目標を達成する。
- データ取り込みのベースラインを監視し、異変に対応する。
- 必要に応じて、データの最適化/削減のための計画を立案し、承認する。
- 定期的に行われるチェックインに参加し、ベースラインデータを分析し、インジェストターゲットと比較します。
- 必要に応じてインジェストターゲットを修正する。
タイムラインとチェックイン
年間を通じてデータインジェストガバナンス会議を開催し、データインジェストの量について全員が最新情報を把握できるようにする。そうすることで、データインジェストガバナンスが予測可能になり、管理が容易になります。
インジェストターゲットの年間計画

組織全体の遠隔測定インジェストターゲットを維持するために会う。これは、組織にとって有用である限り、いくつものファセットに分割することができる。例えば、次のようなインジェストターゲットを採用することができます。
- 組織全体(毎月):1000TB
- チームA(毎月):500TB
- チームB(毎月):300TB
- チームC(毎月):100TB
この大まかなターゲットのセットは、不確実性のバッファーとして100TBを残します。また、特定の非常に可変的なテレメトリに基づいて、テレメトリ固有の制限を選択することもできます。たとえば、ログまたはメトリックの取り込みに組織ベースまたはチームベースの制限を設定できます。
毎月のインジェストチェックイン
これらのセッションでは、計画に照らして摂取量を追跡し、目標を達成するために必要なアクションアイテムを作成します。上記のターゲットの例を使用して、チームA、B、およびCが合意された取り込みターゲットを満たしているかどうかを知りたいと思います。何かがずれている場合、ガバナンスチームは最適化計画を提案します。
アドホック・アノマリー・レゾリューション

通常、これらのセッションは、放置すると組織の予算に大きな影響を与えるイベントのために予約されています。これらの異常には多くの原因があります。注意すべきいくつかのシナリオ:
- 新しいソフトウェアを導入すると、ログ量が3倍になる。
- あるチームが新しいクラウド統合をいくつか実現したところ、メトリクスの摂取量が予想に反して200%も増加しました。
- 新会社の買収により、全体のテレメトリ量が増加する。
- ピーク前のビジネスシーズンのアクティビティといくつかのピーク前のリファクターを組み合わせると、予想よりもはるかに多くのカスタムイベントの量が発生します。
このシリーズの最適化の部分は、これらの異常を評価し、可能なアクションを実行するための構造化されたアプローチを提供します。