New Relic は、Amazon CloudWatch Metric Streams を使用して Amazon Web Services (AWS) と統合します。 CloudWatch Metric Streamsインテグレーションをインストールすると、 Amazon MemoryDBメトリクスとNew Relicプラットフォームのデータにアクセスできるようになります。
このドキュメントでは、インテグレーションをアクティブ化する方法を説明し、アクティブ化後に報告されるデータの種類について説明します。
特徴
Amazon MemoryDB クラスタに関するテレメトリーデータを収集すると、サービスを監視し、受信データを書き込み、ダッシュボードを構築してすべてを一目で観察できるようになります。
統合をアクティブ化する
この統合は、CloudWatch MetricStreams を通じて利用できます。 この統合を有効にするには、 を通じて AWSサービスをNew Relic CloudWatch Metric Streamsに接続する 方法を学習してください。
データを見つけて使用する
統合データを見つけるには、 one.newrelic.com > All capabilities > Metrics and eventsに移動し、 aws.memorydb
でフィルタします。
メトリックデータ
この統合により、Amazon MemoryDB データが収集されます。
MemoryDB クラスターデータ
メトリック | ユニット | 説明 |
---|---|---|
| 数 | アクティブなデフラグ プロセスによって 1 分あたりに実行される値の再割り当ての数。 これは、 INFOの active_defrag_hits 統計から導出されます。 |
| Count | AUTH コマンドを使用した認証の失敗回数の合計。 ACL ログ コマンドを使用して、個々の認証失敗に関する詳細情報を確認できます。 不正なアクセス試行を検出するために、これにアラームを設定することをお勧めします。 |
| バイト | データセット、バッファなど、すべての目的のために MemoryDB によって割り当てられたバイトの合計数。 |
| バイト | 1 分あたりにディスクから読み取られたバイトの合計数。 データティアを使用したクラスタでのみサポートされます。 |
| バイト | 1 分あたりにディスクに書き込まれたバイトの合計数。 データティアを使用したクラスタでのみサポートされます。 |
| Count | ユーザーが呼び出す権限のないコマンドを実行しようとして失敗した合計回数。 ACL ログ コマンドを使用して、個々の認証失敗に関する詳細情報を確認できます。 不正なアクセス試行を検出するために、これにアラームを設定することをお勧めします。 |
| Count | 読み取りレプリカからの接続を除いたクライアント接続の数。 MemoryDB は、それぞれの場合に 2 ~ 4 つの接続を使用してクラスタを監視します。 これは、 INFOの connected_clients 統計から取得されます。 |
| Count | キャッシュ内のアイテムの数。 これはキースペース統計から導出され、キースペース全体のすべてのキーを合計します。 |
| パーセント | クラスターで使用可能なメモリの使用率。 これは、 INFOの used_memory/maxmemory を使用して計算されます。 |
| パーセント | 使用中のクラスターの合計データ容量の割合。 データ ティア インスタンスでは、メトリクスは (used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD 合計容量) として計算されます。 used_memory と maxmemory はINFOから取得されます。 それ以外の場合はすべて、メトリクスは used_memory/maxmemory を使用して計算されます。 |
| ミリ秒 | INFO コマンドのキースペース統計から DBO の avg_ttl を公開します。 |
| パーセント | Valkey または Redis OSS エンジン スレッドの CPU 使用率を提供します。 エンジンはシングルスレッドなので、このメトリックを使用してプロセス自体の負荷を分析できます。 EngineCPUUtilization メトリクスは、プロセスをより正確に可視化します。 CPUUtilization メトリクスと組み合わせて使用できます。 CPUUtilization は、他の OS や管理プロセスを含むサーバーインスタンス全体の CPU 使用率を公開します。 4 つ以上の vCPU を備えた大規模なノード タイプの場合は、EngineCPUUtilization メトリクスを使用して監視し、スケーリング用の閾値を設定します。 |
| Count | 最大メモリ制限により削除されたキーの数。 これは、 INFOの evicted_keys 統計から導出されます。 |
| Count | ノードが現在のシャードのプライマリ ノードであるかどうかを示します。 メトリクスは 0 (プライマリではない) または 1 (プライマリ) のいずれかになります。 |
| Count | ユーザーがアクセス権を持たないキーにアクセスしようとして失敗した合計回数。 ACL ログ コマンドを使用して、個々の認証失敗に関する詳細情報を確認できます。 不正なアクセス試行を検出するために、これにアラームを設定することをお勧めします。 |
| Count | メイン辞書内の読み取り専用キー検索が成功した回数。 これは、 INFOの keyspace_hits 統計から派生したものです。 |
| Count | メイン辞書内の失敗した読み取り専用キー検索の数。 これは、 INFOの keyspace_misses 統計から導出されます。 |
| Count | キー追跡によって追跡されているキーの数を、tracking-table-max-keys のパーセンテージとして示します。キー追跡は、クライアント側のキャッシュを支援するために使用され、キーが変更されたときにクライアントに通知します。 |
| 1秒あたりのバイト数 | 最後の測定サイクル中に観測された最大のレプリケーション スループット。 |
| 数 | Valkey または Redis OSS エンジンのメモリ割り当ての効率を示します。 特定の閾値は異なる動作を意味します。 推奨値は、断片化が 1.0 を超えることです。 これは、 INFOの mem_fragmentation_ratio 統計から計算されます。 |
| Count | この期間中にサーバーが受け入れた接続の合計数。 これは、 INFOの total_connections_received 統計から導出されます。 |
| Count | 1 分あたりにディスクから取得されたアイテムの合計数。 データティアを使用したクラスタでのみサポートされます。 |
| Count | 1 分あたりにディスクに書き込まれるアイテムの合計数。 データティアを使用したクラスタでのみサポートされます。 |
| ブール値 | このステータスには 0 または 1 の 2 つの値があります。 値 0 は、MemoryDB プライマリノードのデータが EC2 上の Valkey または Redis OSS エンジンと同期されていないことを示します。 値 1 はデータが同期されていることを示します。 |
| Count | キー有効期限イベントの合計数。 これは、INFOの expired_keys 統計から導出されます。 |
| バイト | 複製された設定内のノードの場合、ReplicationBytes はプライマリがすべてのレプリカに送信しているバイト数を報告します。 このメトリクスはクラスタ上の書き込み負荷を表しています。 これは、INFOの master_repl_offset 統計から導出されます。 |
| Count | 同期レプリケーションにより遅延された書き込みコマンドの数。 レプリケーションは、ネットワークの輻輳や最大レプリケーション スループットの超過など、さまざまな要因により遅延される可能性があります。 |
| 秒 | このメトリクスは、リードレプリカとして実行されているノードにのみ適用されます。 これは、レプリカがプライマリ ノードからの変更を適用するのにどれだけ遅れているかを秒単位で表します。 |
アラートの作成
変更があった場合に通知するようにを設定できます。 たとえば、重大なエラーや致命的なエラーを関係者に通知するための集計を設定できます。
アラートの作成について詳しくは、こちらをご覧ください。