• ログイン今すぐ開始

本書は、お客様のご参考のために原文の英語版を機械翻訳したものです。

英語版と齟齬がある場合、英語版の定めが優先するものとします。より詳しい情報については、本リンクをご参照ください。

問題を作成する

Ktranslate の CPU 使用率について

問題

ktranslate コンテナの CPU 使用率が 100% に達したか、通常は予想よりも高くなっています。

ヒント

注意すべき詳細の 1 つは、ktranslate では、平均ではなく最大 CPU パーセントに注目することが重要であるということです。Ktranslate は、ポーリング サイクルの開始近くで高い割合の CPU を使用し、サイクルの終了時にははるかに少なくなります。平均使用率を見ると、60% が表示され、ktranslate が 100% 近くの時間を費やしているという事実を見逃す可能性があります。これは潜在的な問題です。最大 CPU 使用率が 100% に達しないように、十分なリソースを割り当てる必要があります。

ソリューション

CPU 使用率の原因は、使用している ktranslate コンテナーのタイプによって異なります。

SNMP

SNMP コンテナーでは、主に、ターゲット デバイスから収集する必要があるデータ ポイントの数と、各データ ポイントの収集に費やす時間が原因で、CPU 使用率が増加します。

SNMP 要求に応答する際の待ち時間が長いデバイスは、より多くのリソースを効率的に必要とします。timeoutを長くするかretriesを長くすると、これらの遅いデバイスからデータを取得してチャートのギャップを回避する可能性が高くなりますが、コンテナーに提供する必要があるリソースの量も増加します。また、多数の SNMP トラップ イベントが着信する可能性もあります。一般的な見積もりとして、CPU ごとに 1 秒あたり約 1000 のイベントを取り込むことができるはずです。

使用率が高い場合のオプションは次のとおりです。

  • ホストに CPU を追加して、既存のワークロードを処理します。
  • poll_time_secグローバルまたはデバイス固有の構成で大きな数値を指定して、ポーリング間隔を増やしてください。
  • ktranslate 構成 yaml のデバイス セクションからデバイスを削除し、自動再検出に含まれないようにすることで、ポーリングされるデバイスの数を減らします。
  • 必要のない MIB をmibs_enabledグローバル リストから除外します (あまり一般的ではありません)。
  • ネットワーク デバイスの構成を変更して送信しないようにすることで、価値の低い/ノイズの多い SNMP トラップの量を減らすことができます。

フロー

フロー コンテナでは、主にインバウンド フロー イベントの数によって CPU 使用率が増加します。一般的な見積もりとして、CPU ごとに 1 秒あたり約 1000 のイベントを取り込むことができるはずですが、負荷はフロー プロトコルによってわずかに異なります。

使用率が高い場合のオプションは次のとおりです。

  • ホストに CPU を追加して、既存のワークロードを処理します。
  • 重要なインターフェイスでのみフローを収集するか、可能であればサンプリングされたフローを使用するなど、ネットワーク デバイスの設定を変更して、着信フローの量を減らします。

Syslog

syslog コンテナーでは、主に、インバウンド syslog イベントの数が原因で CPU 使用率が増加します。一般的な見積もりとして、1 秒あたり約 1000 個のイベントを取り込むことができるはずです。

使用率が高い場合のオプションは次のとおりです。

  • ホストに CPU を追加して、既存のワークロードを処理します。
  • 特定のタイプのメッセージまたは重大度を送信しないようにネットワーク デバイスの構成を変更して、価値の低い/ノイズの多い syslog イベントの量を減らします。これらの変更を行う方法については、デバイス ベンダーのドキュメントを参照してください。
Copyright © 2023 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.