• EnglishEspañol日本語한국어Português
  • ログイン今すぐ開始

この機械翻訳は、参考として提供されています。

英語版と翻訳版に矛盾がある場合は、英語版が優先されます。詳細については、このページを参照してください。

問題を作成する

NVIDIA Triton インテグレーション

NVIDIA Triton インテグレーションは、本番環境での AI モデルの展開と管理を監視します。 Triton は、ディープラーニング モデル向けの柔軟でスケーラブルなソリューションを提供し、GPU や CPU を含むさまざまなハードウェア プラットフォームにわたって AI アプリケーションを効率的にデプロイできるようにします。

NVIDIA Triton インテグレーションをセットアップすると、NVIDIA Triton メトリックのダッシュボードが提供されます。

インフラストラクチャエージェントをインストールします

NVIDIA Triton インテグレーションを使用するには、同じホストにインフラストラクチャエージェントもインストールする必要があります。 インフラストラクチャエージェントはホスト自体を監視し、次のステップでインストールするインテグレーションは NVIDIA Triton 固有のデータを使用して監視を拡張します。

NVIDIA Tritonインテグレーションを有効にする nri-prometheus

Triton サーバーのメトリックは URL http://localhost:8002/metricsに表示されます。

NVIDIA Triton インテグレーションをセットアップするには、次の手順に従います。

  1. このコマンドを実行して、インテグレーション ディレクトリにnri-prometheus-config.ymlという名前のファイルを作成します。

    bash
    $
    touch /etc/newrelic-infra/integrations.d/nri-prometheus-config.yml
  2. エージェントが NVIDIA Triton データをキャプチャできるようにするには、次のスニペットをnri-prometheus-config.ymlファイルに追加します。

    integrations:
    - name: nri-prometheus
    config:
    # When standalone is set to false nri-prometheus requires an infrastructure agent to work and send data. Defaults to true
    standalone: false
    # When running with infrastructure agent emitters will have to include infra-sdk
    emitters: infra-sdk
    # The name of your cluster. It's important to match other New Relic products to relate the data.
    cluster_name: "YOUR_DESIRED_CLUSTER_NAME"
    targets:
    - description: NVIDIA Triton metrics list
    urls: ["http://localhost:8002/metrics"]
    # tls_config:
    # ca_file_path: "/etc/etcd/etcd-client-ca.crt"
    # cert_file_path: "/etc/etcd/etcd-client.crt"
    # key_file_path: "/etc/etcd/etcd-client.key"
    # Whether the integration should run in verbose mode or not. Defaults to false
    verbose: false
    # Whether the integration should run in audit mode or not. Defaults to false.
    # Audit mode logs the uncompressed data sent to New Relic. Use this to log all data sent.
    # It does not include verbose mode. This can lead to a high log volume, use with care
    audit: false
    # The HTTP client timeout when fetching data from endpoints. Defaults to 30s.
    # scrape_timeout: "30s"
    # Length in time to distribute the scraping from the endpoints
    scrape_duration: "5s"
    # Number of worker threads used for scraping targets.
    # For large clusters with many (>400) endpoints, slowly increase until scrape
    # time falls between the desired `scrape_duration`.
    # Increasing this value too much will result in huge memory consumption if too
    # many metrics are being scraped.
    # Default: 4
    # worker_threads: 4
    # Whether the integration should skip TLS verification or not. Defaults to false
    insecure_skip_verify: true
    timeout: 10s

NVIDIA Triton ログ設定

nvidia triton ログを構成するには、以下の手順に従います。

  1. 実行中のコンテナのステータスを確認するには、次のdockerコマンドを実行します。

    bash
    $
    sudo docker ps
  2. nvidia-tritonコンテナのコンテナ ID をコピーし、次のコマンドを実行します。

    bash
    $
    sudo docker logs -f <container_id> &> /tmp/triton.log &

    その後、 /tmp/ディレクトリにtriton.logという名前のログファイルがあることを確認します。

NVIDIA Triton ログを New Relic に転送する

ログ転送を使用して、NVIDIA Triton ログを New Relic に転送できます。 Linux マシンでは、 logging.ymlという名前のログファイルはこのパスにある必要があります。

bash
$
cd /etc/newrelic-infra/logging.d/

上記のパスでログファイルを見つけたら、次のスクリプトをlogging.ymlファイルに含めます。

logs:
- name: triton.log
file: /tmp/triton.log
attributes:
logtype: triton_logs

New Relic インフラストラクチャ エージェントを再起動します

このコマンドを実行して、 インフラストラクチャエージェントを再起動します。

bash
$
sudo systemctl restart newrelic-infra.service

数分以内に、NVIDIA Triton サーバーはメトリックをone.newrelic.comに送信します。

データを検索する

NVIDIA Triton サーバー メトリックを監視するには、 NVIDIA Tritonという名前の事前に構築されたダッシュボード テンプレートを選択できます。 事前に構築されたダッシュボード テンプレートを使用するには、次の手順に従ってください。

  1. one.newrelic.com > + Integrations & Agentsに移動し、 NVIDIA Tritonと入力します。

  2. Dashboards [ダッシュボード]の下で、 NVIDIA Tritonをクリックします。

  3. 開いたポップアップ ウィンドウでアカウントを変更する場合は、 Edit [編集] をクリックします。

  4. Setup NVIDIA Triton 「NVIDIA Triton のセットアップ」をクリックするか、このデータソースがすでにセットアップされている場合は、Skip this step [この手順をスキップします]。

  5. 「ダッシュボードの表示」をクリックして、New Relic で NVIDIA Triton データを表示します。

    カスタム NVIDIA Triton ダッシュボードはDashboards UI にあります。 詳細についてはダッシュボードのセクションをご覧ください。

    NVIDIA Triton CPU メモリをチェックするためのNRQL クエリを次に示します。

    SELECT latest(nv_cpu_memory_total_bytes) / 1e+6 AS 'memory (MB)' FROM Metric

次は何ですか?

NRQL クエリの作成とダッシュボードの生成の詳細については、次のドキュメントをご覧ください。

Copyright © 2024 New Relic株式会社。

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.