• EnglishEspañol日本語한국어Português
  • ログイン今すぐ開始

この機械翻訳は参考用に提供されます。

英語版と翻訳版に矛盾がある場合は、英語版が優先されます。詳細については、このページ を参照してください。

問題を作成する

Amazon Sagemaker の統合

New Relic インフラストラクチャの統合 には、AWS Sagemaker の統合が含まれ、メトリクス データを New Relic に送信します。

このドキュメントは、インテグレーションの機能、有効化する方法、および報告可能なデータについて説明するものです。

特徴

当社の統合を使用して、 Sagemaker からテレメトリ データを収集し、New Relic に送信します。サービスを監視し、受信データをクエリし、ダッシュボードを構築してすべてを一目で観察します。

統合をアクティブ化する

この統合を有効にするには、 AWS のサービスを New Relic に接続する方法を参照してください。

データを見つけて使用する

統合のメトリクスを見つけるには、 one.newrelic.com > Metrics and events に移動し、 aws.sagemakerでフィルタリングします。

メトリックデータ

この New Relic インフラストラクチャ統合は、次の Amazon Sagemaker データを収集します。

Sagemaker メトリックデータ

メトリック (最小、最大、平均、カウント、合計)

ユニット

説明

Invocations

Count

モデル エンドポイントに送信された InvokeEndpoint リクエストの数。

InvocationsPerInstance

Count

各 ProductionVariant の InstanceCount によって正規化された、モデルに送信された呼び出しの数。

OverheadLatency

マイクロ秒

SageMaker オーバーヘッドによってクライアントリクエストに応答するのにかかる時間に追加される時間間隔。

ModelLatency

マイクロ秒

モデルが SageMaker API リクエストに応答するまでにかかる時間間隔。

Invocation4XXErrors

Count

モデルが 4xx HTTP 応答コードを返した InvokeEndpoint リクエストの数。

Invocation5XXErrors

Count

モデルが 5xx HTTP 応答コードを返した InvokeEndpoint リクエストの数。

InvocationModelErrors

Count

2XX HTTP 応答が返されなかったモデル呼び出しリクエストの数。

Sagemaker からインポートされたすべてのデータには 1 つのディメンションがあります。 EndpointName

Sagemaker エンドポイントのメトリクス データ

メトリック (最小、最大、平均、カウント、合計)

ユニット

説明

MemoryUtilization

パーセント

インスタンス上のコンテナによって使用されるメモリの割合。エンドポイント バリアントの場合、値はインスタンス上のプライマリ コンテナと補助コンテナのメモリ使用量の合計です。

DiskUtilization

パーセント

インスタンス上のコンテナーによって使用されるディスク領域の割合。エンドポイント バリアントの場合、値はインスタンス上のプライマリ コンテナと補助コンテナのディスク領域使用率の合計です。

CPUUtilization

パーセント

個々の CPU コアの使用率の合計。エンドポイント バリアントの場合、値はインスタンス上のプライマリ コンテナと補助コンテナの CPU 使用率の合計です。

GPUMemoryUtilization

パーセント

インスタンス上のコンテナによって使用される GPU メモリの割合。エンドポイント バリアントの場合、値はインスタンス上のプライマリ コンテナと補助コンテナの GPU メモリ使用率の合計です。

GPUUtilization

パーセント

インスタンス上のコンテナによって使用される GPU ユニットの割合。エンドポイント バリアントの場合、値はインスタンス上のプライマリ コンテナと補助コンテナの GPU 使用率の合計です。

Sagemaker Endpoints からインポートされたすべてのデータには 1 つのディメンションがあります。 Host

Sagemaker トレーニング ジョブのメトリクス データ

メトリック (最小、最大、平均、カウント、合計)

ユニット

説明

MemoryUtilization

パーセント

インスタンス上のコンテナによって使用されるメモリの割合。トレーニング ジョブの場合、値はインスタンス上のアルゴリズム コンテナーのメモリ使用率です。

DiskUtilization

パーセント

インスタンス上のコンテナーによって使用されるディスク領域の割合。トレーニング ジョブの場合、値はインスタンス上のアルゴリズム コンテナのディスク領域使用率です。

CPUUtilization

パーセント

個々の CPU コアの使用率の合計。トレーニング ジョブの場合、値はインスタンス上のアルゴリズム コンテナーの CPU 使用率です。

TrainErrors

Count

トレーニング ジョブのトレーニング エラーの数を測定します。

Sagemaker トレーニング ジョブからインポートされたすべてのデータには、次の 1 つのディメンションがあります。 Host

アラートの作成

セットアップできます変更があった場合に通知するため。 たとえば、重大なエラーまたは致命的なエラーを関係者に通知するアラートを設定できます。

アラートの作成について詳しくは、こちらをご覧ください。

Copyright © 2024 New Relic株式会社。

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.