AIアプリの応答データを表示する

AI モニタリングを有効にすると、エージェントはアプリの AI レイヤーに関するパフォーマンスメトリクスデータとトレースデータを認識してキャプチャできるようになります。 AI モニタリングを使用すると、AI 搭載アプリから、インターネットの使用状況、完了数、AI 応答時間を追跡できます。エラーまたは不正確な応答が見つかった場合は、特定のプロンプトと応答のインタラクションに関するトレースレベルのビューに範囲を絞り、AI サービスのロジックの問題を特定できます。

An image that shows the kind of data you get when you enable AI monitoring

one.newrelic.com > All Capabilities > AI monitoringにアクセスするとデータを表示できます。データは 3 つの異なるページから確認できます。

AI responses
: すべての AI エンティティからの集約データの概要。 AI の応答タイムやウイルスを追跡したり、個々のプロンプトや応答に関するデータを確認したりできます。
AI entities
: AI データをレポートするすべてのエンティティの表の概要を表示します。エラー率、スループット、アプリの応答タイムなどの標準的なAPMデータでエンティティを確認します。エンティティを選択すると、APM AI responsesページの探索を開始できます。

AI応答ページ

最上位のAI responsesページには、AI データが集約されて表示されます。集計データは、すべてのエンティティレポート AI データにわたる、平均総応答数、応答時間、応答ごとの使用量を取得します。このページでは、応答とは、プロンプトが与えられたときの AI 搭載アプリからの出力を指します。

さまざまな AI フレームワークのさまざまな実装を備えた複数のアプリを所有している場合は、AI モデルのパフォーマンスを大まかに把握できます。

合計応答、平均応答時間、トークンの使用状況を追跡します。

A cropped screenshot displaying the time series graphs and billboard info about AI data

3 つのタイルには、AI の応答に関する一般的なパフォーマンスメトリクスが表示されます。これらのタイルは問題の正確な原因を教えてくれないかもしれませんが、アプリのパフォーマンスの異常を特定するのに役立ちます。

A cropped screenshot displaying billboard info about AI data

総応答数の減少または平均応答時間の増加に気付いた場合は、AI ツールチェーン内の一部のテクノロジーが AI 搭載アプリの応答の送信を妨げていることを示している可能性があります。
応答あたりの平均トークン使用量の減少または増加により、モデルがどのように応答を作成するかを把握できます。おそらく、過剰なコンテキストを取得しているため、応答の生成中にトークンのコストが上昇している可能性があります。おそらく、応答が少なすぎるため、トークンコストが低くなり、役に立たない応答が生じる可能性があります。

時系列グラフを調整する

A cropped screenshot displaying time series info about AI data

時系列グラフを参照すると、類似した動作が最初に現れる時期をより適切に視覚化できます。

スパイクまたはドロップをドラッグして時系列グラフを調整します。これにより、時系列の範囲が特定の時間ウィンドウに限定されます。
ドロップダウンを選択して、さまざまなパフォーマンスパラメーターの比較分析を実行します。合計応答、平均応答時間、または応答ごとの平均トークンのいずれかを選択できます。
フィードバック機能を有効にしている場合は、グラフの範囲を指定して、正のフィードバックと負のフィードバックによる応答を分析できます。

個々の AI 応答を評価する

AI 応答テーブルは、エンドユーザーと AI アプリの間のインタラクションに関するデータを整理します。インタラクションがいつ発生したか、プロンプトとその応答のペア、完了とウイルスのカウント、およびどのモデルがプロンプトを受信したかを表示できます。

A cropped screenshot displaying the response table from the AI responses view

右上の歯車アイコンをクリックすると、テーブルの列を調整できます。これにより、分析するデータの種類を選択できます。

応答テーブルは、個々の応答に関するトレースデータを表示するためのエントリポイントです。表内の行をクリックすると、特定の応答のトレースビューが開きます。

AI応答トレースビュー

A screenshot of the trace view for a particular AI response

AI 応答レースビューでは、アプリが応答を生成する方法をトレースレベルのインサイトで確認できます。トレースビューを確認してエラーが発生した場所を特定したり、高トークンの応答からの否定的なフィードバックの原因を理解したりすることもできます。トレースビューからは、次のことができます。

トレースまたはログを選択します。ログを選択するときは、さらに調査したいテキスト文字列または属性についてログ内でクエリを実行します。
応答の詳細またはメタデータを切り替えます。応答の詳細列にはユーザープロンプトと AI 応答が表示されるため、トレースとスパンのコンテキストを維持できます。メタデータは、エンティティ GUID、モデル、トークン、ベンダーのリストビューを提供します。
エラーが発生すると、ウォーターフォールビューではその行が赤色で強調表示されます。行を選択すると、スパンのエラー詳細を含むスパンデータが開きます。

AIエンティティページ

AI エンティティページでは、現在 AI データを報告しているすべてのエンティティがテーブルに整理されます。このページには、AI アプリが応答タイム、スループット、エラー率とともに表示されます。

A screenshot of the first page you see when you click AI Monitoring. View aggregated data, compare your AI models, or create drop filters.

AI データをレポートするエンティティを表示するには、 one.newrelic.com > All Capabilities > AI Monitoringに移動します。

AI エンティティを選択すると、そのアプリの APM 概要ページが表示されます。 APM summary pageから、左側のナビゲーションでAI monitoringを選択します。

APM AI 応答ページ

AI エンティティを選択すると、APM の概要ページが表示されます。 AI データを見つけるには、左側のナビゲーションでAI responsesを選択します。特定の AI エンティティが異常の原因となっていることが判明した場合は、このページを使用することをお勧めします。

AI 応答の APM バージョンには、最上位の AI 応答ページとして収集された同じタイル、時系列グラフ、応答テーブルが含まれています。
APM AI 応答ページには、集計されたデータが表示されるのではなく、AI エンティティから選択したサービスにスコープされたデータが表示されます。
最上位の AI 応答ページではすべての AI エンティティにわたるサービスごとにフィルターできますが、APM AI 応答ページではフィルター機能がアプリ独自の属性に制限されます。

AI データの探索方法を確認するには、前のAI 応答セクションで説明したのと同じパターンに従うことができます。

次は何ですか？

データの検索方法がわかったので、AI モニタリングが提供する他の機能を探索してみましょう。

AI モデルへの呼び出しに関するデータを分析したいですか? モデルインベントリとモデル比較ページに関するドキュメントをご覧ください。
機密情報について懸念がありますか? ドロップフィルターの設定方法を学習します。
アプリの AI 応答に関するユーザーフィードバック情報を New Relic に転送したい場合は、手順に従ってアプリのコードを更新し、UI でユーザーフィードバックを取得します。

この機械翻訳は、参考として提供されています。