OpenTelemetry データを送信し、UI でサービス (エンティティ) を開くと、 [概要] ページにサービスの正常性の概要が表示されます。ここで見ることができます:
- サービスのゴールデン シグナル: 応答時間、スループット、エラー率
- このサービスが依存するエンティティは、その正常性ステータスと共に、関連するエンティティに表示されます。これには、このサービスと通信する他のサービスと、サービスをホストするインフラストラクチャが含まれます。
- アラートのしきい値に違反すると、それらのイベントが Activity [アクティビティ] サイドバーに表示されます
この情報を使用すると、このサービスに問題があるかどうか、および問題の診断をどこから開始できるかをすばやく判断できます。
OpenTelemetry データの表示方法 (サーバーまたはクライアント?)
[概要]ページには、サービスのサーバーおよび/またはメッセージ コンシューマ ロールのゴールデン シグナルが表示されます。他のページでは、分散システムにおけるサービスの役割のさまざまなビューが提供されます。
- 外部サービスは、他のサービスを呼び出すクライアントとしてのサービスの動作と、他のサービスがそのエンドポイントを呼び出す方法の内訳を示します
- データベースは、データベースのクライアントとしてのサービスの動作を示します。具体的には、
トレース用の OpenTelemetry データ モデルでは、サービスはサーバー (要求に応答する) とクライアント (要求を行う) の両方になることができます。同様に、AWS SQS のようなメッセージング システムを使用するサービスは、メッセージのプロデューサーおよび/またはコンシューマーになることができます。span.kind
属性は、特定のトレース スパンにおけるサービスの役割を指定します。
メトリックまたはスパン
ゴールデン シグナルのチャートを強化するために、メトリクスまたはスパンのいずれかを使用することを選択できます。
重要
メトリックを選択すると、HTTP サーバーのエラー率のみが表示されます。gRPC またはその他のプロトコルのエラー率メトリックはまだ表示されていません。
必要な属性
OpenTelemetry データが[概要] ページに表示されるようにするには、OTel のセマンティック規則に従って、次の属性があることを確認してください。
UIエリア | 属性 |
---|---|
レスポンスタイム |
|
スループット |
|
エラー率 |
|
インスタンスペイン |
|
分散トレーシングの洞察
Distributed tracing insights [分散トレースの洞察]チャートを使用すると、サービスの下流または上流のエンティティがサービスの応答時間、エラー率、またはスループットの増加を引き起こしている可能性があるかどうかを確認できます。
たとえば、外部通話の応答時間に関連するサービスの応答時間のスパイクを詳しく調べたいとします。分散トレースが、その時点でサービスの遅延の大幅な増加を引き起こしているダウンストリーム エンティティを記録した場合、そのエンティティとそのパフォーマンスの変化がリストに表示されます。View trace [トレースの表示]ボタンをクリックすると、このパフォーマンス動作が記録された分散トレースの例が表示されます。
分散トレース データの詳細については、 「関連するトレース エンティティ信号」を参照してください。
他の UI ページの OpenTelemetry について詳しくは、 「UI の OpenTelemetry データの概要」を参照してください。