OpenTelemetry APM UI는 서비스 엔터티 에 사용할 수 있는 선별된 환경입니다. 뉴렐릭 및 OpenTelemetry 로 서비스를 구성하지 않은 경우 OpenTelemetry APM 모니터링을 참조하세요.
OpenTelemetry APM UI 페이지는 문제를 빠르게 식별하고 진단하는 데 도움이 되도록 설계되었습니다. 많은 경우 데이터가 다양한 OpenTelemetry 의미 규칙을 준수해야 하지만, 일부는 일반적인 용도에 사용됩니다.
다음 뉴렐릭 개념은 페이지 전체에서 반복되거나 중복됩니다.
OpenTelemetry APM 서비스 찾기
OpenTelemetry APM 서비스를 찾으려면 All entities > Services > OpenTelemetry 또는 APM & Services 로 이동합니다. 서비스를 클릭하면 해당 서비스의 Summary page 로 이동합니다.
엔터티 탐색기 내에서 엔터티 태그 별로 필터링할 수 있습니다. 엔터티 태그가 컴퓨트인 방법에 대한 자세한 내용은 뉴렐릭의OpenTelemetry 리소스를 참조하세요.
페이지: 요약
요약 페이지는 다음을 포함하여 서비스 상태에 대한 개요를 제공합니다.
- 골든 신호: 응답 시간, 처리량 및 오류. 컴퓨트에 대한 자세한 내용은 골든 신호를 참조하세요.
- 관련 엔터티: 이 서비스와 관련 인프라와 통신하는 다른 서비스입니다. 자세한 내용은 Service map를 참조하세요.
- 활동: 이 서비스에 대해 활성화된 알림의 상태입니다.
- 처분 추적 인사이트: 다운스트림 또는 업스트림 엔터티가 성능 저하에 기여할 수 있는지 알아보세요. 자세한 내용은 관련 트레이스 엔터티 신호를 참조하세요.
- 제외: 서비스가 수평으로 확장될 때 골든 시그널이 제외됩니다.
service.instance.id
리소스 속성에 따라 달라집니다(자세한 내용은 서비스 참조).
페이지: 분산 추적
혐의 추적 페이지에서는 OpenTelemetry Traces 데이터에 대한 자세한 인사이트를 제공합니다. 페이지 사용 정보는 분산 추적을 참조하세요. Traces 데이터가 OpenTelemetry 뉴렐릭으로 수집되는 방법에 대한 자세한 내용은 뉴렐릭의 Traces를 참조하세요.OpenTelemetry
골든 시그널 과 마찬가지로 스팬 상태가 ERROR
(예: otel.status_code = ERROR
)로 설정된 경우 스팬은 오류로 분류됩니다. 범위가 오류인 경우 범위 상태 설명(예: otel.status_description
)이 오류 세부정보 에 표시됩니다.
OpenTelemetry 범위 이벤트는 추가 이벤트 컨텍스트 정보를 특정 범위에 연결합니다. They are most commonly used to capture exception information. 사용 가능한 경우 trace details [추적 세부 정보] 에서 스팬 이벤트를 볼 수 있습니다.
팁
스팬 예외 이벤트가 존재한다고 해서 그 자체로 스팬이 오류로 간주되는 것은 아닙니다. ERROR
으로 설정된 스팬 상태만 오류로 분류됩니다.
페이지: 서비스 맵
서비스 맵 페이지는 전체 아키텍처의 시각적 표현을 제공합니다. 자세한 내용은 서비스 지도를 참조하세요.
페이지: 프로세서
트랜잭션 페이지에서는 서비스 트랜잭션 의 문제를 식별하고 분석하기 위한 도구를 제공합니다.
지표의 경우 쿼리는 데이터가 HTTP 지표 또는 RPC 지표 의미 규칙을 준수한다고 가정합니다. http.route
및 rpc.method
속성은 프로세서의 나열 및 필터링에 사용됩니다.
스팬의 경우 쿼리는 일반적이며 최상위 레벨의 스팬 데이터 모델만 활용합니다. 스팬은 골든 신호 에 설명된 대로 프로세서 처리량 및 응답 시간으로 계산됩니다. 스팬 이름 필드는 '스팬'을 나열하고 필터링하는 데 사용됩니다.
페이지: 데이터베이스
데이터베이스 페이지는 서비스의 데이터베이스 클라이언트 작업과 관련된 문제를 식별하고 분석하기 위한 도구를 제공합니다.
현재 사용 가능한 의미 체계 규칙이 없으므로 데이터베이스에 대한 메트릭 기반 보기는 없습니다.
스팬의 경우 쿼리는 데이터가 DB 스팬 의미 규칙을 따른다고 가정합니다. 스팬 이름, db.system
, db.sql.table
, db.operation
속성은 데이터베이스 작업을 나열하고 필터링하는 데 사용됩니다.
페이지: 외부 서비스
외부 페이지는 호출 엔터티(업스트림 서비스) 및 호출 엔터티(다운스트림 서비스)를 포함하여 서비스의 외부 호출에 대한 문제를 식별하고 분석하기 위한 도구를 제공합니다.
외부 서비스 페이지에는 지표 기반 보기가 없습니다.
스팬의 경우 쿼리는 일반적이며 최상위 레벨의 스팬 데이터 모델만 활용합니다. 서비스를 종료하는 경우 스팬은 외부 서비스 처리량 및 응답 시간에 계산되며, WHERE span.kind = client OR span.kind = producer
의 휴리스틱을 사용하여 계산됩니다. 데이터베이스 클라이언트 스팬은 WHERE db.system is null
(를) 사용하여 필터링됩니다( 페이지: 데이터베이스 참조). 골든 사인 과 마찬가지로 스팬은 상태 코드가 ERROR
인 경우 오류입니다(예: otel.status_code = ERROR
). 가능한 경우 HTTP span 및 RPC span 의미 규칙의 데이터는 외부 서비스 호출을 분류하는 데 사용됩니다.
페이지: JVM 런타임
JVM 런타임 페이지는 Java 서비스의 JVM과 관련된 문제를 식별하고 분석하는 도구를 제공합니다. 이 페이지는 OpenTelemetry java를 사용하는 서비스에 대해서만 표시됩니다. 서로 다른 서비스 인스턴스를 구별하기 위해 해당 페이지에서 service.instance.id
리소스 속성을 설정해야 합니다(자세한 내용은 서비스 참조).
JVM 런타임 페이지에는 JVM 런타임 지표와 함께 골든 시그널이 표시되어 런타임 문제와 서비스 사용 간의 상관관계를 보여줍니다. 지표 또는 범위 토글은 골든 아이콘 이 범위 또는 지표 데이터에 의해 구동되는지 여부를 나타냅니다. JVM 런타임 메트릭에 대한 스팬 기반 뷰는 없습니다.
지표의 경우 쿼리는 데이터가 JVM 지표 의미 체계를 준수한다고 가정합니다. 이러한 규칙은 OpenTelemetry Java 런타임 에이전트 에 자동으로 포함되는 OpenTelemetry Java 런타임에 구현됩니다.
페이지: Go 런타임
Go 런타임 페이지는 Go 서비스 런타임과 관련된 문제를 식별하고 분석하는 도구를 제공합니다. 이 페이지는 OpenTelemetry Go를 사용하는 서비스에 대해서만 표시됩니다. 서로 다른 서비스 인스턴스를 구별하기 위해 해당 페이지에서 service.instance.id
리소스 속성을 설정해야 합니다(자세한 내용은 서비스 참조).
Go 런타임 페이지에는 Go 런타임 지표와 함께 골든 시그널이 표시되어 런타임 문제와 서비스 사용 간의 상관관계를 보여줍니다. 지표 또는 범위 토글은 골든 아이콘 이 범위 또는 지표 데이터에 의해 구동되는지 여부를 나타냅니다. Go 런타임 메트릭에 대한 스팬 기반 뷰는 없습니다.
지표의 경우 쿼리는 데이터가 OpenTelemetry Go 런타임 라이브러리 에 의해 생성된다고 가정합니다. 현재 Go 런타임 지표에 대한 의미론적 규칙은 없습니다.
페이지: 로그
로그 페이지는 문제를 식별하고 서비스 로그를 분석하는 도구를 제공합니다. 자세한 내용은 로그 UI 사용을 참조하세요.
페이지: 무스 인박스(errors inbox)
에러 인박스(errors inbox) 페이지는 서비스의 오류를 탐지하고 분류하는 도구를 제공합니다. 자세한 내용은 에러스 인박스(errors inbox) 시작하기를 참조하세요.
무스 인박스(errors inbox) 페이지는 트레이스 데타(Trays deta)가 운영하고 있습니다. 골든 시그널 과 마찬가지로 스팬 상태가 ERROR
(예: otel.status_code = ERROR
)로 설정된 경우 스팬은 오류로 분류됩니다.
오류 범위는 UUID, 16진수 값, 이메일 주소 등과 같은 식별 값을 정규화하여 오류 지문인 컴퓨트별로 그룹화됩니다. 각각의 고유한 오류 범위는 오류 그룹 내의 개별 인스턴스입니다. 오류 그룹 메시지는 다음과 같이 결정됩니다.
- 스팬 상태 설명(예:
otel.status_description
) rpc.grpc.status_code
RPC span 의미 규칙에서http.status_code
HTTP span 의미 규칙에서http.response.status_code
HTTP span 의미 규칙에서undefined
위의 항목 중 어느 것도 존재하지 않는 경우
페이지: 지표 탐색기
지표 탐색기는 일반적인 방식으로 서비스의 지표를 탐색하는 데 필요한 도구를 제공합니다. 자세한 내용은 데이터 탐색을 참조하세요.
황금 신호
처리율, 응답 시간 및 오류의 황금 신호는 OpenTelemetry APM UI 전체의 여러 위치에 나타납니다. 사용되면 다음과 같이 컴퓨트됩니다.
지표의 경우 쿼리는 데이터가 HTTP 지표 또는 RPC 지표 의미 규칙을 준수한다고 가정합니다.
범위의 경우 쿼리는 일반적이며 최상위 범위 데이터 모델만 활용합니다. 스팬은 WHERE span.kind = server OR span.kind = consumer
의 휴리스틱을 사용하여 컴퓨트 서비스에 대한 루트 항목 스팬인 경우 처리량 및 응답 시간으로 계산됩니다. 상태 코드가 ERROR
인 경우 스팬은 오류입니다(예: otel.status_code = ERROR
).
필터를 사용하여 데이터 범위 좁히기
여러 페이지에는 Narrow data to... [데이터 범위 좁히기...] 와 같은 옵션이 있는 필터 표시줄이 포함되어 있습니다. 이를 통해 기준과 일치하도록 페이지의 쿼리를 필터링할 수 있습니다. 예를 들어 service.version='1.2.3-canary'
(를) 필터링하여 특정 카나리아 배포로 범위를 좁힐 수 있습니다. 페이지 간을 탐색할 때 필터가 유지됩니다.
지표 또는 범위 토글
다양한 페이지에는 메트릭 또는 스팬 토글이 포함되어 있습니다. 이를 통해 분석 요구 사항과 데이터 가용성에 따라 쿼리를 스팬 데이터 또는 메트릭 데이터로 실행할지 선택할 수 있습니다.
지표는 샘플링 대상이 아니므로 특히 처리량과 같은 속도를 계산할 때 더 정확합니다. 그러나 지표에는 카디널리티 제약이 적용되며 분석에 중요한 특정 속성이 부족할 수 있습니다. 이와 대조적으로 범위는 샘플링되므로 정확도 문제가 발생하지만 카디널리티 제약 조건이 적용되지 않으므로 더 풍부한 속성을 갖습니다.
역사적으로 OpenTelemetry 언어 API 및 SDK와 리소스는 트레이스 리소스를 우선적으로 사용했습니다. 하지만 이 프로젝트는 많은 진전을 이루었으며, 이제 거의 모든 언어로 유틸리티를 이용할 수 있습니다. 자세한 내용은 해당 언어 및 계측기의 설명서를 확인하세요.