OpenTelemetry APM UI는 서비스 엔터티 에 사용할 수 있는 선별된 환경입니다. 뉴렐릭 및 OpenTelemetry 로 서비스를 구성하지 않은 경우 OpenTelemetry APM 모니터링을 참조하세요.
OpenTelemetry APM UI 페이지는 문제를 신속하게 식별하고 진단하는 데 도움이 되도록 설계되었습니다. 많은 경우 데이터가 다양한 OpenTelemetry 의미 규칙을 준수해야 하지만 일부는 범용입니다. 아래에서 각 페이지에 대한 자세한 정보 및 요구 사항을 확인하세요.
- 요약 페이지
- 추적 페이지 배포
- 서비스 맵 페이지
- 거래 페이지
- 데이터베이스 페이지
- 외부 서비스 페이지
- JVM 런타임 페이지
- 런타임 페이지로 이동
- 로그 페이지
- 유니스 인박스(errors inbox) 페이지
- 지표 탐색기 페이지
다음 뉴렐릭 개념은 페이지 전체에서 반복되거나 중복됩니다.
OpenTelemetry APM 서비스 찾기
OpenTelemetry APM 서비스를 찾으려면 All entities > Services > OpenTelemetry 또는 APM & Services [APM & 서비스] 로 이동합니다. 서비스를 클릭하면 서비스 요약 페이지 로 이동합니다.
엔터티 탐색기 내에서 엔터티 태그 별로 필터링할 수 있습니다. 엔터티 태그가 컴퓨트인 방법에 대한 자세한 내용은 뉴렐릭의OpenTelemetry 리소스를 참조하세요.
페이지: 요약
요약 페이지는 다음을 포함하여 서비스 상태에 대한 개요를 제공합니다.
- 골든 신호: 응답 시간, 처리량 및 오류입니다. 컴퓨트에 대한 자세한 내용은 골든 신호를 참조하세요.
- 관련 엔터티: 이 서비스 및 관련 인프라와 통신하는 다른 서비스입니다. 자세한 내용은 서비스 지도를 참조하세요.
- 활동: 이 서비스에 대해 활성화된 알림의 상태입니다.
- 처분 추적 인사이트: 다운스트림 또는 업스트림 엔터티가 성능 저하에 기여할 수 있는지 알아보세요. 자세한 내용은 관련 트레이스 엔터티 신호를 참조하세요.
- 제외: 서비스가 수평으로 확장될 때 골든 시그널이 제외됩니다.
service.instance.id
리소스 속성에 따라 다릅니다(자세한 내용은 서비스 엔터티 속성 참조).
페이지: 분산 추적
혐의 추적 페이지에서는 OpenTelemetry Traces 데이터에 대한 자세한 인사이트를 제공합니다. 페이지 사용 정보는 분산 추적을 참조하세요. Traces 데이터가 OpenTelemetry 뉴렐릭으로 수집되는 방법에 대한 자세한 내용은 뉴렐릭의 Traces를 참조하세요.OpenTelemetry
골든 시그널 과 마찬가지로 스팬 상태가 ERROR
(예: otel.status_code = ERROR
)로 설정된 경우 스팬은 오류로 분류됩니다. 범위가 오류인 경우 범위 상태 설명(예: otel.status_description
)이 오류 세부정보 에 표시됩니다.
OpenTelemetry 범위 이벤트는 추가 이벤트 컨텍스트 정보를 특정 범위에 연결합니다. They are most commonly used to capture exception information. 사용 가능한 경우 trace details [추적 세부 정보] 에서 스팬 이벤트를 볼 수 있습니다.
팁
스팬 예외 이벤트가 존재한다고 해서 그 자체로 스팬이 오류로 간주되는 것은 아닙니다. ERROR
으로 설정된 스팬 상태만 오류로 분류됩니다.
페이지: 서비스 맵
서비스 맵 페이지는 전체 아키텍처를 시각적으로 보여줍니다. 자세한 내용은 서비스 지도를 참조하세요.
페이지: 프로세서
트랜잭션 페이지에서는 서비스 트랜잭션 의 문제를 식별하고 분석하기 위한 도구를 제공합니다.
지표의 경우 쿼리는 데이터가 http 지표 또는 rpc 지표 의미 체계를 준수한다고 가정합니다. http.route
및 rpc.method
속성은 프로세서의 나열 및 필터링에 사용됩니다.
범위의 경우 쿼리는 일반적이며 최상위 범위 데이터 모델만 활용합니다. 스팬은 골든 처리량 및 응답 시간에 대해 계산됩니다. 스팬 이름 필드는 트랜잭션별로 나열하고 필터링하는 데 사용됩니다.
페이지: 데이터베이스
데이터베이스 페이지는 서비스의 데이터베이스 클라이언트 작업과 관련된 문제를 식별하고 분석하기 위한 도구를 제공합니다.
현재 사용 가능한 의미 체계 규칙이 없으므로 데이터베이스에 대한 메트릭 기반 보기는 없습니다.
범위의 경우 쿼리는 데이터가 db 범위 의미 체계 규칙을 준수한다고 가정합니다. 범위 이름과 db.system
, db.sql.table
및 db.operation
속성은 데이터베이스 작업을 나열하고 필터링하는 데 사용됩니다.
페이지: 외부 서비스
외부 페이지는 호출 엔터티(업스트림 서비스) 및 호출 엔터티(다운스트림 서비스)를 포함하여 서비스의 외부 호출에 대한 문제를 식별하고 분석하기 위한 도구를 제공합니다.
외부 서비스 페이지에는 지표 기반 보기가 없습니다.
범위의 경우 쿼리는 일반적이며 최상위 범위 데이터 모델만 활용합니다. 스팬은 WHERE span.kind = client OR span.kind = producer
의 휴리스틱을 사용하여 컴퓨트 서비스를 종료하는 경우 외부 서비스 처리량 및 응답 시간으로 계산됩니다. 데이터베이스 클라이언트 스팬은 WHERE db.system is null
) 사용하여 필터링됩니다( 데이터베이스 페이지 참조). 골든 시그널 과 마찬가지로 스팬의 상태 코드가 ERROR
(예: otel.status_code = ERROR
)인 경우 오류입니다. 가능한 경우 http 범위 및 rpc 범위 의미 체계의 데이터를 사용하여 외부 서비스 호출을 분류합니다.
페이지: JVM 런타임
JVM 런타임 페이지는 Java 서비스의 JVM 문제를 식별하고 분석하기 위한 도구를 제공합니다. 이 페이지는 OpenTelemetry java를 사용하는 서비스에 대해서만 표시됩니다. 고유한 서비스를 구별하려면 페이지에서 service.instance.id
리소스 속성을 설정해야 합니다(자세한 내용은 서비스 엔터티 속성 참조).
JVM 런타임 페이지에는 JVM 런타임 지표와 함께 황금 신호가 표시되어 런타임 문제와 서비스 사용량의 상관 관계를 보여줍니다. 스팬-메트릭 토글은 골든 아이콘이 스팬 또는 지표 데이터에 의해 구동되는지 여부를 나타냅니다. JVM 런타임 지표에는 범위 기반 보기가 없습니다.
지표의 경우 쿼리는 데이터가 JVM 지표 의미 규칙을 준수한다고 가정합니다. 이러한 규칙은 OpenTelemetry Java 런타임 에이전트 에 자동으로 포함되는 OpenTelemetry Java 런타임에 구현됩니다.
페이지: Go 런타임
Go 런타임 페이지는 Go 서비스의 런타임 문제를 식별하고 분석하기 위한 도구를 제공합니다. 이 페이지는 OpenTelemetry Go를 사용하는 서비스에만 표시됩니다. 고유한 서비스를 구별하려면 페이지에서 service.instance.id
리소스 속성을 설정해야 합니다(자세한 내용은 서비스 엔터티 속성 참조).
Go 런타임 페이지에는 Go 런타임 지표와 함께 황금 아이콘이 표시되어 런타임 문제와 서비스 사용량의 상관관계를 보여줍니다. 스팬-메트릭 토글은 골든 아이콘이 스팬 또는 지표 데이터에 의해 구동되는지 여부를 나타냅니다. Go 런타임 지표에는 범위 기반 보기가 없습니다.
지표의 경우 쿼리는 데이터가 OpenTelemetry Go 런타임 라이브러리 에 의해 생성된다고 가정합니다. 현재 Go 런타임 지표에 대한 의미론적 규칙은 없습니다.
페이지: 로그
로그인 페이지는 문제를 식별하고 서비스의 로그인을 분석하기 위한 도구를 제공합니다. 자세한 내용은 로그 UI를 참조하세요.
페이지: 무스 인박스(errors inbox)
무스 인박스(errors inbox) 페이지는 서비스 오류를 감지하고 분류하는 도구를 제공합니다. 자세한 내용은 오류 인박스(errors inbox)를 참조하세요.
무스 인박스(errors inbox) 페이지는 트레이스 데타(Trays deta)가 운영하고 있습니다. 골든 시그널 과 마찬가지로 스팬 상태가 ERROR
(예: otel.status_code = ERROR
)로 설정된 경우 스팬은 오류로 분류됩니다.
오류 범위는 UUID, 16진수 값, 이메일 주소 등과 같은 식별 값을 정규화하여 오류 지문인 컴퓨트별로 그룹화됩니다. 각각의 고유한 오류 범위는 오류 그룹 내의 개별 인스턴스입니다. 오류 그룹 메시지는 다음과 같이 결정됩니다.
- 스팬 상태 설명(예:
otel.status_description
) rpc.grpc.status_code
rpc 스팬 의미 규칙에서http.status_code
http 범위 의미 체계에서http.response.status_code
http 범위 의미 체계에서undefined
위의 항목 중 어느 것도 존재하지 않는 경우
페이지: 지표 탐색기
지표 탐색기는 일반적인 방식으로 서비스의 지표를 탐색하기 위한 도구를 제공합니다. 자세한 내용은 데이터 탐색을 참조하세요.
황금 신호
처리율, 응답 시간 및 오류의 황금 신호는 OpenTelemetry APM UI 전체의 여러 위치에 나타납니다. 사용되면 다음과 같이 컴퓨트됩니다.
지표의 경우 쿼리는 데이터가 http 지표 또는 rpc 지표 의미 체계를 준수한다고 가정합니다.
범위의 경우 쿼리는 일반적이며 최상위 범위 데이터 모델만 활용합니다. 스팬은 WHERE span.kind = server OR span.kind = consumer
의 휴리스틱을 사용하여 컴퓨트 서비스에 대한 루트 항목 스팬인 경우 처리량 및 응답 시간으로 계산됩니다. 상태 코드가 ERROR
인 경우 스팬은 오류입니다(예: otel.status_code = ERROR
).
필터를 사용하여 데이터 범위 좁히기
여러 페이지에는 Narrow data to... [데이터 범위 좁히기...] 와 같은 옵션이 있는 필터 표시줄이 포함되어 있습니다. 이를 통해 기준과 일치하도록 페이지의 쿼리를 필터링할 수 있습니다. 예를 들어 service.version='1.2.3-canary'
(를) 필터링하여 특정 카나리아 배포로 범위를 좁힐 수 있습니다. 페이지 간을 탐색할 때 필터가 유지됩니다.
지표 또는 범위 토글
다양한 페이지에는 지표 또는 범위 토글이 포함되어 있습니다. 이를 통해 쿼리가 분석 요구 사항 및 데이터 가용성을 기반으로 범위 데이터 또는 지표 데이터에 의해 구동되는지 여부를 전환할 수 있습니다.
지표는 샘플링 대상이 아니므로 특히 처리량과 같은 속도를 계산할 때 더 정확합니다. 그러나 지표에는 카디널리티 제약이 적용되며 분석에 중요한 특정 속성이 부족할 수 있습니다. 이와 대조적으로 범위는 샘플링되므로 정확도 문제가 발생하지만 카디널리티 제약 조건이 적용되지 않으므로 더 풍부한 속성을 갖습니다.
역사적으로 OpenTelemetry 언어 API/SDK 및 리소스 우선순위는 트레이스 리소스입니다. 그러나 이 프로젝트는 많은 발전을 이루었으며 지표는 거의 모든 언어로 제공됩니다. 자세한 내용은 해당 언어의 설명서 와 리뷰를 확인하세요.