뉴렐릭은 Amazon Web Services (AWS) Amazon SageMaker Maximo 및 기타 데이터를 뉴렐릭에 보고하기 위해 와 통합됩니다.
이 문서에서는 통합을 활성화하는 방법과 보고되는 데이터에 대해 설명합니다.
특징
통합을 사용하여 Amazon SageMaker 서비스에서 텔리메트리 데이터를 수집하고 뉴렐릭으로 보내세요. 서비스를 모니터링하고, 유입 데이터를 쿼리하고, 대시보드를 구축하여 모든 것을 한눈에 파악하세요.
통합 활성화
이 통합은 CloudWatch Metric Streams를 통해 사용할 수 있습니다.
이 통합을 활성화하려면 통해 AWS 서비스를 뉴렐릭에 연결하는 방법을 CloudWatch Metric Streams 참조하세요.
데이터 찾기 및 사용
통합의 지표를 찾으려면 one.newrelic.com > Metrics and events 으로 이동하여 aws.sagemaker
로 필터링하세요.
측정항목 데이터
이 뉴렐릭 인프라 통합은 다음 Amazon SageMaker 데이터를 수집합니다.
SageMaker 메트릭 데이터
지표(최소, 최대, 평균, 개수, 합계) | 유닛 | 설명 |
---|---|---|
| 세다 | 모델 엔드포인트로 전송된 InvokeEndpoint 요청 수입니다. |
| 세다 | 각 ProductionVariant에서 InstanceCount로 정규화된 모델로 전송된 호출 수입니다. |
| 마이크로초 | SageMaker 오버헤드로 클라이언트 요청에 응답하는 데 걸린 시간에 추가된 시간 간격입니다. |
| 마이크로초 | 모델이 SageMaker API 요청에 응답하는 데 걸리는 시간 간격입니다. |
| 세다 | 모델이 4xx HTTP 응답 코드를 반환한 InvokeEndpoint 요청 수입니다. |
| 세다 | 모델이 5xx HTTP 응답 코드를 반환한 InvokeEndpoint 요청 수입니다. |
| 세다 | 2XX HTTP 응답이 발생하지 않은 모델 호출 요청 수입니다. |
SageMaker에서 가져온 모든 데이터에는 하나의 차원이 있습니다. EndpointName
Sagemaker Endpoints 지표 데이터
지표(최소, 최대, 평균, 개수, 합계) | 유닛 | 설명 |
---|---|---|
| 퍼센트 | 인스턴스의 컨테이너에서 사용하는 메모리의 백분율입니다. 엔드포인트 변형의 경우 값은 인스턴스에 있는 기본 컨테이너와 보조 컨테이너의 메모리 사용량 합계입니다. |
| 퍼센트 | 인스턴스의 컨테이너가 사용하는 디스크 공간의 백분율입니다. 엔드포인트 변형의 경우 값은 인스턴스에 있는 기본 컨테이너와 보조 컨테이너의 디스크 공간 사용량 합계입니다. |
| 퍼센트 | 각 개별 CPU 코어의 사용률 합계입니다. 엔드포인트 변형의 경우 값은 인스턴스에 있는 기본 컨테이너와 보조 컨테이너의 CPU 사용률 합계입니다. |
| 퍼센트 | 인스턴스의 컨테이너에서 사용하는 GPU 메모리의 백분율입니다. 엔드포인트 변형의 경우 값은 인스턴스에 있는 기본 컨테이너와 보조 컨테이너의 GPU 메모리 사용량 합계입니다. |
| 퍼센트 | 인스턴스의 컨테이너에서 사용하는 GPU 단위의 백분율입니다. 엔드포인트 변형의 경우 값은 인스턴스에 있는 기본 및 보조 컨테이너의 GPU 사용률 합계입니다. |
SageMaker EndPoint에서 가져온 모든 데이터에는 하나의 차원이 있습니다. Host
SageMaker 교육 작업 메트릭 데이터
지표(최소, 최대, 평균, 개수, 합계) | 유닛 | 설명 |
---|---|---|
| 퍼센트 | 인스턴스의 컨테이너에서 사용하는 메모리의 백분율입니다. 교육 작업의 경우 값은 인스턴스에서 알고리즘 컨테이너의 메모리 사용률입니다. |
| 퍼센트 | 인스턴스의 컨테이너가 사용하는 디스크 공간의 백분율입니다. 학습 작업의 경우 값은 인스턴스에 있는 알고리즘 컨테이너의 디스크 공간 사용률입니다. |
| 퍼센트 | 각 개별 CPU 코어의 사용률 합계입니다. 학습 작업의 경우 값은 인스턴스에 있는 알고리즘 컨테이너의 CPU 사용률입니다. |
| 세다 | 학습 작업의 학습 오류 수를 측정합니다. |
SageMaker Training Jobs에서 가져온 모든 데이터에는 하나의 차원이 있습니다. Host
알림 생성
변경사항이 있는 경우 알림을 받도록 설정할 수 있습니다. 예를 들어, 공지를 설정하여 중요하거나 치명적인 오류를 관련 당사자에게 알릴 수 있습니다.
여기에서 알림 생성에 대해 자세히 알아보세요.