중요
AWS CloudWatch Metric Streams 통합 을 활성화하여 사용자 지정 네임스페이스를 포함하여 AWS 서비스의 모든 CloudWatch 지표를 모니터링합니다. 개별 통합은 더 이상 권장되는 옵션이 아닙니다.
New Relic 인프라 통합 에는 Amazon Elasticsearch 데이터를 New Relic에 보고하기 위한 통합이 포함됩니다. 이 문서에서는 통합 기능, 활성화 방법 및 보고할 수 있는 데이터에 대해 설명합니다.
특징
Amazon Elasticsearch Service 는 프로덕션 워크로드에 필요한 가용성, 확장성 및 보안과 함께 Elasticsearch의 사용하기 쉬운 API 및 실시간 기능을 제공하는 완전 관리형 서비스입니다. New Relic의 Elasticsearch 모니터링 통합을 통해 특정 시점에서 클러스터 상태, CPU 사용률, 읽기/쓰기 지연 시간, 처리량 및 기타 지표를 추적할 수 있습니다. Elasticsearch 데이터는 또한 데이터 를 쿼리, 분석 및 차트 화하는 데 사용할 수 있습니다.
통합 활성화
이 통합을 활성화하려면 표준 절차에 따라 AWS 서비스를 New Relic에 연결 하십시오.
구성 및 폴링
구성 옵션 을 사용하여 폴링 빈도를 변경하고 데이터를 필터링할 수 있습니다.
Amazon Elasticsearch 통합에 대한 기본 폴링 정보:
- New Relic 폴링 간격: 5분
- Amazon CloudWatch 데이터 간격: 1분
데이터 보기 및 사용
이 통합의 데이터를 보고 사용 하려면 one.newrelic.com > Infrastructure > AWS 로 이동하여 Elasticsearch 통합 링크 중 하나를 선택하십시오.
데이터를 쿼리하고 탐색 하려면 적절한 provider
값과 함께 DatastoreSample
이벤트 유형을 사용하세요.
ElasticsearchCluster
클러스터용ElasticsearchNode
노드용
측정항목 데이터
Elasticsearch 통합은 클러스터에 대해 다음 지표를 수집합니다.
이름 | 관련 통계 | 설명 |
---|---|---|
| 최소, 최대 | 모든 인덱스 샤드가 클러스터의 노드에 할당되었음을 나타냅니다. |
| 최소, 최대 | 모든 인덱스의 기본 샤드가 클러스터의 노드에 할당되지만 하나 이상의 인덱스에 대한 복제본 샤드가 할당되지 않음을 나타냅니다. 단일 노드 클러스터는 복제본을 할당할 수 있는 두 번째 노드가 없기 때문에 항상 이 클러스터 상태로 초기화됩니다. 노드 수를 늘려 녹색 클러스터 상태를 얻거나 Amazon ES API를 사용하여 인덱스의 |
| 최소, 최대 | 하나 이상의 인덱스의 기본 및 복제본 샤드가 클러스터의 노드에 할당되지 않았음을 나타냅니다. 자세한 내용은 Red Cluster 상태 에 대한 Amazon 설명서를 참조하십시오. |
| 최소, 최대, 평균 | Amazon ES 클러스터의 노드 수입니다. |
| 최소, 최대, 평균 | 클러스터의 모든 인덱스에서 검색 가능한 총 문서 수입니다. |
| 최소, 최대, 평균 | 클러스터의 모든 인덱스에서 삭제된 문서의 총 수입니다. |
| 최소, 최대, 평균 | 클러스터의 데이터 노드에 사용되는 CPU 리소스의 최대 백분율입니다. |
| 최저한의 | 클러스터의 모든 데이터 노드에 대한 여유 공간(MB)입니다. |
| 최소, 최대 | 클러스터에 사용된 총 공간(MB)입니다. |
| 최고 | 클러스터가 들어오는 쓰기 요청을 수락하거나 차단하는지 여부를 나타냅니다. 0 값은 클러스터가 요청을 수락하고 있음을 의미합니다. 값 1은 요청을 차단하고 있음을 의미합니다. |
| 최고 | 클러스터의 모든 데이터 노드에 사용되는 Java 힙의 최대 백분율입니다. |
| 최소, 최대 | 클러스터에 대해 실패한 자동화된 스냅샷의 수입니다. 값 1은 이전 36시간 동안 도메인에 대해 자동 스냅샷이 생성되지 않았음을 나타냅니다. |
| 최저한의 | 클러스터의 데이터 노드에 사용할 수 있는 나머지 CPU 크레딧입니다. CPU 크레딧은 1분 동안 전체 CPU 코어의 성능을 제공합니다. 이 지표는 t2.micro.elasticsearch, t2.small.elasticsearch 및 t2.medium.elasticsearch 인스턴스 유형에만 사용할 수 있습니다. |
| 최저한의 | Kibana의 상태 확인입니다. 값 1은 정상적인 동작을 나타냅니다. 0 값은 Kibana에 액세스할 수 없음을 나타냅니다. 대부분의 경우 Kibana의 상태는 클러스터의 상태를 반영합니다. |
| 최소, 최대 | 값이 1이면 저장 데이터를 암호화하는 데 사용되는 KMS 고객 마스터 키가 비활성화되었음을 나타냅니다. 도메인을 정상 작동으로 복원하려면 키를 다시 활성화하십시오. |
| 최소, 최대 | 값이 1이면 저장 데이터를 암호화하는 데 사용되는 KMS 고객 마스터 키가 삭제되었거나 Amazon ES에 대한 권한이 취소되었음을 나타냅니다. 이 상태의 도메인은 복구할 수 없습니다. 그러나 수동 스냅샷이 있는 경우 이를 사용하여 도메인의 데이터를 새 도메인으로 마이그레이션할 수 있습니다. |
| 합집합 | 유효하지 않은(또는 누락된) 호스트 헤더가 포함된 Elasticsearch 클러스터에 대한 HTTP 요청 수입니다. |
| 합집합 | Elasticsearch 클러스터에 대한 요청 수입니다. |
| 합집합 | 도메인에 대한 요청 수 및 각 요청에 대한 HTTP 응답 코드(2xx, 3xx, 4xx, 5xx). |
| 평균 | 전용 마스터 노드에서 사용하는 CPU 리소스의 최대 백분율입니다. 이 지표가 60%에 도달하면 인스턴스 유형의 크기를 늘리는 것이 좋습니다. |
| 최고 | 클러스터의 모든 전용 마스터 노드에 사용되는 Java 힙의 최대 백분율입니다. 이 지표가 85%에 도달하면 더 큰 인스턴스 유형으로 이동하는 것이 좋습니다. |
| 최저한의 | 클러스터의 전용 마스터 노드에 사용할 수 있는 나머지 CPU 크레딧입니다. CPU 크레딧은 1분 동안 전체 CPU 코어의 성능을 제공합니다. 이 지표는 t2.micro.elasticsearch, t2.small.elasticsearch 및 t2.medium.elasticsearch 인스턴스 유형에만 사용할 수 있습니다. |
| 최저한의 |
실패는 마스터 노드가 중지되었거나 연결할 수 없음을 의미합니다. 일반적으로 네트워크 연결 문제 또는 AWS 종속성 문제의 결과입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대한 읽기 작업의 대기 시간(초)입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대한 쓰기 작업의 대기 시간(초)입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대한 읽기 작업의 처리량(초당 바이트)입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대한 쓰기 작업의 처리량(초당 바이트)입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대해 보류 중인 입출력(I/O) 요청 수입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대한 읽기 작업의 초당 입출력(I/O) 작업 수입니다. |
| 최소, 최대, 평균 | EBS 볼륨에 대한 쓰기 작업의 초당 입출력(I/O) 작업 수입니다. |
Elasticsearch 클러스터와 선택적으로 도메인의 각 인스턴스 또는 노드에 대해 다음 지표가 수집됩니다.
이름 | 관련 통계 | 설명 |
---|---|---|
| 노드의 경우: 평균 클러스터의 경우: 평균, 최대 | 샤드가 인덱싱 작업을 완료하는 데 걸리는 평균 시간(밀리초)입니다. |
| 노드의 경우: 평균 클러스터의 경우: 평균, 최대값, 합계 | 분당 인덱싱 작업 수입니다. |
| 노드의 경우: 평균 클러스터의 경우: 평균, 최대 | 샤드에서 검색 작업을 완료하는 데 걸리는 평균 시간(밀리초)입니다. |
| 노드의 경우: 평균 클러스터의 경우: 평균, 최대값, 합계 | 노드의 모든 샤드에 대한 분당 총 검색 요청 수입니다. |
| 최소, 최대, 평균 | 사용 중인 인스턴스 메모리의 백분율입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | "젊은 세대" 가비지 수집이 실행된 횟수입니다. 계속해서 증가하는 대규모 실행은 클러스터 작업의 정상적인 부분입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | 클러스터가 "젊은 세대" 가비지 수집을 수행하는 데 소비한 시간(밀리초)입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | "구세대" 가비지 수집이 실행된 횟수입니다. 리소스가 충분한 클러스터에서 이 숫자는 작게 유지되어야 하며 드물게 증가해야 합니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | 클러스터가 "구세대" 가비지 수집을 수행하는 데 소비한 시간(밀리초)입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | 강제 병합 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오. |
| 노드의 경우: 최대 클러스터의 경우: 합계 | 강제 병합 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 평균 | 강제 병합 스레드 풀의 크기입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | 인덱스 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오. 최대 인덱스 큐 크기는 200입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계 | 인덱스 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 평균 | 인덱스 스레드 풀의 크기입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | 검색 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오. 최대 검색 대기열 크기는 1000입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계 | 검색 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 평균 | 검색 스레드 풀의 크기입니다. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 최대값, 평균 | 대량 스레드 풀에서 대기 중인 작업의 수입니다. 대기열 크기가 지속적으로 높으면 클러스터 확장을 고려하십시오. |
| 노드의 경우: 최대 클러스터의 경우: 합계 | 대량 스레드 풀에서 거부된 작업의 수입니다. 이 수가 계속 증가하면 클러스터 확장을 고려하십시오. |
| 노드의 경우: 최대 클러스터의 경우: 합계, 평균 | 벌크 스레드 풀의 크기입니다. |