Kubernetes 통합을 처음 배포할 때 Kubernetes 클러스터의 경고 조건에 대한 기반인 사전 정의된 경고 정책 인 기본 경고 조건 세트를 계정에 배포합니다.
모든 환경에서 가장 일반적인 사용 사례를 해결하려고 노력하는 동안 기본 정책을 확장하기 위해 설정할 수 있는 추가 경고가 많이 있습니다. 다음은 몇 가지 권장 사항입니다.
권장 경보 조건
환경 | 값 |
---|
Event type | K8sNodeSample
|
SELECT value | (cpuUsedCores/cpuLimitCores)*100
|
Warning threshold | 최소 5분 동안 >90% |
Critical threshold | 최소 5분 동안 >95% |
환경 | 값 |
---|
Event type | K8sNodeSample
|
SELECT value | (memoryUsedBytes/memoryLimitBytes)/100
|
Warning threshold | 최소 5분 동안 >85% |
Critical threshold | 최소 5분 동안 >95% |
데이터를 보고하려면 memoryLimitBytes
에 대한 컨테이너 사양 에서 메모리 제한을 설정해야 합니다.
환경 | 값 |
---|
Event type | K8sPodSample
|
SELECT value | isScheduled
|
Warning threshold | |
Critical threshold | isScheduled = 최소 7분 동안 0
|
환경 | 값 |
---|
NRQL | from K8sContainerSample select latest(restartCount) - earliest(restartCount) where clusterName = '<YOUR CLUSTER NAME>' facet containerName, podName
|
Threshold | Static
|
Warning threshold | |
Critical threshold | Open incident when the query returns a value > 1 at least once in 1 minute
|