Adaptive Telemetry Processor(ATP)는 NRDOT(New Telemetry Distribution for OpenTelemetry) Collector 위한 지능형 필터링 프로세서입니다. ATP는 시스템 및 프로세스 지표를 동적으로 모니터링하고, 구성 가능한 참조 값을 기반으로 낮은 가치의 텔레메트리를 필터링하고, 성능 이벤트 중에 중요한 가시성을 유지합니다.
ATP가 중요한 이유
기존의 모니터링 방식은 다음과 같은 몇 가지 문제점을 야기합니다.
- 데이터 과부하: 모든 프로세스에서 발생하는 대용량 텔레메트리 데이터는 비례적인 가치 없이 비용을 증가시킵니다.
- 가시성 격차: 상태 비저장 필터링은 프로세스가 텔레메트리에서 지속적으로 나타났다 사라지면서 "데이터 격차"를 생성합니다. 이는 변동에 따라 발생합니다.
- 맥락 부족: 짧지만 중요한 자원 급증 기간 동안 중요한 프로세스가 누락될 수 있습니다.
- 수동 튜닝: 정적 튜닝은 시스템 조건 변화에 따라 지속적인 조정이 필요합니다.
ATP란 무엇인가요?
ATP는 단순한 청년값, 경계 기반 필터링 대신 다음을 결합합니다.
- 공정 기반 샘플링: 필요에 따라 특정 공정을 모니터링합니다.
- 다중 지표 복합 점수 계산: 구성 가능한 가중치를 사용하여 여러 지표를 결합하여 전체적인 평가를 수행합니다.
- 동적 레버값, 릴레이 조정: 역사적 기준을 기반으로 레버값을 자동으로 조정합니다.
- 이상적으로 탐지: 급격한 지표 변화를 탐지하고 이상 데이터를 보존합니다.
- 지속적인 상태 관리: 수집기 재시작 시 컨텍스트를 유지합니다.
- 낮은 오버헤드: CPU 영향
<2%, RAM 사용량 10-50MB
/* ## ATP의 주요 기능 ### 가시성 유지와 함께 데이터 사용량 대폭 감소 * 컨텍스트 인식 데이터 유지와 동시에 데이터 수집량 감소 * 기존 상태 비저장 필터링에서 발생하는 데이터 공백 제거 * 구성 가능한 보존 기간을 통해 중요한 컨텍스트 보존 ### 2단계 진화 ATP는 단계별 접근 방식을 통해 가치를 제공합니다. * **1단계: 상태 저장 전략** - 영구 상태를 사용한 데이터, 한계 기반 추적 - 데이터, 한계를 초과하는 프로세스에 대한 구성 가능한 보존 기간 - 수집기 재시작 시 영구 저장 * **2단계: 완전 지능형 적응형 시스템** - 시스템 부하에 적응하는 동적 데이터, 한계 - 복합 점수를 사용한 다중 메트릭 평가 - 갑작스러운 사용량 급증에 대한 이상 데이터 감지 ### 엔터프라이즈급 기능 * 경량 스토리지: 추적 상태에 5-10MB의 스토리지만 필요 * 재시작 복원력: 수집기 재시작 시 추적 컨텍스트 유지 * 구성 가능한 동작: 데이터, 한계, 보존 기간 및 가중치 사용자 지정 가능 * 범용 호환성: 모든 리소스 유형과 호환 가능 */
작동 원리
ATP는 지능형 필터링 시스템을 통해 텔레메트리 데이터를 처리합니다.
- 프로세스 식별: 모든 프로세스의 리소스 사용 패턴을 모니터링합니다.
- 레버 값, 릴레이 평가: 구성된 또는 동적 레버 값, 릴레이 값과 현재 사용량을 비교합니다.
- 유지 관리 추적: 필요를 초과하는 프로세스의 상태를 유지합니다.
- 지능형 샘플링: 이상하게 감지, 다중 템플릿 평가 등 고급 로직 적용
- 데이터 전달: 관련된 델메트리 데이터만 뉴렐릭으로 보냅니다.
/* ## 다음 단계 ATP를 사용하여 전면 모니터링 최적화를 시작할 준비가 되셨나요? 방법 알아보기: * [ATP 설정](#) - NRDOT 구현에서 ATP 구성, 배포 * [보존 전략 구성](#) - 레버 값, 관련 및 보존 기간 사용자 정의 * [모니터 ATP 성능](#) - 데이터 감소 및 시스템 영향 추적 <Callout 변형="tip"> ATP는 중요한 프로세스에 대한 포괄적인 가시성을 유지하면서 모니터링 비용을 최적화하려는 조직을 위해 설계되었습니다. */</Callout>