• 로그인지금 시작하세요

사용자의 편의를 위해 제공되는 기계 번역입니다.

영문본과 번역본이 일치하지 않는 경우 영문본이 우선합니다. 보다 자세한 내용은 이 페이지를 방문하시기 바랍니다.

문제 신고

적용된 인텔리전스를 통한 이상 감지

적용된 인텔리전스의 이상 감지 기능을 사용하면 APM에서 모니터링하는 애플리케이션의 이상이 활동 스트림 및 이상 피드에 자동으로 표시됩니다. 각 변칙을 클릭하여 자동 분석을 불러올 수 있습니다.

Slack에서 이상 징후에 대한 알림을 전달하거나 필요할 때 메시지를 전달하도록 웹훅을 설정할 수 있습니다. 이러한 이벤트는 쿼리, 사용자 지정 대시보드 생성 및 경고에 사용할 수 있습니다. 이상 감지 구성(관심 있는 앱 그룹)을 설정한 후 이 구성을 소스로 추가할 수 있습니다. 그런 다음 이상 징후는 사고 인텔리전스를 통해 다른 데이터 소스와 자동으로 상관됩니다.

이상 현상이 나타나는 위치, 문제가 되기 전에 잠재적 문제를 이해하고 경고를 생성하는 데 사용하는 방법을 알아보려면 이 짧은 비디오(약 4분 15분)를 시청하십시오.

요구 사항

이상 감지를 사용하려면 다음이 있는지 확인하십시오.

  • 하나 이상의 응용 프로그램에 대해 설치된 APM 에이전트.
  • Slack에서 알림을 받으려면 IT 관리자에게 Slack 작업 공간 에 New Relic 애플리케이션을 설치하도록 요청해야 합니다.

데이터 제한에 대한 자세한 내용은 데이터 제한 을 참조하십시오.

중요한 이유

이상 감지를 통해 적용된 인텔리전스는 이상에 대한 자동 분석과 함께 프로덕션 시스템의 이상에 대한 통찰력을 제공합니다. 추가 비용 없이 자동으로 활성화됩니다. 이상이 감지되면 적용된 인텔리전스 이상 피드에서 확인하거나 Slack 채널 또는 웹훅으로 직접 알림을 보내드립니다.

작동 원리

이상 감지는 다음 방법을 사용하여 앱 데이터의 이상을 감지합니다.

  1. 이상 감지는 APM 에이전트가 보고한 메트릭 데이터를 모니터링하여 일반적인 애플리케이션 역학 모델을 구축하고 처리량, 응답 시간 및 오류와 같은 주요 황금 신호에 중점을 둡니다.
  2. 이러한 황금 신호 중 하나가 비정상적인 동작을 보이면 시스템은 이를 플래그로 지정하고 정상 동작으로의 복구를 추적합니다.
  3. 시스템은 데이터 변경 사항에 적응하고 새로운 데이터를 기반으로 모델을 지속적으로 업데이트합니다.

자동으로 켜기 : 기본적으로 이상 감지는 사용자가 취해야 할 조치 없이 모든 APM 애플리케이션을 모니터링합니다. 이상이 감지되면 다양한 활동 스트림에 자동으로 표시되고 적용된 인텔리전스 이상은 NRQL을 통해 쿼리할 수 있습니다.

알림 수신: 처리량, 오류율 또는 응답 시간의 비정상적인 변화를 감지하면 알림을 보냅니다. 알림은 선택한 Slack 채널로 전송되거나 웹훅을 통해 전송됩니다. 이상이 정상으로 돌아오면 복구 메시지가 전송됩니다. 알림을 받고 싶지 않은 경우에도 NRQL 쿼리 를 통해 데이터에 액세스할 수 있습니다.

이상 분석: 각 이상에 대해 Slack에서 이상 분석 페이지로 연결되는 링크를 제공합니다. 이 페이지는 이상에 대한 자동 통찰력을 생성합니다. 이 페이지는 최근의 이상 항목을 나열하는 이상 항목 탭에서도 사용할 수 있습니다. 이 페이지는 기존 APM 및 이상 탐지 데이터를 사용하여 이상 원인에 대한 설명을 제공합니다.

활동 스트림: New Relic 홈페이지, APM 요약 페이지, Lookout 및 Explorer와 같은 다양한 활동 스트림 내에서 APM 모니터링 애플리케이션의 관련 이상 현상을 볼 수 있습니다. 활동 스트림에서 이상 이벤트를 클릭하면 해당 이상에 대한 분석 페이지가 나타납니다.

애플리케이션이 항상 이상을 생성하는 것은 아니므로 탐지를 수신하지 않는 것이 정상일 수 있습니다.

이상 감지에 대한 알림 설정

추가 비용 없이 사전 감지가 자동으로 활성화됩니다. 알림을 받거나 사고 인텔리전스를 위한 소스로 추가할 수 있는 구성(앱 그룹)을 가지려면 이상 감지 구성을 생성해야 합니다. 이상 감지 UI에서 구성을 생성할 수 있습니다.

  1. one.newrelic.com 에서 알림 및 AI 를 클릭합니다.

  2. 사전 검색 에서 설정 을 클릭합니다 .

  3. 구성 추가를 클릭합니다.

  4. 양식에 다음 정보를 입력합니다.

    • 계정의 다른 사람들과 쉽게 식별할 수 있도록 구성 이름을 선택하십시오.
    • 계정을 선택합니다.
    • 최대 1,000개의 애플리케이션을 선택합니다. 처리량이 낮은 특정 응용 프로그램은 데이터 변동의 작은 양에 더 민감할 수 있으므로 비정상 탐지에 적합하지 않을 수 있습니다.
  5. 선택 사항: 이상 징후를 모니터링하려는 황금 신호를 선택합니다.

  6. 선택 사항: 사고 정보에 연결합니다 .

알림 음소거(Slack만 해당)

Slack에서는 특정 애플리케이션에서 감지된 항목을 일시적으로 또는 영구적으로 음소거할 수 있습니다. 전체 채널을 일시적으로 음소거할 수도 있습니다. 이는 사고가 발생한 경우나 채널이 중단되어서는 안 되는 경우에 유용합니다.

Slack에서 음소거하려면 이 앱의 경고 음소거 또는 모든 경고 음소거 를 선택한 다음 기간을 선택합니다. 음소거 기간이 완료되면 감지에 대한 알림 전송을 재개합니다.

응용 프로그램을 음소거하면 구성에서 영구적으로 제거됩니다. 다시 추가하려면 one.newrelic.com 으로 이동하십시오. 상단 탐색 메뉴에서 Alerts & AI 를 클릭한 다음 anomaly detection 을 클릭하고 편집할 구성을 선택합니다.

이상 탐지 알림을 음소거해도 경고에는 영향을 미치지 않습니다.

이상 감지 Slack 메시지 사용

각 이상 메시지에는 잠재적인 문제에 대해 자세히 알아보고 문제 해결을 시작하는 데 사용할 수 있는 몇 가지 주요 정보가 있습니다.

  • 애플리케이션 이름 및 New Relic UI에 대한 추가 정보 링크.
  • New Relic UI에서 이상 현상이 발생한 메트릭 및 세부 정보에 대한 링크.
  • 시간 경과에 따른 메트릭 그래프로 이상 현상의 동작과 정도를 시각적으로 이해할 수 있습니다.
  • 이상, 업스트림 또는 다운스트림에서 발견된 이상, 기타 관련 신호에 고유한 주요 속성을 식별하는 응용 인텔리전스의 분석 페이지로 이동하는 분석 버튼입니다.

이상이 정상으로 돌아오면 피드백을 제공할 수 있는 옵션이 포함된 복구 알림을 보냅니다. 귀하의 피드백은 감지 품질을 개선하는 데 도움이 되는 정보를 개발 팀에 제공합니다. 처리량 이상에 대한 피드백의 경우 피드백을 기반으로 매시간 평가를 실행하여 보다 적합한 모델에 적합하도록 합니다. 도움이 되었다면 또는 아니요 를 선택할 수 있습니다.

이상 항목의 개요 보기

Slack 또는 웹훅을 통해 정보를 제공하는 이상 징후에 대한 알림 외에도 Alerts & AI Overview 페이지Anomalies 탭 을 통해 환경의 이상 징후에 대한 자세한 정보를 볼 수 있습니다. 해당 탭은 선택한 계정의 모든 구성에서 최근 발생한 모든 이상 항목의 목록을 제공하며 자세한 분석을 위해 이상 항목을 선택할 수 있습니다.

이상 가시성 설정

변칙성은 다양한 New Relic 활동 스트림과 적용된 인텔리전스 변칙 피드에 표시됩니다. 비정상 가시성 설정을 사용하여 표시되는 항목을 사용자 정의할 수 있습니다(예: 활동 스트림에서 처리량 비정상을 숨기지만 비정상 피드에는 유지).

이러한 설정을 찾으려면 경고 및 AI 에서 사전 감지 아래에서 설정 을 클릭합니다 .

이러한 설정 사용에 대한 참고 사항:

  • 이러한 설정은 사용자 수준에서 적용됩니다. 변경 사항은 조직의 다른 사용자에게 영향을 미치지 않습니다.
  • 이러한 설정에 관계없이 이상 현상은 계속 보고되고 NRQL 쿼리 에 사용할 수 있습니다.

이 UI 섹션에 대한 세부정보:

  • AI 개요 및 변칙 탭 : AI 개요 및 변칙 탭 설정을 사용하여 AI 개요 및 변칙 탭 설정에서 변칙을 숨깁니다. 이러한 보기와 관련된 필터도 사용할 수 있습니다.
  • 글로벌 활동 스트림 : 글로벌 활동 스트림 섹션을 사용하여 New Relic 홈페이지, APM 요약 및 Lookout을 포함한 다양한 New Relic 활동 스트림에 표시되는 변칙성을 사용자 정의하십시오.
  • 이상 유형 : 여기에서 확인란을 사용하여 특정 유형의 이상을 숨깁니다. 예를 들어, 활동 스트림과 AI 개요 및 이상 탭 모두에서 이러한 유형의 이상을 숨기려면 웹 처리량비웹 처리량 이상을 선택 취소합니다. (참고로 여전히 보고되고 쿼리할 수 있습니다.)

이상 데이터 쿼리

NRQL 을 사용하여 NrAiAnomaly 이벤트를 사용하여 이상 감지 데이터를 쿼리하고 차트로 작성할 수 있습니다. 예를 들어:

FROM NrAiAnomaly SELECT *

중요

이 데이터는 이전에 ProactiveDetection 이벤트에 첨부되었습니다. 해당 이벤트는 2021년 4월 7일에 더 이상 사용되지 않습니다. 맞춤 차트에서 ProactiveDetection 을 사용하는 경우 이러한 쿼리를 NrAiAnomaly 를 사용하여 변환해야 합니다.

다음은 이 이벤트에 연결된 중요한 속성입니다.

기인하다

설명

closeTime
타임스탬프

이상이 종료된 시간입니다. 예: 1615304100000 .

configurationType

이벤트를 모니터링하는 구성 유형입니다. 하나 이상의 구성이 엔티티를 모니터링하는 경우 configuration 으로 설정됩니다. 그렇지 않으면 automatic 로 설정됩니다.

entity.accountId
숫자

엔티티가 속한 New Relic 계정 ID입니다.

entity.domain
숫자

항목의 도메인(현재는 APM 이지만 향후 기능에 따라 변경됨)

entity.guid

엔터티의 GUID입니다. 이것은 NerdGraph를 통해 엔티티에 대한 데이터를 식별하고 검색하는 데 사용됩니다. entityGuid 과 동일합니다.

entityGuid

엔터티의 GUID입니다. 이것은 NerdGraph를 통해 엔티티에 대한 데이터를 식별하고 검색하는 데 사용됩니다. entity.guid 과 동일합니다.

entity.name

데이터가 비정상적인 것으로 확인된 엔터티의 이름입니다. entityName 과 동일합니다. 예: Laura's coffee service .

entityName

데이터가 비정상적인 것으로 확인된 엔터티의 이름입니다. entity.name 과 동일합니다.

entity.type

항목 유형(현재는 APPLICATION 만 있지만 향후 기능에 따라 변경됨)

evaluationType

이것은 항상 anomaly 입니다.

event

비정상적인 데이터의 시작( open )인지 끝( close )인지 나타냅니다.

openTime
타임스탬프

이상이 열린 시간입니다. 예: 1615303740000 .

signalType

분석된 데이터 유형입니다. 예: error_rate 또는 response_time.non_web .

timestamp
타임스탬프

이벤트가 작성된 시간입니다.

title

이상 현상에 대한 설명입니다. 예: Error rate was much higher than normal .

인시던트 인텔리전스의 소스로 이상 항목 추가

인시던트 인텔리전스를 이상 감지와 통합하여 컨텍스트와 상관 관계를 얻을 수 있습니다. 인시던트 인텔리전스에서 이 작업을 수행하는 방법에 대해 알아보려면 소스 구성 을 참조하십시오.

구성 내부에서 사고 인텔리전스에 연결을 선택할 수도 있습니다.

Webhook 페이로드 및 예시

사전 감지는 HTTPS POST를 통해 이벤트 본문을 JSON 형식으로 보냅니다. 시스템은 끝점이 성공적인 HTTP 코드(2xx)를 반환할 것으로 예상합니다. 웹훅을 사용하여 사전 감지를 구성하는 경우 웹훅 본문 형식 및 JSON 스키마의 다음 예를 사용하십시오.

기인하다

설명

category
열거

분석된 데이터의 범주입니다.

범주에는 웹 처리량, 웹이 아닌 처리량, 웹 트랜잭션, 웹이 아닌 트랜잭션 및 오류 클래스가 포함됩니다.

data
목록

탐지로 이어지는 시계열 데이터.

data[].timestamp
숫자

Unix epoch 이후 데이터 포인트의 타임스탬프(밀리초 )입니다. 예: 1584366819000

data[].unit

데이터 포인트의 값을 설명하는 단위입니다.

데이터 단위에는 count , millisecondserror_rate 가 포함됩니다.

data[].value
숫자

데이터 포인트의 값입니다. 예: 1.52

detectionType
열거

분석된 데이터 유형입니다. 유형에는 latency , throughputerror_rate 가 있습니다.

entity
물체

비정상적인 데이터를 보고한 개체입니다.

entity.accountId
숫자

엔터티 계정의 ID입니다.

entity.domain
열거

엔터티의 도메인입니다. 예: APM.

entity.domainId

도메인 내에서 엔티티를 고유하게 식별하는 데 사용되는 ID입니다.

entity.guid

모든 제품에서 엔티티를 고유하게 식별하는 데 사용되는 가이드입니다.

entity.name

엔터티의 이름입니다. 예시: Laura’s coffee service

entity.link

엔터티를 볼 수 있는 링크입니다. 예시:

https://rpm.newrelic.com/accounts/YOUR_ACCOUNT_ID/applications/987654321”

severity
열거

NORMAL , WARNING 또는 CRITICAL 를 포함하여 변경이 얼마나 비정상적으로 발생했는지에 대한 설명입니다.

version

제공되는 데이터를 설명하는 데 사용되는 버전입니다.

예: v1

viewChartImageUrl

변칙 데이터의 차트를 보여주는 이미지.

anomalyzerUrl

New Relic의 변칙성을 분석하기 위해 열 수 있는 URL입니다.

데이터 제한

요구 사항 외에도 데이터 제한은 다음과 같습니다.

  • 모니터링되는 APM 애플리케이션: 구성당 1,000개로 제한
  • Slack 구성: 계정당 200개로 제한
  • 웹훅 구성: 계정당 200개로 제한
  • 알림이 없는 구성: 계정당 200개로 제한
Copyright © 2022 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.