• /
  • EnglishEspañol日本語한국어Português
  • EntrarComeçar agora

Esta tradução de máquina é fornecida para sua comodidade.

Caso haja alguma divergência entre a versão em inglês e a traduzida, a versão em inglês prevalece. Acesse esta página para mais informações.

Criar um problema

Integração Amazon SageMaker

New Relic integra-se com Amazon Web Services (AWS) para relatar suas métricas do Amazon SageMaker e outros dados ao New Relic.

Este documento explica como ativar a integração e descreve os dados relatados.

Recurso

Colete e envie dados de telemetria para o New Relic a partir dos seus serviços do Amazon SageMaker usando nossa integração. monitore seus serviços, consulte dados recebidos e crie um painel para observar tudo rapidamente.

Ativar integração

Essa integração está disponível por meio do CloudWatch Metric Streams.

Para habilitar essa integração, veja como conectar serviços da AWS ao New Relic via CloudWatch Metric Streams.

Encontre e use dados

Para encontrar a métrica da sua integração, acesse one.newrelic.com > Metrics and events e filtre por aws.sagemaker.

Dados métricos

Esta integração da New Relic Infrastructure coleta os seguintes dados do Amazon SageMaker:

Dados métricos do SageMaker

Métrica (min, max, média, contagem, soma)

Unidade

Descrição

Invocations

Contar

O número de solicitações InvokeEndpoint enviadas para um endpoint modelo.

InvocationsPerInstance

Contar

O número de invocações enviadas para um modelo, normalizadas por InstanceCount em cada ProductionVariant.

OverheadLatency

Microssegundos

O intervalo de tempo adicionado ao tempo necessário para responder a uma solicitação do cliente pelas despesas gerais do SageMaker.

ModelLatency

Microssegundos

O intervalo de tempo que um modelo leva para responder a uma solicitação da API SageMaker.

Invocation4XXErrors

Contar

O número de solicitações InvokeEndpoint em que o modelo retornou um código de resposta HTTP 4xx.

Invocation5XXErrors

Contar

O número de solicitações InvokeEndpoint em que o modelo retornou um código de resposta HTTP 5xx.

InvocationModelErrors

Contar

O número de solicitações de invocação de modelo que não resultaram em resposta HTTP 2XX.

Todos os dados importados do SageMaker têm uma dimensão: EndpointName

Dados métricos do endpoint Sagemaker

Métrica (min, max, média, contagem, soma)

Unidade

Descrição

MemoryUtilization

Por cento

A porcentagem de memória usada pelo contêiner em uma instância. Para variantes endpoint , o valor é a soma da utilização de memória do contêiner primário e suplementar na instância.

DiskUtilization

Por cento

A porcentagem de espaço em disco usado pelo contêiner em uma instância utiliza. Para variantes endpoint , o valor é a soma da utilização do espaço em disco do contêiner primário e suplementar na instância.

CPUUtilization

Por cento

A soma da utilização de cada núcleo de CPU individual. Para variantes endpoint , o valor é a soma da utilização da CPU do contêiner primário e suplementar na instância.

GPUMemoryUtilization

Por cento

A porcentagem de memória GPU usada pelo contêiner em uma instância. Para variantes endpoint , o valor é a soma da utilização de memória da GPU do contêiner primário e suplementar na instância.

GPUUtilization

Por cento

A porcentagem de unidades de GPU usadas pelo contêiner em uma instância. Para variantes endpoint , o valor é a soma da utilização de GPU do contêiner primário e suplementar na instância.

Todos os dados importados do endpoint do SageMaker têm uma dimensão: Host

Dados métricos de trabalhos de treinamento do SageMaker

Métrica (min, max, média, contagem, soma)

Unidade

Descrição

MemoryUtilization

Por cento

A porcentagem de memória usada pelo contêiner em uma instância. Para o trabalho de treinamento, o valor é a utilização da memória do algoritmo contêiner na instância.

DiskUtilization

Por cento

A porcentagem de espaço em disco usado pelo contêiner em uma instância utiliza. Para trabalho de treinamento, o valor é a utilização do espaço em disco do algoritmo contêiner na instância.

CPUUtilization

Por cento

A soma da utilização de cada núcleo de CPU individual. Para trabalho de treinamento, o valor é a utilização da CPU do algoritmo contêiner na instância.

TrainErrors

Contar

Mede o número de erros de treinamento do trabalho de treinamento.

Todos os dados importados do SageMaker Training Jobs têm uma dimensão: Host

Criar alerta

Você pode configurar para notificá-lo se houver alguma alteração. Por exemplo, você pode configurar um alerta para notificar as partes relevantes sobre erros críticos ou fatais.

Saiba mais sobre como criar alertas aqui.

Copyright © 2024 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.