• EnglishEspañol日本語한국어Português
  • Inicia sesiónComenzar ahora

Te ofrecemos esta traducción automática para facilitar la lectura.

In the event of any inconsistency between the English version and the translated version, the English versionwill take priority. Please visit this page for more information.

Crea una propuesta

Azure Machine Learning a través del monitoreo de integración de Azure

La integración de New Relic incluye una integración para reportar su métrica Microsoft Azure Machine Learning y otros datos a New Relic. Este documento explica cómo activar la integración y describe los datos reportados.

Característica

New Relic recopila datos métricos del monitoreo de Azure para el servicio Azure Machine Learning. Azure Machine Learning es un servicio en la nube para acelerar y gestionar el ciclo de vida de proyectos de aprendizaje automático. Los profesionales del aprendizaje automático, los científicos de datos y los ingenieros pueden usarlo en su flujo de trabajo diario para entrenar y desplegar modelos o gestionar MLOps.

Usando New Relic, puedes:

Activar la integración

Siga el procedimiento estándar de monitoreo de integración de Azure para activar su servicio de Azure en el monitoreo de infraestructura New Relic .

Configuración y sondeo

Puede cambiar la frecuencia de sondeo y filtrar datos usando las opciones de configuración.

New Relic consulta su servicio Azure Machine Learning a través del monitoreo de integración de Azure según un intervalo de sondeo predeterminado.

Buscar y utilizar datos

Para explorar sus datos de integración, vaya a one.newrelic.com/infra > Azure > (select an integration).

Datos métricos

Esta integración recoge los siguientes datos métricos:

Azure Machine Learning métrica

Espacios de trabajo

La siguiente tabla enumera las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces .

Métrica

Descripción

ActiveCores

Número de núcleos activos

ActiveNodes

Número de nodos activos. Estos son los nodos que ejecutan activamente un trabajo.

CancelRequestedRuns

Número de ejecuciones en las que se solicitó la cancelación para este espacio de trabajo.

CancelledRuns

Número de ejecuciones canceladas para este espacio de trabajo.

CompletedRuns

Número de ejecuciones completadas correctamente para este espacio de trabajo.

CpuCapacityMillicores

Capacidad máxima de un nodo de CPU en milicores.

CpuMemoryCapacityMegabytes

Utilización máxima de memoria de un nodo de CPU en megabytes.

CpuMemoryUtilizationMegabytes

Utilización de la memoria de un nodo de CPU en megabytes.

CpuMemoryUtilizationPercentage

Porcentaje de utilización de memoria de un nodo de CPU.

CpuUtilization

Porcentaje de utilización en un nodo de CPU

CpuUtilizationMillicores

Utilización de un nodo de CPU en milicores

CpuUtilizationPercentage

Porcentaje de utilización de un nodo de CPU.

DiskAvailMegabytes

Espacio disponible en disco en megabytes.

DiskReadMegabytes

Datos leídos del disco en megabytes

DiskUsedMegabytes

Espacio en disco utilizado en megabytes

DiskWriteMegabytes

Datos escritos en el disco en megabytes

Errors

Número de errores de ejecución en este espacio de trabajo

FailedRuns

Número de ejecuciones fallidas para este espacio de trabajo

FinalizingRuns

Datos leídos del disco en megabytes

GpuCapacityMilliGPUs

Capacidad máxima de un dispositivo GPU en mili-GPU

GpuEnergyJoules

Energía de intervalo en julios en un nodo GPU

GpuMemoryCapacityMegabytes

Capacidad máxima de memoria de un dispositivo GPU en megabytes.

GpuMemoryUtilization

Porcentaje de utilización de memoria en un nodo GPU.

GpuMemoryUtilizationMegabytes

Utilización de la memoria de un dispositivo GPU en megabytes

GpuMemoryUtilizationPercentage

Porcentaje de utilización de memoria de un dispositivo GPU

GpuUtilization

Porcentaje de utilización en un nodo GPU

GpuUtilizationMilliGPUs

Utilización de un dispositivo GPU en mili-GPU

GpuUtilizationPercentage

Porcentaje de utilización de un dispositivo GPU

IBReceiveMegabytes

Datos de red recibidos a través de InfiniBand en megabytes

IBTransmitMegabytes

Datos de red enviados a través de InfiniBand en megabytes

IdleCores

Número de núcleos inactivos

IdleNodes

Número de nodos inactivos

LeavingCores

Número de núcleos salientes

LeavingNodes

Número de nodos salientes

ModelDeployFailed

Número de despliegues de modelo que fallaron en este espacio de trabajo

ModelDeployStarted

Número de despliegues de modelo iniciados en este espacio de trabajo

ModelDeploySucceeded

Número de despliegues de modelo que tuvieron éxito en este espacio de trabajo

ModelRegisterFailed

Número de registros de modelos que fallaron en este espacio de trabajo

ModelRegisterSucceeded

Número de registros de modelos que tuvieron éxito en este espacio de trabajo

NetworkInputMegabytes

Datos de red recibidos en megabytes. métricas se agregan en intervalos de un minuto

NetworkOutputMegabytes

Datos de red enviados en megabytes. métricas se agregan en intervalos de un minuto.

Not Responding Runs

Número de ejecuciones que no responden para este espacio de trabajo.

NotStartedRuns

Número de ejecuciones en estado No iniciado para este espacio de trabajo

PreemptedCores

Número de núcleos preferenciales

PreemptedNodes

Número de nodos preferenciales

PreparingRuns

Número de ejecuciones que se están preparando para este espacio de trabajo.

Provisioning Runs

Número de ejecuciones que se están aprovisionando para este espacio de trabajo.

Queued Runs

Número de ejecuciones que están en cola para este espacio de trabajo

QuotaUtilizationPercentage

Porcentaje de cuota utilizada

Started Runs

Número de ejecuciones en ejecución para este espacio de trabajo

Starting Runs

Número de ejecuciones iniciadas para este espacio de trabajo

StorageAPIFailureCount

Recuento de errores de API de llamada de Azure Blob Storage.

StorageAPISuccessCount

Recuento de éxitos de la API de llamadas de Azure Blob Storage.

TotalCores

Número de núcleos totales

TotalNodes

Número de nodos totales

UnusableCores

Número de núcleos inutilizables

UnusableNodes

Número de nodos inutilizables

Warnings

Número de advertencias de ejecución en este espacio de trabajo

La siguiente tabla enumera las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments .

Métrica

Descripción

CpuMemoryUtilizationPercentage

Porcentaje de utilización de memoria en una instancia

CpuUtilizationPercentage

Porcentaje de utilización de CPU en una instancia

DataCollectionErrorsPerMinute

El número de eventos de recopilación de datos disminuyó por minuto.

DataCollectionEventsPerMinute

El número de eventos de recopilación de datos procesados por minuto.

DeploymentCapacity

El número de instancias en el despliegue.

DiskUtilization

Porcentaje de utilización del disco en una instancia

GpuEnergyJoules

Energía de intervalo en julios en un nodo GPU

GpuMemoryUtilizationPercentage

Porcentaje de utilización de la memoria de la GPU en una instancia

GpuUtilizationPercentage

Porcentaje de utilización de GPU en una instancia.

RequestLatency_P50

Latencia promedio de solicitud de P50

RequestLatency_P90

Latencia promedio de solicitud de P90

RequestLatency_P95

Latencia promedio de solicitud de P95

RequestLatency_P99

La latencia promedio de solicitud P99

RequestsPerMinute

El número de solicitudes enviadas a online implementadas en un minuto.

La siguiente tabla enumera las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints .

Métrica

Descripción

ConnectionsActive

El número total de conexiones TCP simultáneas activas desde clientes

DataCollectionErrorsPerMinute

El número de eventos de recopilación de datos disminuyó por minuto.

DataCollectionEventsPerMinute

El número de eventos de recopilación de datos procesados por minuto.

NetworkBytes

Los bytes por segundo servidos para el extremo.

NewConnectionsPerSecond

El número promedio de nuevas conexiones TCP por segundo establecidas desde los clientes.

RequestLatency

El intervalo de tiempo completo promedio que se tarda en responder a una solicitud en milisegundos.

RequestLatency_P50

La latencia de solicitud P50 promedio agregada por todos los valores de latencia de solicitud recopilados durante el período de tiempo seleccionado

RequestLatency_P90

La latencia de solicitud P90 promedio agregada por todos los valores de latencia de solicitud recopilados durante el período de tiempo seleccionado

RequestLatency_P95

La latencia de solicitud P95 promedio agregada por todos los valores de latencia de solicitud recopilados durante el período de tiempo seleccionado

RequestLatency_P99

La latencia de solicitud P99 promedio agregada por todos los valores de latencia de solicitud recopilados durante el período de tiempo seleccionado

RequestsPerMinute

El número de solicitudes enviadas a online extremo en un minuto

Copyright © 2024 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.