• /
  • EnglishEspañol日本語한국어Português
  • Inicia sesiónComenzar ahora

Te ofrecemos esta traducción automática para facilitar la lectura.

En caso de que haya discrepancias entre la versión en inglés y la versión traducida, se entiende que prevalece la versión en inglés. Visita esta página para obtener más información.

Crea una propuesta

Integración de monitoreo de Amazon EMR

Importante

Habilite la integraciónAWS CloudWatch Metric Streams para monitor todas las métricas de CloudWatch desde sus servicios de AWS, incluido el espacio de nombres personalizado. La integración individual ya no es nuestra opción recomendada.

La integración New Relic Infrastructure incluye una integración para informar sus datos de Amazon EMR (Elastic MapReduce) a New Relic. Este documento explica cómo activar esta integración y describe los datos que se pueden reportar.

Característica

Puede monitor y alertar sobre sus datos EMR directamente desde New Relic, consultar datos y crear un panel.

Activar la integración

Para habilitar esta integración, siga los procedimientos estándar para conectar los servicios de AWS a New Relic.

Configuración y sondeo

Puede cambiar la frecuencia de sondeo y filtrar datos usando las opciones de configuración.

Información de sondeo predeterminada para la integración de Amazon EMR:

  • New Relic intervalo de sondeo: 5 minutos
  • Resolución: 1 punto de datos cada 5 minutos

Explorar datos de integración

Para utilizar sus datos de integración, vaya a one.newrelic.com > All capabilities > Infrastructure > AWS y seleccione uno de los enlaces de integración de EMR.

Puedes consultar y explorar tus datos utilizando el tipo de evento ElasticMapReduceClusterSample , con un valor provider de ElasticMapReduceCluster.

Datos métricos

Esta integración recopila los siguientes datos de Amazon EMR. Para casos de uso e información adicional, consulte la documentación de EMR de Amazon.

Nombre

Descripción

isIdle

Indica que un clúster ya no realiza trabajo, pero sigue activo y acumulando cargos. Se establece en 1 si no se están ejecutando tareas ni trabajos, y se establece en 0 en caso contrario.

Este valor se verifica en intervalos de cinco minutos y un valor de 1 indica solo que el clúster estaba inactivo cuando se verificó, no que estuvo inactivo durante los cinco minutos completos. Recommendation: Para evitar falsos positivos, aumente un umbral de alerta cuando este valor haya sido 1 durante más de una comprobación consecutiva de cinco minutos. Por ejemplo, genere una alerta sobre este valor si ha sido 1 durante treinta minutos o más.

coreNodesRunning

La cantidad de nodos centrales que funcionan. Los puntos de datos para esta métrica se informan solo cuando existe un grupo de instancias correspondiente.

coreNodesPending

La cantidad de nodos centrales que esperan ser asignados. Es posible que todos los nodos centrales solicitados no estén disponibles de inmediato; esta métrica informa las solicitudes pendientes. Los puntos de datos para esta métrica se informan solo cuando existe un grupo de instancias correspondiente.

liveDataNodesPercentage

El porcentaje de nodos de datos que reciben trabajo de Hadoop.

s3WrittenBytes

La cantidad de bytes escritos en Amazon S3. Esta métrica agrega trabajos de MapReduce únicamente. No aplica para otra carga de trabajo en EMR.

s3ReadBytes

La cantidad de bytes leídos de Amazon S3. Esta métrica agrega trabajos de MapReduce únicamente y no se aplica a otras cargas de trabajo en EMR.

hdfsUtilizationPercentage

El porcentaje de almacenamiento HDFS utilizado actualmente.

hdfsReadBytes

La cantidad de bytes leídos de HDFS.

hdfsWrittenBytes

El número de bytes escritos en HDFS.

missingBlocks

La cantidad de bloques en los que HDFS no tiene réplicas. Estos podrían ser bloques corruptos.

totalLoad

El número total actual de lectores y escritores informados por todos los DataNodes en un clúster.

mostRecentBackupDurationMinutes

La cantidad de tiempo que tardó en completarse la copia de seguridad anterior. Esta métrica se establece independientemente de si la última copia de seguridad completada se realizó correctamente o falló.

Mientras la copia de seguridad está en curso, esta métrica devuelve la cantidad de minutos después de que comenzó la copia de seguridad. Esta métrica solo se reporta para el clúster HBase.

timeSinceLastSuccessfulBackupMinutes

La cantidad de minutos transcurridos después de que se inició la última copia de seguridad exitosa de HBase en su clúster. Esta métrica solo se reporta para el clúster HBase.

Las siguientes métricas aparecen en la muestra dependiendo de la versión Hadoop del recurso.

Hadoop 1 AMI métricas

Nombre

Descripción

jobsRunning

La cantidad de trabajos en el clúster que se están ejecutando actualmente.

jobsFailed

La cantidad de trabajos en el clúster que fallaron.

mapTasksRunning

El número de tareas de mapa en ejecución para cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos.

mapTasksRemaining

El número de tareas de mapa restantes para cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos. Una tarea de mapa restante es aquella que no se encuentra en ninguno de los siguientes estados: Running, Killed o Completed.

mapSlotsOpen

La capacidad de tarea de mapa no utilizada. Esto se calcula como la cantidad máxima de tareas de mapas para un clúster determinado, menos la cantidad total de tareas de mapas que se ejecutan actualmente en ese clúster.

remainingMapTasksPerSlot

La proporción entre el total de tareas de mapas restantes y el total de espacios de mapas disponibles en el clúster.

reduceTasksRunning

El número de tareas reducidas en ejecución para cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos.

reduceTasksRemaining

El número de tareas reducidas en ejecución para cada trabajo. Si tiene un programador instalado y varios trabajos en ejecución, se generan varios gráficos.

reduceSlotsOpen

No utilizados reducen la capacidad de la tarea. Esto se calcula como la capacidad máxima de tareas de reducción para un clúster determinado, menos la cantidad de tareas de reducción que se ejecutan actualmente en ese clúster.

taskNodesRunning

El número de nodos de tareas en funcionamiento. Los puntos de datos para esta métrica se informan solo cuando existe un grupo de instancias correspondiente.

taskNodesPending

La cantidad de nodos centrales que esperan ser asignados. Es posible que todos los nodos de tareas solicitados no estén disponibles de inmediato; esta métrica informa las solicitudes pendientes. Los puntos de datos para esta métrica se informan solo cuando existe un grupo de instancias correspondiente.

liveTaskTrackersPercentage

El porcentaje de rastreadores de tareas que son funcionales.

backupFailed

Si falló la última copia de seguridad. Esto se establece en 0 de forma predeterminada y se actualiza a 1 si falló el intento de copia de seguridad anterior. Esta métrica solo se reporta para el clúster HBase.

Hadoop 2 AMI métricas

Nombre

Descripción

containerAllocated

El número de contenedor de recursos asignado por ResourceManager.

containerReserved

El número de contenedor de recursos asignado por ResourceManager.

containerPending

El número de contenedores en la cola que aún no se han asignado.

containerPendingRatio

La proporción de contenedores pendientes a contenedores asignados.

appsCompleted

El número de solicitudes enviadas a YARN que se han completado.

appsFailed

El número de solicitudes enviadas a YARN que no se completaron.

appsKilled

El número de solicitudes enviadas a YARN que han sido eliminadas.

appsPending

El número de solicitudes enviadas a YARN que están en estado pendiente.

appsRunning

El número de aplicaciones enviadas a YARN que se están ejecutando.

appsSubmitted

El número de solicitudes enviadas a YARN.

mrTotalNodes

La cantidad de nodos actualmente disponibles para los trabajos de MapReduce.

mrActiveNodes

La cantidad de nodos que actualmente ejecutan tareas o trabajos de MapReduce.

mrLostNodes

La cantidad de nodos asignados a MapReduce que se han marcado en estado PERDIDO.

mrUnhealthyNodes

La cantidad de nodos disponibles para los trabajos de MapReduce marcados en un estado NO SALUDABLE.

mrDecommissionedNodes

La cantidad de nodos asignados a la aplicación MapReduce que se han marcado en estado DECOMMISSIONED.

mrRebootedNodes

La cantidad de nodos disponibles para MapReduce que se han reiniciado y marcado en un estado REBOOTED.

corruptBlocks

La cantidad de bloques que HDFS informa como corruptos.

memoryTotalBytes

La cantidad total de memoria en el clúster.

memoryReservedBytes

La cantidad de memoria reservada.

memoryAvailableBytes

La cantidad de memoria disponible para asignar.

memoryAllocatedBytes

La cantidad de memoria asignada al clúster.

yarnMemoryAvailablePercentage

El porcentaje de memoria restante disponible para YARN

underReplicatedBlocks

La cantidad de bloques que deben replicarse una o más veces.

dfsPendingReplicationBlocks

El estado de la replicación de bloques: bloques que se replican, antigüedad de las solicitudes de replicación y solicitudes de replicación fallidas.

capacityRemainingBytes

La cantidad de capacidad restante del disco HDFS.

hbaseBackupFailed

Si falló la última copia de seguridad. Esto se establece en 0 de forma predeterminada y se actualiza a 1 si falló el intento de copia de seguridad anterior. Esta métrica solo se reporta para el clúster HBase.

Copyright © 2024 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.