Importante
Habilite a integração do AWS CloudWatch Metric Streams para monitor todas as métricas do CloudWatch de seus serviços da AWS, incluindo namespace personalizado. A integração individual não é mais nossa opção recomendada.
A integração New Relic Infrastructure inclui uma integração para relatar seus dados do Amazon EMR (Elastic MapReduce) para New Relic. Este documento explica como ativar esta integração e descreve os dados que podem ser reportados.
Recurso
Você pode monitor e alertar sobre seus dados EMR diretamente do New Relic, consultar dados e criar um painel.
Ativar integração
Para habilitar essa integração, siga os procedimentos padrão para conectar os serviços da AWS ao New Relic.
Configuração e polling
Você pode alterar a frequência de pesquisa e filtrar dados usando opções de configuração.
Informações de pesquisa padrão para a integração do Amazon EMR:
- Intervalo de sondagem New Relic : 5 minutos
- Resolução: 1 ponto de dados a cada 5 minutos
Explore dados de integração
Para usar seus dados de integração, acesse one.newrelic.com > All capabilities > Infrastructure > AWS e selecione um dos links de integração do EMR.
Você pode consultar e explorar seus dados usando o tipo de evento ElasticMapReduceClusterSample
, com um valor provider
de ElasticMapReduceCluster
.
Dados métricos
Essa integração coleta os seguintes dados do Amazon EMR. Para casos de uso e informações adicionais, consulte a documentação do EMR da Amazon.
Nome | Descrição |
---|---|
| Indica que um cluster não está mais executando trabalho, mas ainda está ativo e acumulando cobranças. É definido como 1 se nenhuma tarefa estiver em execução e nenhum trabalho estiver em execução, e definido como 0 caso contrário. Esse valor é verificado em intervalos de cinco minutos, e um valor 1 indica apenas que o cluster estava inativo quando verificado, e não que ficou inativo durante os cinco minutos inteiros. Recomendação: Para evitar falso positivo, aumente um limite de alerta quando este valor for 1 por mais de uma verificação consecutiva de cinco minutos. Por exemplo, gere um alerta sobre esse valor se ele tiver sido 1 por trinta minutos ou mais. |
| O número de nós principais funcionando. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente. |
| O número de nós principais aguardando para serem atribuídos. Todos os nós principais solicitados podem não estar disponíveis imediatamente; esta métrica relata as solicitações pendentes. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente. |
| A porcentagem de nós de dados que estão recebendo trabalho do Hadoop. |
| O número de bytes gravados no Amazon S3. Esta métrica agrega apenas trabalhos MapReduce. Não se aplica a outras cargas de trabalho no EMR. |
| O número de bytes lidos do Amazon S3. Esta métrica agrega apenas trabalhos MapReduce e não se aplica a outras cargas de trabalho no EMR. |
| A porcentagem de armazenamento HDFS usado atualmente. |
| O número de bytes lidos do HDFS. |
| O número de bytes gravados no HDFS. |
| O número de blocos nos quais o HDFS não possui réplicas. Estes podem ser blocos corrompidos. |
| O número total atual de leitores e gravadores relatados por todos os DataNodes em um cluster. |
| A quantidade de tempo que o backup anterior levou para ser concluído. Essa métrica é definida independentemente de o último backup concluído ter sido bem-sucedido ou falhar. Enquanto o backup estiver em andamento, essa métrica retornará o número de minutos após o início do backup. Esta métrica é reportada apenas para cluster HBase. |
| O número de minutos decorridos após o último backup bem-sucedido do HBase ter sido iniciado em seu cluster. Esta métrica é reportada apenas para cluster HBase. |
As seguintes métricas aparecem na amostra dependendo da versão Hadoop do recurso.
Métrica de AMIs do Hadoop 1
Nome | Descrição |
---|---|
| O número de trabalhos no cluster que estão em execução no momento. |
| O número de trabalhos no cluster que falharam. |
| O número de tarefas de mapa em execução para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados. |
| O número de tarefas de mapa restantes para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados. Uma tarefa de mapa restante é aquela que não está em nenhum dos seguintes estados: |
| A capacidade de tarefa de mapa não utilizada. Isso é calculado como o número máximo de tarefas de mapa para um determinado cluster, menos o número total de tarefas de mapa atualmente em execução nesse cluster. |
| A proporção entre o total de tarefas de mapa restantes e o total de slots de mapa disponíveis no cluster. |
| O número de tarefas de redução em execução para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados. |
| O número de tarefas de redução em execução para cada trabalho. Se você tiver um planejador instalado e vários trabalhos em execução, vários gráficos serão gerados. |
| Não utilizados reduzem a capacidade da tarefa. Isso é calculado como a capacidade máxima de redução de tarefas para um determinado cluster, menos o número de tarefas de redução atualmente em execução nesse cluster. |
| O número de nós de tarefa em funcionamento. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente. |
| O número de nós principais aguardando para serem atribuídos. Todos os nós de tarefas solicitados podem não estar imediatamente disponíveis; esta métrica relata as solicitações pendentes. Os pontos de dados para esta métrica são reportados apenas quando existe um grupo de instâncias correspondente. |
| A porcentagem de rastreadores de tarefas funcionais. |
| Se o último backup falhou. Isso é definido como 0 por padrão e atualizado para 1 se a tentativa de backup anterior falhar. Esta métrica é reportada apenas para cluster HBase. |
Métrica de AMIs do Hadoop 2
Nome | Descrição |
---|---|
| A quantidade de contêineres de recursos alocados pelo ResourceManager. |
| A quantidade de contêineres de recursos alocados pelo ResourceManager. |
| A quantidade de contêineres na fila que ainda não foram alocados. |
| A relação entre contêineres pendentes e contêineres alocados. |
| O número de aplicativos enviados ao YARN que foram concluídos. |
| O número de aplicativos enviados ao YARN que não foram concluídos. |
| O número de aplicativos enviados ao YARN que foram eliminados. |
| O número de aplicativos enviados ao YARN que estão em estado pendente. |
| O número de aplicativos enviados ao YARN que estão em execução. |
| O número de aplicativos enviados ao YARN. |
| O número de nós atualmente disponíveis para trabalhos MapReduce. |
| O número de nós atualmente executando tarefas ou trabalhos do MapReduce. |
| O número de nós alocados para MapReduce que foram marcados em estado LOST. |
| O número de nós disponíveis para tarefas MapReduce marcadas em um estado UNHEALTHY. |
| O número de nós alocados para o aplicativo MapReduce que foram marcados em um estado DECOMMISSIONED. |
| O número de nós disponíveis para MapReduce que foram reinicializados e marcados em estado REBOOTED. |
| O número de blocos que o HDFS relata como corrompidos. |
| A quantidade total de memória no cluster. |
| A quantidade de memória reservada. |
| A quantidade de memória disponível para ser alocada. |
| A quantidade de memória alocada para o cluster. |
| A porcentagem de memória restante disponível para o YARN |
| O número de blocos que precisam ser replicados uma ou mais vezes. |
| O status da replicação de bloco: blocos sendo replicados, idade das solicitações de replicação e solicitações de replicação malsucedidas. |
| A quantidade de capacidade restante do disco HDFS. |
| Se o último backup falhou. Isso é definido como 0 por padrão e atualizado para 1 se a tentativa de backup anterior falhar. Esta métrica é reportada apenas para cluster HBase. |