IU de hosts de infraestrutura

Em nossa interface de monitoramento de infraestrutura, a página de interface Hosts é o principal local para você entender e solucionar problemas com sua infraestrutura.

Dica

Estes documentos descrevem a nova interface Hosts adicionada em abril de 2023. Você pode alternar entre a nova visualização e a visualização Classic .

one.newrelic.com > All capabilities > Infrastructure

Um exemplo de caso de uso

A página Hosts é o local ideal para investigar problemas em sua infraestrutura. Aqui está um exemplo de fluxo de trabalho comum que nossos clientes usam para diagnosticar um problema:

Na página de resumo do APM, você percebe um problema com seu serviço Kafka. taxas de transferência caiu e muitos erros estão presentes.
Com base nos dados de infraestrutura que você vê no APM, você acha que é um problema de host, então clica na página de infraestrutura Hosts .
A página Hosts filtra automaticamente para seu serviço Kafka. Você vê que metade dos hosts que executam esse serviço atingiram o limite máximo de sua% de CPU.
Se você suspeitar que uma alteração na configuração do host pode ser a origem do seu problema, acesse a guia Inventory e verifique as configurações do seu sistema por host.

Recurso de interface para explorar e analisar seus hosts

Existem alguns recursos de interface importantes disponíveis na interface Hosts . Entender como usá-los ajudará você a aproveitar ao máximo essa interface.

A. A barra de filtro: Filtre os hosts que você deseja ver. Para dicas, consulte Barra de filtros.
B. Visualizações salvas: ao criar uma visualização desejada (que pode incluir filtros e seleções personalizadas de gráficos e tabelas), clique em Save.
C. Opções de gráfico: você pode alternar para métricas diferentes para cada gráfico e clicar em ... para ver mais opções de gráfico, incluindo obter um link compartilhável e criar um alerta para essa métrica.
D. Agrupar por: Use para agrupar os resultados do gráfico por atributo específico. Por exemplo, você pode exibir as regiões da AWS com maior uso de CPU agrupadas por awsRegion.
E. Filtro de atributo: permite filtrar seus hosts para aqueles com um valor de atributo específico. Por exemplo,
F. Tabela de hosts: Por padrão, 25 hosts são selecionados para exibição. Use as colunas da tabela e o filtro atributo para explorar os hosts e selecionar diferentes hosts para exibição. Você pode exportar a tabela como CSV.
G. Detalhes do host: para um host específico na tabela de hosts, clique em ícone para ver mais opções para aprender sobre ele, incluindo opções para visualizar log, ver um mapa de entidades e muito mais.

Guias na página da interface do host

Veja mais detalhes sobre as guias disponíveis na página da interface Hosts :

Na página Hosts , a guia Summary oferece uma visão geral do desempenho dos seus hosts.

one.newrelic.com > All capabilities > Infrastructure

Os blocos na parte superior desta página fornecem uma visão geral de seus hosts, aplicativo, evento e alerta. Use esses blocos para ver mais detalhes sobre um host ou filtrar toda a página Summary para um host específico.

O seletor de hora na página Summary apenas ajusta os blocos métricos e gráficos, mas não ajusta a tabela hospedeira. As outras guias da interface Hosts possuem tabelas que refletem o intervalo de tempo definido pelo seletor de hora.

A guia System oferece uma visão geral do seu sistema. É um pouco semelhante à guia Summary , mas permite pesquisar detalhes mais detalhados sobre alguns aspectos do seu sistema.

one.newrelic.com > All capabilities > Infrastructure > Hosts > System

Aqui estão os gráficos padrão mostrados na página System :

CPU %: esta é uma métrica derivada de diversas outras métricas no evento SystemSample . Especificamente, o atributo cpuPercent é uma agregação de cpuUserPercent, cpuSystemPercent, cpuIoWaitPercent e cpuStealPercent.
Load average five minute: representa uma média do número de tarefas aguardando para trabalhar em um sistema nos últimos 5 minutos.
Memory free %: compara a quantidade de bytes de memória livres com a quantidade de bytes de memória usados.
Para obter detalhes sobre os dados usados para gerar esses gráficos, consulte SystemSample.

A página Network fornece visibilidade em tempo real da integridade e do desempenho de hosts individuais, servidores da Web ou outros grupos de recursos em sua rede. Os gráficos padrão mostram métricas de largura de banda por pacote, largura de banda por bytes e erros por segundo.

one.newrelic.com > All capabilities > Infrastructure > Hosts > Network

Detalhes sobre interfaces individuais podem ajudá-lo:

Examine os níveis de saturação em sua rede ou em hosts selecionados.
Compare equilíbrios de carga entre recursos específicos.
Identifique diferenças inesperadas nos padrões de capacidade entre hosts semelhantes.
Avalie os cinco principais erros de rede detectados.
Esses dados de rede em tempo real podem ajudá-lo a determinar se é necessário resolver erros reconfigurando sua rede, reequilibrando as cargas ou tomando outras ações de manutenção preventiva antes de precisar tomar uma decisão de compra.
Para obter detalhes sobre os dados usados para gerar esses gráficos, consulte NetworkSample.

Importante

Por padrão, o agente de infraestrutura não envia dados sobre os processos do sistema operacional, a menos que você use a instalação guiada. Para habilitar o envio do conjunto de dados do processo enable_process_metrics para true. Para ajustar quais processos você deseja monitor, configure include_matching_metrics ou exclude_matching_metrics.

Use a guia Processes para obter informações sobre processos em execução em seus hosts e para definir alertas sobre métricas de processos. A guia Processes mostra dados como porcentagem de CPU, bytes de E/S e uso de memória para processos individuais ou agrupamentos de processos.

one.newrelic.com > All capabilities > Infrastructure > Hosts > Processes

Na guia Processes , o percentual de CPU tem como escopo processos individuais, e não hosts. Por causa disso, a métrica percentual de CPU não leva em consideração os recursos de todo o sistema. Em vez disso, mostra quanto de um único núcleo de CPU cada processo está ocupando.

Para obter detalhes sobre os dados usados para gerar esses gráficos, consulte ProcessSample.

Aqui está um exemplo de como identificar um problema e definir um alerta:

Você percebe na página Hosts que um cluster tem uma porcentagem de CPU muito maior que o normal.
Você acessa a página Processes e filtra os processos desse cluster.
Você percebe que várias instâncias do mesmo processo apresentam porcentagem excessiva de CPU.
Depois de corrigir o problema, você decide criar uma condição do alerta que é acionada quando a porcentagem de CPU para esse tipo de processo excede um determinado limite.
Dica
Você não pode iniciar, parar ou reiniciar processos a partir da interface. Em vez disso, siga os procedimentos padrão para iniciar, parar, verificar ou reiniciar o agente de infraestrutura manualmente.

one.newrelic.com > All capabilities > Infrastructure > Hosts > Storage

A guia Storage permite monitor a capacidade e a eficiência dos seus recursos, incluindo a utilização geral dos seus dispositivos, o uso do disco ou as operações de E/S. Isso pode ajudá-lo a:

Examine padrões inesperados; por exemplo, um cluster de máquinas espelhadas que não processam tarefas de E/S de maneira uniforme.
Monitor os níveis de uso antes que o espaço em disco se esgote completamente.
Defina condição do alerta para notificá-lo sobre problemas com um ou mais hosts; por exemplo, longos tempos de processamento para operações de leitura ou gravação, disponibilidade ou utilização do disco com base em porcentagem ou bytes, etc.
Tome decisões informadas sobre onde redistribuir hosts com solicitações de processamento superiores ou inferiores ao normal.
Use dados para ajudar a planejar acréscimos ou alterações em seu orçamento de infraestrutura antes que surja uma emergência.
Para obter detalhes sobre os dados usados para gerar esses gráficos, consulte StorageSample.

Utilize a aba Containers para obter informações sobre o contêiner em execução nos seus hosts e para definir alerta sobre o contêiner métrico. Esta aba mostra dados como porcentagem de CPU, bytes de E/S e uso de memória para contêineres individuais ou agrupamentos de contêineres. Use essas informações para:

Identifique contêineres que estão enfrentando problemas de desempenho.
Crie para condições como porcentagem de CPU e uso de memória.
one.newrelic.com > All capabilities > Infrastructure > Hosts (New) > Containers

Dados de infraestrutura

Para saber mais sobre dados de infraestrutura, consulte dados de infraestrutura.

Esta tradução de máquina é fornecida para sua comodidade.

Dica

Um exemplo de caso de uso

Recurso de interface para explorar e analisar seus hosts

Guias na página da interface do host

Guia Resumo

Interface do sistema

Interface de rede

Interface de processos

Importante

Dica

Interface de armazenamento

Contêiner

Dados de infraestrutura

Esta tradução de máquina é fornecida para sua comodidade.

IU de hosts de infraestrutura

Dica

Um exemplo de caso de uso .css-21sua1{background:none;border:none;width:0;padding:0;}

Recurso de interface para explorar e analisar seus hosts

Guias na página da interface do host

Interface do sistema

Interface de rede

Interface de processos

Interface de armazenamento

Contêiner

Dados de infraestrutura

Um exemplo de caso de uso