Guia de dimensionamento e dimensionamento de gateway

É crucial alocar recursos suficientes ao gateway para manter sua confiabilidade e evitar perda de dados. Se o gateway cair, você corre o risco de perder dados de telemetria, o que pode afetar seus recursos de monitoramento e análise.

Este guia ajuda você a determinar os recursos apropriados para implantar e dimensionar o gateway Controle de Pipeline em seu ambiente. Compreender essas especificações é essencial para garantir desempenho ideal e processamento de dados eficiente.

Configuração padrão

Por padrão, o gateway é configurado com uma alocação de memória padrão de 2 GB e 1 vCPU por pod. Além disso, o cluster de gateway é configurado inicialmente durante a instalação com as seguintes configurações (elas podem ser modificadas após a configuração inicial do gateway):

minReplicas: 6 maxReplicas: 10 targetCPUUtilizationPercentage: 60

Escalando o gateway

O gateway de Controle de Pipeline deve manter capacidade computacional suficiente para processar a totalidade dos dados de telemetria que recebe. Considerando os tamanhos variáveis e as taxas de transferência de diferentes cargas de trabalho de agente e telemetria, recomendamos adotar uma abordagem em etapas para dimensionar seu cluster de gateway a fim de prever quanta capacidade você pode precisar:

Configure um pequeno conjunto (-15-35) de agentes não produtivos para enviar dados de telemetria para o gateway. Certifique-se de que esses agentes sejam representativos dos tipos de agente e carga de telemetria que você pretende enviar ao gateway em produção (por exemplo, New Rrelic infraestructura, Java APM e Fluent Bit). Anote o número de agentes de cada um.
Confirme se você está coletando esses dados de telemetria no New Relic.
Monitore o cluster de gateway para identificar o número de vCPUs e o uso médio da CPU ao longo de alguns minutos de carga. Isso lhe dará uma ideia de quantas vCPUs são necessárias para executar esse conjunto de agentes.
Extrapole linearmente com base no número de agentes que você configurou, no número de agentes que você espera executar no pico de produção e no uso da CPU na etapa 3. Por exemplo, se você estiver executando 25 Java de agentes APM por meio do gateway e estiver vendo apenas 1 vCPU sendo executado com 65% de carga, você deve esperar conseguir executar 200 Java de agentes APM com <= 8 vCPUs.
Configure um conjunto maior de agentes para enviar dados ao gateway (por exemplo, 100) e confirme se sua extrapolação linear na etapa 4 ainda é verdadeira.
Certifique-se de que seu maxReplicas seja grande o suficiente para dimensionar um pod suficiente para o número de agentes que você espera executar na produção.
Depois de configurar todo o agente de produção e dados de telemetria para enviar dados ao gateway, continue monitorando seu cluster de gateway para garantir que eles não estejam operando em ou além de 100% da capacidade.

Especificações de desempenho

Com um único núcleo de CPU e 100 regras de descarte por tipo MELT, o gateway pode processar os seguintes volumes de dados de telemetria:

Tipo de dados	Capacidade de processamento
Métrica	7.000 pontos de dados por segundo
Evento	4.500 eventos por segundo
Registro	2.700 logs por segundo
Traces	3.300 vãos por segundo

Capacidade de manuseio do agente

Um único pod de gateway pode manipular entre 15 e 35 agentes, com tamanhos de solicitação variando de 26 a 250 KB de dados não compactados por segundo.

A diagram representing gateway pod agent handling capacity.

Dica

Essas estimativas de capacidade são baseadas em medições de implantações existentes. Seus requisitos reais podem variar dependendo de seus padrões de dados específicos e necessidades de monitoramento.

Recomendações para configuração de gateway

Para aprimorar ainda mais o desempenho e a escalabilidade do seu gateway, considere as seguintes configurações de configuração com base no mapeamento do seu agente. Para acessar essas configurações, vá para New Relic Control > Gateway > Settings.

Réplicas mínimas e máximas

Réplicas mínimas: defina um número baseline de réplicas de gateway para acomodar cargas regulares de dados, garantindo redundância e confiabilidade. Isso ajuda a evitar perda de dados e mantém a estabilidade do desempenho durante períodos de pico. O valor mínimo recomendado é 2, que também é a configuração padrão.
Máximo de réplicas: determine o número máximo de réplicas necessárias para lidar com períodos de pico de uso de forma eficaz. Essa configuração permite que o cluster de gateway seja dimensionado dinamicamente, fornecendo recursos suficientes para alto tráfego sem comprometer o desempenho. Você pode configurar no máximo 15 réplicas.

Limite de utilização da CPU

Limite de dimensionamento: especifique a porcentagem de utilização da CPU na qual seu cluster de gateway será dimensionado automaticamente. Configurar um limite de dimensionamento garante um gerenciamento eficiente de recursos, evitando superlotação e mantendo o processamento de dados estável. A configuração padrão é 60%.

Gestão de saúde e desempenho

Reúna logs de diagnóstico: verifique regularmente os logs de diagnóstico do gateway para insights sobre a integridade e a operação do gateway. Os logs de monitoramento são essenciais para a resolução oportuna de problemas e para a manutenção do desempenho ideal. Por padrão, o log de diagnóstico está desativado.
Ignorar regras de gateway: em caso de recursos de CPU pouco disponíveis, ignore regras de gateway complexas. Essa precaução garante o fluxo contínuo de dados para o New Relic, mesmo que dados confidenciais sejam recebidos, permitindo a conservação de recursos e o processamento ininterrupto de telemetria. Por padrão, ignorar regras de gateway está desativado.

Próxima Etapa

Em seguida, você aprenderá como modificar a configuração do seu agente para enviar dados pelo gateway.

Esta tradução de máquina é fornecida para sua comodidade.