O Agent Control e o New Relic Control agora estão disponíveis para o público geral para Kubernetes! O suporte para hosts Linux e hosts Windows também está no programa de public preview, em conformidade com nossas políticas de pré-lançamento.
Este documento aborda as etapas para solucionar problemas comuns ao instalar ou operar o Agent Control. É organizado por ambiente.
Solução de problemas do Kubernetes
Para diagnosticar erros durante o processo de instalação, você pode aumentar o nível de log do Agent Control adicionando a seguinte configuração no seu arquivo values-newrelic.yaml :
agentControlDeployment:
chartValues:
config:
log:
level: trace
Nível de log padrão:info.
Outros níveis de log suportados:debug e trace.
Logs do coletor OTel: para habilitar logs de depuração no coletor OpenTelemetry, adicione verboseLog: true.
Para inspecionar os logs do Agent Control, execute o seguinte comando, substituindo agent-control-*** pelo nome do seu pod do Agent Control:
bash
$
# Find the Agent Control pod name
$
kubectl get pods -n newrelic-agent-control
$
$
# Inspect the logs, replacing `agent-control-***` with your pod's name
O Agent Control expõe um endpoint de status local que você pode usar para verificar a integridade do Agent Control e seu agente gerenciado. Este endpoint é habilitado por padrão na porta 51200. Siga estes passos para consultar o status cluster :
Encaminhe uma porta local para o pod principal agent-control :
bash
$
kubectl port-forward <pod-name>51200:51200
Solicitar o status do agente:
bash
$
curl localhost:51200/status
Quando o chart agent-control-bootstrap é instalado, um job é lançado para instalar todos os recursos e charts, e a instalação pode falhar com um erro BackoffLimitExceeded:
O agente Control requer uma credencial de autenticação válida para se conectar com segurança ao Controle de Agentes. Inicialmente, essa credencial é gerada automaticamente através da interface de instalação do agente Control e é representada pelos campos identityClientId e identityClientSecret no arquivo de valores. Por motivos de segurança, a credencial necessária para instalar o Agente Control expira após 12 horas.
Se a instalação falhar com um erro BackoffLimitExceeded, isso geralmente indica uma credencial expirada ou inválida.
Verifique os logs do trabalho Kubernetes responsável por configurar a identidade do sistema de Agent Control.
Após revisar os logs, tente instalar novamente usando Helm enquanto observa mensagens de erro específicas e verifica os logs em busca de possíveis problemas. Abaixo estão alguns problemas conhecidos e como interpretá-los:
IdentityClientId inválido:Error getting system identity auth token. The API endpoint returned 404: Failed to find Identity: <identityClientId-value>
IdentityClientSecret inválido:Error getting system identity auth token. The API endpoint returned 400: Bad client secret.
Identidade expirada:Error getting system identity auth token. The API endpoint returned 400: Expired client secret.
Permissões necessárias ausentes:Failed to create a New Relic System Identity for Fleet Control communication authentication. Please verify that your User Key is valid and that your Account Organization has the necessary permissions to create a System Identity: Exception while fetching data (/create) : Not authorized to perform this action or the entity is not found.
Se você vir uma mensagem de erro como a abaixo nos logs do pod de implantação do coletor OpenTelemetry, isso pode indicar uma chave de licença do New Relic inválida. Isso impede que o coletor consiga exportar dados de telemetria para o New Relic:
bash
2024-06-13T13:46:05.898Z error exporterhelper/retry_sender.go:126 Exporting failed. The error is not retryable. Dropping data. {"kind": "exporter", "data_type": "metrics", "name": "otlphttp/newrelic", "error": "Permanent error: error exporting items, request to https://otlp.nr-dat ││ go.opentelemetry.io/collector/exporter/exporterhelper.(*retrySender).send
Solução
Confirme se você está usando uma chave de licença válida do New Relic em sua configuração.
Se o pod de um agente gerenciado não estiver sendo criado, pode haver um problema com seu HelmRelease.
Verifique o status da versão do Helm:
bash
$
kubectl get helmrelease open-telemetry -n newrelic
Uma versão bem-sucedida e saudável deve mostrar READY: True e STATUS: InstallSucceeded.
Se a liberação falhar, os campos STATUS e READY indicarão o problema. Dependendo do tipo de erro, o problema raiz pode não ser totalmente refletido no campo de status. Para obter mais detalhes, use kubectl para descrever o recurso HelmRelease:
Se o comando helm delete for cancelado durante a execução, o job de desinstalação continuará funcionando, excluindo os charts e recursos, mas o segredo helm agent-control-bootstrap ainda poderá existir. Nesse caso, você não conseguirá atualizar ou instalar o chart, recebendo o erro:
Error: UPGRADE FAILED: "agent-control-bootstrap" has no deployed releases
Executar a desinstalação novamente não funcionará, os logs do job de desinstalação exibirão um erro como:
Error: uninstall: Release not loaded: agent-control-cd: release: not found
Solução
Exclua todos os segredos do Helm da sua release (substitua agent-control-bootstrap pelo nome da sua release, caso tenha sido alterado):
Em seguida, você pode realizar a instalação novamente.
A ferramenta de diagnóstico New Relic NRDiag é um utilitário que reúne recursos e logs relacionados ao agente-control no seu cluster para depuração. Siga estas etapas para reunir todos os dados:
A saída esperada deve ser semelhante ao seguinte relatório:
bash
Check Results
-------------------------------------------------
Info K8s/Flux/Charts [Successfully collected Flux Helm Charts]
Info K8s/Resources/Config [Successfully collected K8s configMaps ]
Info K8s/AgentControl/agent-control-status-server [Successfully collected K8s agent-control status se...]
Info K8s/Resources/Daemonset [Successfully collected K8s newrelic-infrastructure...]
Info K8s/Resources/Pods [Successfully collected K8s newrelic-infrastructure...]
Info K8s/Flux/Repositories [Successfully collected Flux Helm Repositories]
Info K8s/AgentControl/helm-controller-logs [Successfully collected K8s agent-control helm-cont...]
Info K8s/Env/Version [kubectl version output successfully collected]
Info K8s/Resources/Deploy [Successfully collected K8s newrelic-infrastructure...]
Info K8s/Helm/Releases [Successfully collected the list of helm releases]
Info K8s/AgentControl/agent-control-logs [Successfully collected K8s agent-control agent-con...]
Info K8s/Flux/Releases [Successfully collected Flux Helm Releases]
Info K8s/AgentControl/source-controller-logs [Successfully collected K8s agent-control source-co...]
See nrdiag-output.json for full results.
Todos os logs e recursos relacionados ao Agent Control são salvos no arquivo nrdiag_output.zip no diretório atual. Você pode analisar o conteúdo do arquivo zip ou abrir um ticket de suporte com o suporte da New Relic para obter assistência adicional.
Solução de problemas de hosts Linux
Se você receber a mensagem de erro Installing agent-control (Unsupported), verifique os requisitos do sistema e certifique-se de que está executando uma versão de sistema operacional suportada.
Se você vir Installing agent-control (Failed), siga estas etapas:
Verifique os logs fornecidos com o script de instalação:
Se você vir Error creating an identity, certifique-se de que sua chave de usuário pertença a um usuário da plataforma com a função Admin de todos os produtos.
Verifique o status do serviço newrelic-agent-control:
bash
$
sudo systemctl status newrelic-agent-control
Se o serviço aparecer no estado failed ou stopped, isso significa que o agente foi instalado, mas há um problema impedindo seu funcionamento normal. Verifique os logs dos serviços do agente usando journalctl (ou qualquer ferramenta Linux similar):
bash
$
journalctl -u newrelic-agent-control
Se não houver insights disponíveis, verifique como executar o agente no modo de depuração para acessar logs detalhados explicando por que o serviço não pode ser iniciado.
Se o serviço não estiver instalado, tente adicionar --debug ao final do comando de instalação da CLI da instalação guiada e execute-o novamente. Isso habilita o log detalhado para o script de instalação e pode fornecer contexto adicional explicando o erro.
Opcionalmente, responda yes quando solicitado a enviar logs para a New Relic para ajudar a solucionar problemas na instalação. Uma vez enviados, os logs podem ser acessados com a seguinte consulta NRQL:
SELECT*FROM Log WHERE hostname =`your-host-name`
Para acessar os logs, você precisará primeiro ativar o log do agente seguindo estas etapas:
Para habilitar o logging em um arquivo, use a configuração log no arquivo de configuração do Agent Control:
# Fleet Control connection settings
#fleet_control:
# managed agents settings
#agents:
# agent logging settings
log:
level: debug
file:
enable:true
# Add a custom path if needed, default path: /var/log/newrelic-agent-control/agent-control.log
# path: "/path/to/agent-control.log"
# Optional formatting settings
format:
# Include the target module (disabled by default for better readability)
target:true
# Custom timestamp format "%Y-%m-%dT%H:%M:%S"
timestamp:"%Y"
Os valores possíveis para o nível de log são:
trace
debug
info (padrão)
warning
error
Logs do agente de infraestrutura subjacente e/ou do coletor OpenTelemetry são incluídos quando o nível é debug ou trace.
Se o log file estiver habilitado, verifique o arquivo local correspondente com base na configuração path. Ou use sua ferramenta de solução de problemas de log preferida, como journalctl -u new-relic-agent-control.
Para acessar os detalhes do status de integridade, você precisará primeiro habilitar o servidor local seguindo estas etapas:
"last_error":"process exited with code: exit status: 1"
}
}
}
O Agent Control realiza certas validações antes de receber e aplicar a configuração remota do Fleet Control. Além disso, as configurações podem ter um formato válido (por exemplo, estrutura .yaml válida), mas incluir valores inesperados para certas configurações (por exemplo, um string quando um integer é esperado). A tabela a seguir mostra erros comuns para os diferentes agentes suportados:
Tipo de agente
Erro
Notas de solução de problemas
(Todos os agentes)
Erro ao aplicar configuração remota: não foi possível resolver a configuração
Revise o formato de sua configuração. A configuração pode não ser um arquivo .yaml válido, ou campos obrigatórios podem estar ausentes.
Revise o conteúdo da sua configuração. Configurações específicas podem não estar disponíveis para o tipo de agente de destino com base na política de segurança.
(Todos os agentes)
exit code 1
Revise sua configuração. Valores inesperados estão fazendo com que o agente seja encerrado com um erro inesperado.
Agente de infraestrutura
exit code 1
Revise sua configuração. Valores inesperados estão fazendo com que o agente de infraestrutura encerre com uma configuração inesperada. Verifique as configurações suportadas.
Solução de problemas de hosts Windows
Se o Agent Control não estiver em execução ou íntegro, siga estas etapas de diagnóstico na ordem:
1. Verifique o status do serviço:
Get-Service-Name newrelic-agent-control
Esperado: Status : Running. Se estiver parado ou ausente, siga para a etapa 2.
2. Verifique os logs do serviço:
Visualize o arquivo de log mais recente (arquivos de log incluem sufixos de data como newrelic-agent-control.log.2026-02-09-11):
Configuração de log de arquivo: O Agent Control requer configuração explícita para habilitar o log de arquivo. Se não houver arquivos de log, adicione isto ao seu local_config.yaml:
log:
file:
enabled:true
Em seguida, reinicie o serviço para que os logs apareçam.
3. Teste a execução manual:
Execute o Agent Control a partir da linha de comando para contornar problemas específicos do serviço:
cd "C:\Program Files\New Relic\newrelic-agent-control"