Te ofrecemos esta traducción automática para facilitar la lectura.
En caso de que haya discrepancias entre la versión en inglés y la versión traducida, se entiende que prevalece la versión en inglés. Visita esta página para obtener más información.
¡Agent Control y New Relic Control ahora están disponibles a nivel general para Kubernetes! El soporte para hosts Linux y hosts Windows también se encuentra en el programa de vista previa pública, de conformidad con nuestras políticas de versión preliminar.
Este documento cubre los pasos para solucionar problemas comunes al instalar u operar Agent Control. Está organizado por ambiente.
Solución de problemas de Kubernetes
Para diagnosticar errores durante el proceso de instalación, puede aumentar el nivel de logs del Agent Control agregando la siguiente configuración en su archivo values-newrelic.yaml :
agentControlDeployment:
chartValues:
config:
log:
level: trace
Nivel de logs predeterminado:info.
Otros niveles de log admitidos:debug y trace.
logs del recolector de OTel: para habilitar los logs de depuración en el recolector OpenTelemetry , agregue verboseLog: true.
Para inspeccionar los logs de Agent Control, ejecute el siguiente comando, reemplazando agent-control-*** con el nombre de su pod de Agent Control:
bash
$
# Find the Agent Control pod name
$
kubectl get pods -n newrelic-agent-control
$
$
# Inspect the logs, replacing `agent-control-***` with your pod's name
Agent Control expone un extremo de estado local que puede emplear para verificar el estado del Agent Control y su agente gestionado. Este extremo está habilitado de forma predeterminada en el puerto 51200. Siga estos pasos para consultar el estado del clúster:
Reenviar un puerto local al pod principal agent-control :
bash
$
kubectl port-forward <pod-name>51200:51200
Aplicar el estado del agente:
bash
$
curl localhost:51200/status
Cuando se instala el chart agent-control-bootstrap, se inicia un trabajo que instala todos los recursos y charts, y la instalación puede fallar con un error BackoffLimitExceeded:
El control del agente requiere una credencial de autenticación válida para conectarse de forma segura al control de flota. Inicialmente, esta credencial se genera automáticamente a través de la UI del agente Control de instalación y está representada por los campos identityClientId y identityClientSecret en el archivo de valores. Por razones de seguridad, la credencial necesaria para instalar Agente Control caduca luego de 12 horas.
Si la instalación falla con un error BackoffLimitExceeded, a menudo indica una credencial vencida o no válida.
Verifique los logs del trabajo de Kubernetes responsable de configurar la identidad del sistema de Agent Control.
Luego de revisar los logs, vuelva a intentar la instalación usando Helm mientras observa si hay mensajes de error específicos y verifica los logs para detectar posibles problemas. A continuación se presentan algunos problemas conocidos y cómo interpretarlos:
Identidad de cliente no válida:Error getting system identity auth token. The API endpoint returned 404: Failed to find Identity: <identityClientId-value>
Identidad no válidaClientSecret:Error getting system identity auth token. The API endpoint returned 400: Bad client secret.
Identidad expirada:Error getting system identity auth token. The API endpoint returned 400: Expired client secret.
Faltan las licencias requeridas:Failed to create a New Relic System Identity for Fleet Control communication authentication. Please verify that your User Key is valid and that your Account Organization has the necessary permissions to create a System Identity: Exception while fetching data (/create) : Not authorized to perform this action or the entity is not found.
Si ve un mensaje de error como el que se muestra a continuación en los logs del del OpenTelemetry recopilador de pod, es posible que indique una New Relic clave de licencia de no válida. Esto impide que el recolector pueda exportar telemetry data a New Relic:
bash
2024-06-13T13:46:05.898Z error exporterhelper/retry_sender.go:126 Exporting failed. The error is not retryable. Dropping data. {"kind": "exporter", "data_type": "metrics", "name": "otlphttp/newrelic", "error": "Permanent error: error exporting items, request to https://otlp.nr-dat ││ go.opentelemetry.io/collector/exporter/exporterhelper.(*retrySender).send
Solución
Confirme que está empleando una clave de licencia de New Relic válida en su configuración.
Si no se crean los pods de un agente gestionado, puede haber un problema con su HelmRelease.
Compruebe el estado de la versión de Helm:
bash
$
kubectl get helmrelease open-telemetry -n newrelic
Un lanzamiento exitoso y saludable debe mostrar READY: True y STATUS: InstallSucceeded.
Si la liberación falló, los campos STATUS y READY indicarán el problema. Dependiendo del tipo de error, es posible que el problema raíz no se refleje completamente en el campo de estado. Para obtener más detalles, emplee kubectl para describir el recurso HelmRelease:
Si se cancela el comando helm delete mientras se ejecuta, el desinstalador del job continuará funcionando, eliminando los charts y los recursos, pero el secreto de helm agent-control-bootstrap podría seguir existiendo. En ese caso, no podrá actualizar ni instalar el chart, obteniendo el error:
Error: UPGRADE FAILED: "agent-control-bootstrap" has no deployed releases
Ejecutar la desinstalación nuevamente no funcionará, los logs del trabajo de desinstalación mostrarán un error como:
Error: uninstall: Release not loaded: agent-control-cd: release: not found
Solución
Elimine todos los secretos de Helm de su lanzamiento (cambie agent-control-bootstrap por el nombre de su lanzamiento si se cambió):
La herramienta de diagnóstico New Relic NRDiag es una utilidad que recopila recursos y logs relacionados con el control del agente en su clúster para la depuración. Siga estos pasos para recopilar todos los datos:
El resultado esperado debería parecer al siguiente reporte:
bash
Check Results
-------------------------------------------------
Info K8s/Flux/Charts [Successfully collected Flux Helm Charts]
Info K8s/Resources/Config [Successfully collected K8s configMaps ]
Info K8s/AgentControl/agent-control-status-server [Successfully collected K8s agent-control status se...]
Info K8s/Resources/Daemonset [Successfully collected K8s newrelic-infrastructure...]
Info K8s/Resources/Pods [Successfully collected K8s newrelic-infrastructure...]
Info K8s/Flux/Repositories [Successfully collected Flux Helm Repositories]
Info K8s/AgentControl/helm-controller-logs [Successfully collected K8s agent-control helm-cont...]
Info K8s/Env/Version [kubectl version output successfully collected]
Info K8s/Resources/Deploy [Successfully collected K8s newrelic-infrastructure...]
Info K8s/Helm/Releases [Successfully collected the list of helm releases]
Info K8s/AgentControl/agent-control-logs [Successfully collected K8s agent-control agent-con...]
Info K8s/Flux/Releases [Successfully collected Flux Helm Releases]
Info K8s/AgentControl/source-controller-logs [Successfully collected K8s agent-control source-co...]
See nrdiag-output.json for full results.
Todos los logs y recursos relacionados con Agent Control se guardan en el archivo nrdiag_output.zip en el directorio actual. Puede analizar el contenido del archivo zip o abrir un ticket de soporte con el soporte de New Relic para obtener asistencia adicional.
Solución de problemas de hosts Linux
Si recibe el mensaje de error Installing agent-control (Unsupported), consulte los requisitos del sistema y asegúrese de ejecutar una versión de sistema operativo compatible.
Si ve Installing agent-control (Failed), siga estos pasos:
Revise los logs proporcionados con el script de instalación:
Si ve Error creating an identity, asegúrese de que su clave de usuario pertenezca a un usuario de la plataforma con el rol de Administrador de todo el producto.
Verifique el estado del servicio newrelic-agent-control:
bash
$
sudo systemctl status newrelic-agent-control
Si el servicio aparece en estado failed o stopped, esto significa que el agente se instaló pero hay un problema que impide su funcionamiento normal. Verifique los logs de los servicios del agente utilizando journalctl (o cualquier herramienta de Linux similar):
bash
$
journalctl -u newrelic-agent-control
Si no hay información disponible, consulta cómo ejecutar el agente en modo de depuración para acceder a logs detallados que expliquen por qué no se puede iniciar el servicio.
Si el servicio no está instalado, intente agregar --debug al final del comando de instalación de la CLI de la instalación guiada y vuelva a ejecutarlo. Esto habilita el logging detallado para el script de instalación y puede proporcionar contexto adicional que explique el error.
Opcionalmente, responda yes cuando se le solicite enviar logs a New Relic para ayudar a solucionar problemas de la instalación. Una vez enviados, se puede acceder a los logs con la siguiente consulta NRQL:
SELECT*FROM Log WHERE hostname =`your-host-name`
Para acceder a los logs, primero necesitará habilitar el logging del agente siguiendo estos pasos:
Para habilitar el logging en un archivo, utilice la opción log en el archivo de configuración de Agent Control:
# Fleet Control connection settings
#fleet_control:
# managed agents settings
#agents:
# agent logging settings
log:
level: debug
file:
enable:true
# Add a custom path if needed, default path: /var/log/newrelic-agent-control/agent-control.log
# path: "/path/to/agent-control.log"
# Optional formatting settings
format:
# Include the target module (disabled by default for better readability)
target:true
# Custom timestamp format "%Y-%m-%dT%H:%M:%S"
timestamp:"%Y"
Los valores posibles del nivel de log son:
trace
debug
info (por defecto)
warning
error
Los logs del agente de infraestructura subyacente y/o del recopilador de OpenTelemetry se incluyen cuando el nivel es debug o trace.
Si el log file está habilitado, verifique el archivo local correspondiente según la configuración path. O utilice su herramienta preferida de solución de problemas de logs, como journalctl -u new-relic-agent-control.
Para acceder a los detalles del estado de salud, primero deberá habilitar el servidor local siguiendo estos pasos:
"last_error":"process exited with code: exit status: 1"
}
}
}
Agent Control realiza ciertas validaciones antes de recibir y aplicar la configuración remota de Fleet Control. Además, las configuraciones pueden tener un formato válido (por ejemplo, una estructura .yaml válida) pero incluir valores inesperados para ciertos ajustes (por ejemplo, un string cuando se espera un integer). La siguiente tabla muestra errores comunes para los diferentes agentes admitidos:
Tipo de agente
Error
Notas de solución de problemas
(Todos los agentes)
Error al aplicar la configuración remota: no se pudo resolver la configuración
Revise su formato de configuración. La configuración podría no ser un archivo .yaml válido, o podrían faltar campos obligatorios.
(Todos los agentes)
Configuración no válida: valores restringidos detectados
Revise el contenido de su configuración. Es posible que la configuración específica no esté disponible para el tipo de agente de destino según la política de seguridad.
(Todos los agentes)
exit code 1
Revise su configuración. Valores inesperados hacen que el agente salga con un error inesperado.
Agente de infraestructura
exit code 1
Revise su configuración. Valores inesperados están causando que el agente de infraestructura salga con una configuración inesperada. Revise la configuración admitida.
Solución de problemas de hosts de Windows
Si Agent Control no se está ejecutando o no está en buen estado, siga estos pasos de diagnóstico en orden:
1. Verificar el estado del servicio:
Get-Service-Name newrelic-agent-control
Se esperaba: Status : Running. Si está detenido o falta, proceda al paso 2.
2. Revise los logs del servicio:
Vea el archivo de log más reciente (los archivos de log incluyen sufijos de fecha como newrelic-agent-control.log.2026-02-09-11):
Configuración de logging de archivo: Agent Control requiere una configuración explícita para habilitar el log de archivo. Si no existen archivos de log, agregue esto a su local_config.yaml:
log:
file:
enabled:true
Luego, reinicie el servicio para que aparezcan los logs.
3. Pruebe la ejecución manual:
Ejecute Agent Control desde la línea de comandos para evitar problemas específicos del servicio:
cd "C:\Program Files\New Relic\newrelic-agent-control"
Si se ejecuta correctamente desde la línea de comandos pero no como servicio, esto indica problemas de antivirus o de permisos.
4. Verificar el tipo de flota:
Asegúrese de que la flota sea de tipo "Host - Windows". Usar "Host - Linux" provocará fallas. Verifique en la IU de Fleet Control en los detalles de la flota.
5. Verifique si hay conflictos de puertos:
Agent Control utiliza el puerto 51200 para su endpoint de salud:
netstat -ano | findstr :51200
Si otro proceso está utilizando este puerto, identifíquelo: