• /
  • EnglishEspañol日本語한국어Português
  • Inicia sesiónComenzar ahora

Te ofrecemos esta traducción automática para facilitar la lectura.

En caso de que haya discrepancias entre la versión en inglés y la versión traducida, se entiende que prevalece la versión en inglés. Visita esta página para obtener más información.

Crea una propuesta

Responder a cortes con rastreo de errores

Es probable que se produzcan errores. Incluso con una herramienta de observabilidad, encontrar el origen de un error no es tan sencillo como podría suponer. Piense en un jardín inundado. Observa que el agua fluye cerca de su manguera, pero la causa de la inundación es en realidad una grieta en algún lugar de la tubería de agua. Si supusiera que la manguera con fugas causó la inundación, terminaría con una manguera fija pero con el césped arruinado: un error costoso.

El análisis de errores lo lleva al origen del problema para que pueda solucionarlo antes de que ocurra la inundación. Cuando un equipo realiza un nuevo despliegue o un servicio falla en sentido ascendente, es necesario profundizar más antes de implementar cualquier solución. No hay lugar para suposiciones en el análisis de errores.

Objetivos

Esta serie de tutoriales le muestra cómo resolver errores críticos y luego lo guía para reducir el recuento general de errores. Este documento cubre cómo navegar por nuestra característica Errors Inbox , incluido cómo:

  • Elija un servicio para comenzar el análisis de errores
  • Elija un grupo de errores que indique una interrupción

Requisitos previos

Para monitor el rendimiento de su aplicación, utilizará un agente creado específicamente para el idioma de su aplicación. Al hacer clic en un logotipo, accederá a un instalador guiado en la UI de New Relic, donde se le guiará durante la instalación y configuración del agente.

Go agent
Java agent
.NET agent
Node.js agent
PHP agent
Python agent
Ruby agent

Una vez que haya instalado un agente, vaya a one.newrelic.com y seleccione su aplicación. Si todavía no ve muchos datos, aléjese por un momento y deje que el agente recopile datos en tiempo real mientras se ejecuta su aplicación. Este tutorial también supone que está familiarizado con , incluso si aún no ha creado su primera alerta.

Detecte y rastree errores en su aplicación

Ahora que sus aplicaciones están instrumentadas, New Relic está capturando datos sobre sus servicios. Esto incluye datos sobre ocurrencias de errores en su aplicación.

Piensa en el usuario final

Alerta te avisa que existe un problema: es el agua de tu césped. Pero alerta no le proporcionará todo el contexto. Ahí es donde entra en juego la Errors Inbox .

Imagine que es responsable de algunas aplicaciones en un sitio de comercio electrónico. Ha recibido dos alertas para dos componentes, una para pagar y otra para buscar inventario. Solo recibe informes de que la función de búsqueda falla para el usuario final, pero el componente de pago funciona bien. Quizás crea que la función de verificación es más importante, pero es fundamental separar sus creencias de sus prácticas de observabilidad.

Esta práctica se aplica incluso si el usuario final no ha informado nada. Cuando notes que los servicios fallan, puedes hacerte estas preguntas:

  • ¿Es la experiencia del usuario final un problema?
  • ¿Cómo debería ser su experiencia?
  • ¿Qué comportamiento están experimentando actualmente?

Determinar qué servicios están reportando errores

Veamos cómo podría verse esto en la práctica. Cuando ve la página All entities , observa que cuatro servicios están emitiendo alertas.

A screenshot showing an app with many errors

Después de hacerse las preguntas del paso uno, sabrá que:

  • El usuario final tiene dificultades con las acciones de compra.

  • Su sitio solo debe mostrar artículos en stock.

  • Su sitio muestra todos los productos, por lo que los clientes pueden comprar artículos agotados.

    Ha identificado que api-gateway es una dependencia crítica para su inventario. Aquí es donde comenzará su análisis de errores.

Localiza lo que cambió

Tiene su punto de entrada a su sistema, por lo que ahora puede investigar los errores que afectan su aplicación. En la página de resumen api-gateway , haga clic en la pestaña Errors debajo de Triage. Su página de errores filtra sus datos a una vista de solo errores.

A screenshot showing an app with many errors

Hay al menos seis grupos de errores que se informan en api-gateway. Los grupos de errores aparecen entre una docena y miles de veces en su aplicación.

Al principio, esto parece carecer de granularidad, pero su serie temporal le brinda suficiente información para señalar lo que cambió con el tiempo. Desglosaremos esto:

  • Basándose únicamente en el número de apariciones, su primer instinto podría indicarle que comience con ActivemModel:::ValidationError , ya que tiene 4000 apariciones. Sin embargo, si nos fijamos en la serie temporal, sus picos y valles son relativamente consistentes. Este podría ser un error esperado, pero veamos los otros cinco.
  • El grupo de errores Net::OpenTimeOut tiene un patrón similar y, en realidad, constituye cuatro de los seis grupos de informes. En cada grupo de errores, puede ver picos y valles consistentes que se extienden antes del incidente. Con el mismo nombre y patrones similares, podemos inferir que este también es un error esperado.
  • Nuestra última opción es JsonapiClient:::Notfound. Al igual que ActivemModel:::ValidationError, tiene una forma distinta y genera informes de forma constante. Si bien no tiene muchas ocurrencias, la serie temporal es lo suficientemente anómala como para que valga la pena profundizar un poco más.

Ajustar la serie temporal

Para estar seguro, ajuste el parámetro de tiempo para mostrar patrones de las últimas 12 horas:

A screenshot showing an app with many errors

Con el ajuste, verá que ActivemModel:::ValidationErrortiene un patrón invariable de picos y valles, pero su JsonapiClient:::Notfound aumentó dramáticamente en la última hora. Este es un buen punto de partida.

Saber cuándo sucedió algo es una pieza fundamental para acercarse a la fuente. Al tener una comprensión completa del espacio del problema, ahora puede profundizar en la fuente.

Próximo paso

Una vez que haya seleccionado sus grupos de errores, la página de resumen de errores muestra datos de atributos sobre fallas en su sistema.

Copyright © 2024 New Relic Inc.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.