Ahora que comprende el alcance completo de su interrupción y el grupo de errores, puede asignar el error y actualizar su estado. Cuando asignas errores dentro de New Relic, puedes transferir toda la información que has recopilado a los propietarios del código. Administrar su Errors Inbox facilita el trabajo en varios equipos. Cuando el proceso es sencillo, implementar una resolución se vuelve rápido y eficiente.
Objetivos
Este tutorial le guiará en la gestión de sus errores para que pueda implementar correcciones más rápido:
- Aprenda a asignar errores a los equipos correctos
- Actualiza el estado de tus errores
Gestiona tus grupos de errores
Asignar el error al equipo correcto
Desde la página Error group summary , puede asignar el grupo de error al equipo correcto.
Asignar un error a una persona o equipo elimina posibles errores de comunicación. La información que le ayudó a resolver el error se entrega directamente al propietario del código, lo que le permite continuar donde lo dejó.
Luego, la tarea se entrega al equipo por correo electrónico:
Marcar el estado del error
Una vez asignado, puede actualizar el estado de un error.
Esta funcionalidad tiene algunos beneficios diferentes:
Si se espera un grupo de errores, puede marcar el error como
Ignored
. Los errores esperados son conocidos por usted y el equipo; pueden ser errores no críticos o pueden ser errores asociados con el usuario final (como alguien que usa una contraseña incorrecta).
Sin embargo, recomendamos resolver el error esperado tanto como sea posible. Ignorar un grupo de errores no impide que New Relic informe el error en el futuro, lo que contribuye a la ingesta de datos.
New Relic rastrea el estado de un error a lo largo del tiempo. Por ejemplo, si marca un grupo de error como
Resolved
pero aparece en un momento posterior con un nuevo despliegue, New Relic marcará ese error como
Regression
.
Investigar la causa raíz
Ya sea que esté reduciendo errores comunes o reaccionando a una interrupción crítica, está siguiendo datos que lo llevan a la causa directa de un error. Es posible que haya reparado la tubería con fugas que inundó su jardín, pero no ha descubierto qué causó la grieta en primer lugar.
Cuando asigna grupos de errores a equipos, es más fácil realizar retrospectivas en las que todos identifiquen qué procesos llevaron a una interrupción. Para volver a su tubería rota: se reúne con un plomero y le dice que los árboles en su jardín están creciendo en todas sus tuberías. Las retrospectivas en las que todos pueden ver los mismos datos conducen naturalmente a mejoras en el flujo de trabajo general de su equipo.
Estas son algunas de las causas fundamentales comunes de las interrupciones del servicio:
Pruebas de aseguramiento inadecuadas en pre-entorno de producción.
No probar cada función o método dentro de una base de código para garantizar que los resultados sean los esperados.
No entender los requisitos de dependencia ascendente, la capacidad o sus limitaciones. Por ejemplo, si una consulta de la base de datos funciona muy bien en preproducción con cargas más pequeñas, pero bajo estrés comienza a ralentizarse.
Falta de planificación de capacidad. Tal vez su código pase todas sus pruebas habituales bajo cargas normales, pero cuando la demanda alcanza su punto máximo, no funciona.
La causa raíz puede ser tan variable como la cantidad de equipos que existen. Sin embargo, la conclusión es seguir los datos, comunicarse y profundizar más allá de la causa directa.
¿Que sigue?
¡Felicidades! Ha aprendido a utilizar Errors Inbox para rastrear errores críticos en sus aplicaciones. En esta serie de tutoriales, aprendiste:
- Cómo discernir el servicio para empezar y priorizar sus grupos de error
- Cómo utilizar rastreo del stack y log para determinar la naturaleza de un error
- Cómo asignar grupos de errores a diferentes equipos
Ahora que ha aprendido a utilizar Errors Inbox para diagnosticar y resolver errores, puede explorar nuestros otros tutoriales:
- ¿Está interesado en obtener más información sobre Errors Inbox? Consulte nuestro documentoErrors Inbox para conocer algunas de las mejores prácticas.
- Si está buscando resolver incidentes en su infraestructura, consulte nuestro tutorial sobre resolución de problemas de datos del host.
- ¿Tu aplicación es lenta? Consulta nuestro tutorial sobre resolución de problemas de comportamiento lento de aplicaciones.