A observabilidade dos dados fornece insights importantes sobre os detalhes dos seus serviços quando eles relatam os dados corretos. Coisas como distributed tracing e instrumentação de script permitem que as equipes coletem rapidamente dados de telemetria detalhados. Infelizmente, as equipes de operações geralmente não estão na melhor posição para avaliar a qualidade da telemetria que obtêm, o que pode resultar em excesso de dados, o que atrasa a capacidade de resolver problemas no seu sistema.
Revelar indevidamente os serviços dos instrumentos ao usuário coloca a satisfação dos clientes em risco, pois as equipes lançam novos recursos da base de código sem conhecer as ligações entre a entrega de software e os programas de observabilidade. O planejamento de instrumentação de serviço é a abordagem usada para descrever um único tempo de execução de serviço por meio de telemetria, e este guia foca na métrica do código da sua aplicação, bem como em medições externas por meio de testes Sintético.
Você é um bom candidato para usar este guia se alguma das seguintes situações for verdadeira:
- Suas equipes de desenvolvimento estão desconectadas do design de observabilidade da produção.
- Você tem novos serviços/recursos que são executados na produção e antes de estabelecer totalmente a telemetria e os alertas.
- Você precisa fornecer contexto de negócios adicional à sua instrumentação para melhorar o diagnóstico e a medição de KPI de negócios.
- Você emprega uma framework de software altamente personalizada ou proprietária.
- Seu serviço está em desenvolvimento ativo. serviços legados e serviços construídos a partir de plataformas comerciais prontas para uso tendem a ser melhor atendidos com opções de instrumentação genérica.
Entenda os benefícios
Certificar-se de que você está capturando os dados corretos pode ajudar seus desenvolvedores a se envolverem mais no processo de correção de problemas quando eles surgirem, fornecendo-lhes dados de serviço relevantes com mais eficiência. Isso irá:
- Melhorar a resolução de problemas:
- Uma boa nomenclatura de telemetria oferece à equipe de operações uma linguagem comum para usar com os desenvolvedores durante incidentes, reduzindo o tempo de triagem e correção de problemas.
- A telemetria mais precisa e contextualmente relevante do seu serviço permite uma detecção mais precisa de falhas nas quais você pode tomar medidas.
- Tomar decisões de desenvolvimento mais bem informadas:
- Detectar áreas de volatilidade ou comportamento inesperado e abordá-las.
- Entender quais dependências em seu código faltam redundância e tomar medidas para melhorar o serviço.
- Apreciando como o usuário final está utilizando seu software. Você pode entender melhor onde as melhorias terão o maior impacto.
Utilize os principais indicadores de desempenho
É importante conhecer alguns KPIs simples para acompanhar as melhorias contínuas em seus programas de entrega e operações de software. Aqui estão dois tipos principais de KPIs a serem considerados ao melhorar a instrumentação:
Business KPIs
estão alinhados aos objetivos gerais do programa e devem ser medidos de forma consistente para demonstrar melhorias contínuas para cada serviço. Os KPIs de negócios incluem:
Practitioner KPIs
são usados para medir mudanças na execução de funções de trabalho para aqueles que participam no desenvolvimento e gestão de serviços. Os KPIs do praticante incluem:
Pré-requisitos
À medida que você segue as etapas do guia, mantenha os seguintes recursos de documentação à mão:
Instalação e configuração do agente APM
Guias de instrumentação:
Próximos passos
Escolha um dos guias abaixo com base nos dados que você deseja capturar: