A cobertura tag criticidade APM garante que seus aplicativos sejam rotulados corretamente com níveis de criticidade de negócios, ajudando você a priorizar esforços de monitoramento, responder a incidentes e alocar recursos com base no impacto nos negócios.
Sobre esta regra do scorecard
Esta regra de cobertura tag de criticidade APM faz parte do Nível 2 (Proativo) no modelo de maturidade de tempo de operação do negócio. Ele avalia se seu aplicativo APM tem tags de criticidade que indicam sua importância para as operações comerciais.
Por que isso é importante: a tag de criticidade ajuda as equipes a entender quais sistemas exigem atenção imediata durante incidentes e quais podem tolerar tempos de resolução mais longos. Isso permite uma alocação de recursos mais eficaz e garante que funções críticas de negócios recebam cobertura de monitoramento adequada.
Descrição
A pontuação é baseada na varredura de entidade mais recente e falha se a entidade de destino não tiver um valor para sua tag de “criticidade”.
Interpretação
Uma pontuação baixa nesta regra pode indicar que sua organização não implementou completamente os metadados ou convenções semânticas para seu sistema. A tag de criticidade é crucial para melhorar a clareza organizacional dentro da plataforma de observabilidade, ajudando a distinguir entre diferentes contextos operacionais para fins comerciais críticos de missão, de impacto ao cliente, internos ou de conformidade. Ter um padrão para identificação da criticidade do negócio permitirá que você desenvolva processos de alerta, SLI ou melhoria contínua que concentrem a atenção e os recursos nos sistemas mais importantes.
Compreendendo os níveis de criticidade
Estabeleça uma estratégia consistente de tags de criticidade que esteja alinhada às suas prioridades de negócios:
Alta criticidade
- Aplicação de geração de receita: plataforma de e-commerce, processamento de pagamentos, sistemas de faturamento
- serviços voltados para o cliente: autenticação de usuário, recurso principal do produto, portais de suporte ao cliente
- Sistemas de conformidade regulatória: relatórios financeiros, privacidade de dados, logginh de auditoria
- Expectativa de resposta: Atenção imediata (em minutos), monitoramento 24 horas por dia, 7 dias por semana
Criticidade média
- Suporte a funções de negócios: ferramentas internas, sistemas de relatórios, plataforma de análise de dados
- APIs não voltadas para clientes: integração interna, serviços de sincronização de dados
- Infraestrutura de desenvolvimento e testes: pipeline de CI/CD, ambientes de preparação
- Expectativa de resposta: Resposta em horário comercial (dentro de 1 a 4 horas)
Baixa criticidade
- Recurso experimental: funcionalidade beta, plataforma de testes A/B
- Utilitários internos: painel de monitoramento, ferramentas administrativas
- Ambiente não produção: Desenvolvimento, sandbox, sistemas de treinamento
- Expectativa de resposta: janelas de manutenção planejadas, próximo dia útil
Como implementar a tag de criticidade
Siga estas etapas para estabelecer uma cobertura abrangente tag de criticidade:
1. Avalie seu portfólio de aplicativos
- Inventário de todos os aplicativos APM : listar todos os aplicativos monitorados atualmente
- Avalie o impacto nos negócios: trabalhe com as partes interessadas do negócio para entender a função de cada aplicativo
- Dependência de documentos: Identifique como os aplicativos interagem e se apoiam
- Classificar por impacto no usuário: Determine qual aplicativo afeta diretamente os clientes versus usuário interno
2. Defina seu esquema de tags
Escolha valores tag consistentes:
- Use valores padronizados:
high
,medium
,low
oucritical
,important
,standard
- Documentar claramente os critérios para cada nível
- Garantir que todas as equipes entendam e apliquem os mesmos padrões
Considere a tag de contexto adicional:
- Ambiente:
production
,staging
,development
- Unidade de negócios:
payments
,customer-service
,marketing
- Região geográfica:
us-east
,eu-west
,asia-pacific
- Stack de tecnologia:
frontend
,backend
,database
,api
3. Implementar tags sistematicamente
Use a automação sempre que possível:
- Configuração do agente: Definir tag através de variáveis de ambiente ou arquivos de configuração
- Automação de implantação: inclua tag em seu pipeline de CI/CD
- infraestrutura como código: definir tag no Terraform, CloudFormation ou ferramentas semelhantes
- AutomaçãoAPI : use as APIs New Relic para aplicar tags em massa com base em convenções de nomenclatura
Processo de marcação manual:
- Comece com um aplicativo de alta criticidade: concentre-se primeiro em sistemas críticos para os negócios
- Trabalhe por equipe ou domínio: Atribuir responsabilidade de tag aos proprietários do aplicativo
- Validar e revisar: garantir que as tags sejam aplicadas corretamente e de forma consistente
- Manutenção regular: agende revisões periódicas para atualizar a tag conforme o aplicativo evolui
Medindo a melhoria
Acompanhe essas métricas para verificar as melhorias na sua tag de criticidade:
- Porcentagem de cobertura de tags: Monitoramento de IA para cobertura tag de criticidade de 100% em todos os aplicativos APM
- Precisão da etiqueta: Garanta que a etiqueta reflita corretamente a criticidade real do negócio por meio de revisão periódica
- Priorização de resposta: medir se incidentes críticos recebem um tempo de resposta mais rápido
- Eficácia da alocação de recursos: verificar se os recursos de monitoramento se concentram adequadamente nos sistemas críticos
Cenários e soluções comuns
aplicativo legado com criticidade pouco clara:
- Problema: Aplicativos mais antigos podem não ter proprietários de negócios claros ou importância documentada
- Solução: Comece com uma tag conservadora (criticidade média) e refine com base na análise de impacto do incidente
microsserviços com dependência complexa:
- Problema: Serviços individuais podem parecer de baixa criticidade, mas dão suporte a funções comerciais críticas
- Solução: Use o mapeamento de serviço para entender a dependência e tag com base no impacto posterior
Ambientes de desenvolvimento e testes:
- Problema: ambiente não produção desordem criticidade métrica
- Solução: Use a tag de ambiente para separar a produção da não produção ou exclua a não produção desta regra
aplicativo com criticidade variável ao longo do tempo:
- Problema: A importância do negócio muda com o lançamento do produto, tráfego sazonal ou estratégia de negócios
- Solução: Estabelecer ciclos regulares de revisão de tags (trimestrais ou semestrais) para atualizar as classificações
Usando a tag de criticidade de forma eficaz
alerta e gerenciamento de incidentes
- Priorizar notificação: Enviar alerta crítico para canais de resposta imediata (PagerDuty, SMS)
- Procedimentos de escalonamento: defina caminhos de escalonamento mais rápidos para incidentes de alta criticidade
- DiferenciaçãoSLA : Defina diferentes tempos de resposta destino com base na criticidade do aplicativo
Alocação de recursos
- Intensidade de monitoramento: Aplique monitoramento mais abrangente a aplicativos críticos
- Planejamento de capacidade: priorize a otimização de desempenho para sistemas de alta criticidade
- Foco na segurança: Implementar monitoramento de segurança aprimorado para aplicativos comerciais críticos
Relatórios e análises
- Painel executivo: relatórios de liderança focados na saúde crítica do sistema
- Análise de impacto nos negócios: Correlacione incidentes com métricas de negócios para aplicação crítica
- Cálculos de ROI: justifique os investimentos em monitoramento com base na criticidade e no valor comercial
Estratégias avançadas de tags
integração com sistemas externos
- Sincronização CMDB: Sincronize a tag de criticidade com os registros do banco de dados de gerenciamento de configuração
- Catálogos de serviços: alinhe-se com ferramentas de gerenciamento de serviços de TI como o ServiceNow
- Inventário de aplicativos empresariais: Conecte-se à documentação de arquitetura empresarial
Tag dinâmica
- Criticidade baseada no tempo: alguns aplicativos podem ser mais críticos durante o horário comercial ou em temporadas específicas
- Atualizações orientadas por eventos: atualize automaticamente a criticidade durante grandes eventos de negócios (vendas, campanhas)
- Considerações geográficas: diferentes níveis de criticidade para diferentes regiões ou mercados
Considerações importantes
- Alinhamento de negócios: garantir que os níveis de criticidade reflitam o impacto real nos negócios, e não a complexidade técnica
- Revisões regulares: a criticidade do aplicativo pode mudar com a estratégia de negócios e deve ser revisada periodicamente
- Consenso da equipe: envolva as partes interessadas técnicas e comerciais nas decisões de criticidade
- Documentação: Manter documentação clara dos critérios de criticidade e da justificativa da decisão
Próximos passos
- Ação imediata: identificar e tag o aplicativo que atualmente não possui a tag de criticidade, começando pelos sistemas críticos conhecidos
- Estabelecimento de processo: Crie um processo de governança de tags com ciclos de revisão regulares
- Integração de ferramentas: Implemente automação para manter a consistência tag em toda a implantação
- Alinhamento das partes interessadas: garantir que as equipes de negócios e técnicas concordem com as classificações de criticidade
- Avançar para o Nível 3: Uma vez estabelecida a etiqueta de criticidade, concentre-se no alcance do nível de serviço
Para obter orientações abrangentes sobre estratégias e implementação de tags, consulte nossa documentação de tags.