Esta página fornece soluções para problemas comuns que você pode encontrar ao usar o fluxo de trabalho Automation. Para obter suporte adicional, consulte o Fórum de Suporte da New Relic ou entre em contato com o Suporte da New Relic.
Credenciais e autenticação da AWS
Erros de acesso negado
Problema: Seu fluxo de trabalho falha com um erro de autorização da AWS.
Soluções:
Verifique o ID da sua conta: Verifique se você usou
253490767857(e não754728514883) na política de confiança. O ID da conta de integração na nuvem (754728514883) é diferente do ID da conta de automação de fluxo de trabalho.Verificar ID externo: Confirme se o ID externo em sua política de confiança corresponde exatamente ao ID da sua conta New Relic (encontrado em Configurações da conta).
Revisar permissões: Garanta que sua função ou usuário do IAM tenha as permissões específicas da AWS que seu fluxo de trabalho exige. Consulte a tabela Permissões necessárias.
Teste com a AWS CLI: Execute
aws sts assume-rolelocalmente para verificar se a função pode ser assumida:aws sts assume-role \--role-arn "arn:aws:iam::YOUR_ACCOUNT:role/NewRelicWorkflowAutomationRole" \--role-session-name "TestSession" \--external-id "YOUR_NR_ACCOUNT_ID"
token inválido ou credenciais expiradas
Problema: fluxo de trabalho falha com erros de expiração token.
Soluções:
Para o token de sessão: verifique o timestampde expiração — os tokens de sessão geralmente duram de 1 a 12 horas. Gere novas antes que expirem usando:
aws sts assume-role \--role-arn "arn:aws:iam::YOUR_ACCOUNT:role/YOUR_ROLE" \--role-session-name "WorkflowAutomationSession"Para chaves de acesso: Verifique se o ID da chave de acesso e a Chave de acesso secreta estão armazenados corretamente no gerenciador de segredos. Verifique novamente os valores no NerdGraph GraphiQL explorer.
Verifique a sintaxe dos segredos: Certifique-se de estar usando o formato
${{ :secrets:keyName }}, e não${{ secrets.keyName }}. O prefixo de dois pontos (:secrets:) é obrigatório.
Não consigo encontrar o ARN da minha função.
Problema: Você precisa do ARN, mas não consegue encontrá-lo na AWS.
Solução:
- Faça login no Console do AWS IAM.
- Selecione Roles na barra de navegação.
- Procure pelo nome da sua função (ex:
NewRelicWorkflowAutomationRole) - Selecione a função — o ARN aparece na seção Resumo.
- O formato ARN é:
arn:aws:iam::<YOUR_AWS_ACCOUNT>:role/<ROLE_NAME>
fluxo de trabalho não pode acessar recursos específicos AWS
Problema: Sua função possui permissões, mas o fluxo de trabalho ainda não consegue acessar determinados recursos.
Soluções:
Permissões em nível de recurso: verifique se sua política do IAM restringe o acesso a ARNs de recursos específicos. Você pode precisar adicionar um curinga (
*) para testes e, em seguida, restringir a recursos específicos.{"Effect": "Allow","Action": "ec2:DescribeInstances","Resource": "*" // Change from specific ARN to * for testing}Políticas de controle de serviço (SCPs): Se você estiver em uma organização da AWS, as SCPs podem bloquear determinadas ações. Entre em contato com o administrador da AWS para revisar as políticas da organização.
Incompatibilidade de região: verifique se suas permissões do IAM especificam a região correta da AWS onde seus recursos estão localizados. Atualize o parâmetro
awsRegiondo fluxo de trabalho para corresponder à localização do seu recurso.
Problemas na execução do fluxo de trabalho
Guia rápido de resolução de problemas
Comece aqui: Use esta referência rápida para diagnosticar problemas comuns.
Sintoma | Verificar | Solução |
|---|---|---|
O fluxo de trabalho falha em uma etapa específica. | Ver logs de execução para mensagem de erro | Corrija a configuração, as credenciais ou os dados de entrada para essa ação. |
O fluxo de trabalho é executado, mas produz resultados incorretos. | Verifique os dados que passam entre as etapas. | Verificar sintaxe do modelo |
O fluxo de trabalho agendado não está sendo executado. | Verifique o histórico de execuções para identificar execuções ignoradas. | Verificar configuração de agendamento e status do fluxo de trabalho (Ativo) |
O fluxo de trabalho expira | Verificar duração da execução | Reduza a frequência de polling ou divida em fluxos de trabalho menores |
As alterações não surtem efeito. | Verificar histórico de versões | Atualize as execuções agendadas para usar a nova versão. |
Para instruções detalhadas sobre como visualizar o status e o histórico de execução do fluxo de trabalho, consulte Visualizar fluxos de trabalho.
O fluxo de trabalho aparece com o status "Falha".
Problema: Um fluxo de trabalho aparece com o status "Falha" no dashboard.
Etapas de diagnóstico:
Verifique o histórico de execução:
- Acesse All Capabilities > Workflow Automation
- Clique no nome do fluxo de trabalho.
- Visualizar Run history
Revise os logs de execução:
- Clique em View logs na execução com falha
- Identifique a ação específica que falhou
Causas comuns:
- Credenciais inválidas - Tokens expirados ou sintaxe de segredos incorreta
- Permissões ausentes - Permissões do IAM ou acesso à API insuficientes
- Recursos excluídos - instâncias EC2, canais do Slack ou bancos de dados não existem mais
- Limites de taxa - Muitas solicitações para AWS, Slack ou outros serviços
- Tempos limite - APIs externas não respondendo rápido o suficiente
Próximo passo: Corrija o problema e, em seguida, acione manualmente o fluxo de trabalho para verificar se funciona.
A execução do fluxo de trabalho está demorando muito.
Problema: As execuções do fluxo de trabalho excedem a duração esperada ou o tempo limite.
Soluções:
Revisar a sequência de ações: verificar os logs para identificar ações lentas. Procure por ações com tempos de execução superiores a 30 segundos.
Otimizar consulta: Se estiver usando consultas NRQL, otimize-as para melhor desempenho:
- Adicione intervalos de tempo específicos em vez de consultar todos os dados.
- Use
LIMITpara reduzir o tamanho do conjunto de resultados. - Filtrar antecipadamente com cláusulas
WHERE
Verifique as APIs externas: Respostas lentas de serviços integrados (AWS, Slack) podem atrasar a execução. Teste API tempo de resposta separadamente.
Considere os limites do fluxo de trabalho: revise os limites do fluxo de trabalho para restrições de tempo limite (normalmente 15 minutos por fluxo de trabalho).
Divida o fluxo de trabalho menor: divida o fluxo de trabalho complexo em automações menores e focadas que podem ser executadas em paralelo.
As alterações no fluxo de trabalho não surtem efeito.
Problema: Você editou um fluxo de trabalho, mas as alterações não são aplicadas quando ele é executado.
Soluções:
Verifique se você salvou: Confira se você clicou em Save após editar a configuração do fluxo de trabalho.
Verifique a versão:
- Acesse os detalhes do fluxo de trabalho.
- Clique na guia Version history
- Certifique-se de que suas alterações mais recentes apareçam como uma nova versão.
- Verifique se esta versão está marcada como ativa.
Atualizar execuções agendadas: Se o fluxo de trabalho for executado de acordo com um agendamento, atualize o agendamento para usar a nova versão:
- Acesse All Capabilities > Workflow Automation
- Encontre corridas programadas
- Atualize o cronograma para fazer referência à nova versão do fluxo de trabalho.
problemas dashboard fluxo de trabalho
Não consigo encontrar um fluxo de trabalho no dashboard
Problema: Um fluxo de trabalho que você criou não aparece na lista dashboard.
Soluções:
Verifique os filtros:
- Clique no dropdowndo filtro.
- Selecione "Todos" para os filtros de status.
- Limpar a barra de pesquisa
Verificar conta: Confirme se você está conectado à conta correta do New Relic onde o fluxo de trabalho foi criado. Verifique o seletor de contas no canto superior direito.
Verifique as permissões: Certifique-se de que seu perfil do usuário tenha acesso para visualizar o fluxo de trabalho. Entre em contato com o administrador do New Relic se precisar de permissões de acesso ao fluxo de trabalho.
Atualize a página: o cache Browser às vezes pode ocultar alterações recentes. Tente uma atualização completa da página (Ctrl+Shift+R ou Cmd+Shift+R).
Não é possível excluir um fluxo de trabalho.
Problema: A opção de excluir está desativada ou a exclusão falha.
Soluções:
Verifique permissões: Verifique se seu perfil do usuário possui permissões de exclusão para fluxo de trabalho. Se necessário, entre em contato com o administrador da sua conta.
Interromper execuções agendadas: Cancele todas as execuções agendadas ativas antes de excluí-las.
- Acesse os detalhes do fluxo de trabalho.
- Acesse a aba Scheduled runs
- Cancelar todos os agendamentos ativos
Verifique dependência: Alguns fluxos de trabalho não podem ser excluídos se outras automações dependerem deles. Verifique se o fluxo de trabalho é referenciado por:
- Outros fluxos de trabalho que o chamam
- política de alertas que o acionam
- Sistemas externos que o iniciam via API
Contate o suporte: Se o problema persistir após tentar as soluções acima, entre em contato com o Suporte da New Relic para obter assistência.
Desativação da Automação de fluxo de trabalho (FCM)
Problema: Você está desativando a Workflow Automation por meio do Feature Control Management (FCM) e precisa garantir um encerramento limpo.
Importante
Para clientes desativando o FCM: Certifique-se de que todos os fluxos de trabalho agendados futuros sejam removidos antes de desativar o Workflow Automation. Isso evita confusão e alertas desnecessários após o recurso ser desativado.
Soluções:
Remova todos os fluxos de trabalho agendados primeiro: Se você desativou o FCM, certifique-se de que todos os fluxos de trabalho agendados futuros sejam removidos para evitar confusão ou alertas:
- Acesse All Capabilities > Workflow Automation
- Revise cada fluxo de trabalho e verifique se há agendamentos ativos
- Clique nos fluxos de trabalho com agendamentos para visualizar seus detalhes
- Vá para a aba Scheduled runs
- Exclua todos os agendamentos ativos usando a API DeleteSchedule
Verifique se todos os agendamentos foram removidos: Confirme se não há execuções agendadas ativas antes de desativar o FCM
Desativar o FCM: Assim que todos os agendamentos forem removidos, você pode desativar a Workflow Automation com segurança por meio das configurações do FCM
Importante
Por que remover cronogramas? Workflows agendados não podem ser executados quando o Workflow Automation está desabilitado por meio do FCM. Agendamentos ativos restantes no sistema podem causar confusão ou gerar alertas desnecessários.
Questões específicas de integração
A notificação do Slack não aparece
Problema: O fluxo de trabalho é concluído com sucesso, mas as mensagens do Slack não aparecem.
Soluções:
Verifique o ID do canal: Certifique-se de usar o ID do canal do Slack (por exemplo,
C01234ABCD), e não o nome do canal. Encontre o ID no Slack:- Clique com o botão direito do mouse no nome do canal.
- Selecione View channel details.
- Copie o ID do canal que está na parte inferior.
Verifique as permissões do bot: verifique se o seu bot do Slack possui os seguintes escopos:
chat:write- Publicar mensagenschannels:read- Ver canais públicosgroups:read- Visualizar canais privados (se aplicável)
Verifique se o bot está no canal: Adicione o bot ao canal Destino:
- Digite
/invite @YourBotNameno canal - Confirme se o bot aparece na lista de membros.
- Digite
Verificar token nos segredos: Verifique se o token do Slack armazenado no gerenciador de segredos está correto e não expirou.
As operações do AWS Systems Manager falham.
Problema: Os documentos ou comandos de automação do SSM não são executados.
Soluções:
Verifique as permissões do SSM: Adicione estas permissões à sua política de função do IAM:
{"Effect": "Allow","Action": ["ssm:CreateDocument","ssm:DeleteDocument","ssm:StartAutomationExecution","ssm:GetAutomationExecution"],"Resource": "*"}Verifique o agente SSM: verifique se as instâncias de destino do EC2 têm o agente SSM instalado e em execução:
aws ssm describe-instance-information --region us-east-1Verifique o perfil da instância: as instâncias do EC2 precisam de um perfil de instância IAM com permissões SSM para executar comandos.
Verificar se o documento existe: Se estiver usando um documento SSM existente, verifique se ele existe em sua conta e região da AWS.
Criando fluxos de trabalho personalizados
Canal do Slack não encontrado: Use o ID do canal do Slack (C01234ABCD), não o nome do canal. Encontre nos detalhes do canal do Slack.
Ações da AWS falham silenciosamente: Certifique-se de que as credenciais da AWS tenham as permissões ec2:StopInstances, ec2:ModifyInstanceAttribute, ec2:StartInstances e ssm:*. Permissões ausentes falham silenciosamente.
O SSM excede o tempo limite, mas a instância ainda está em transição: Se o SSM exceder o tempo limite, a instância EC2 ainda pode estar em transição entre estados. Verifique o Console da AWS para confirmar o status real da instância antes de executar novamente.
Vazamentos de recursos e cobranças inesperadas: Sempre faça a limpeza. Estruture os fluxos de trabalho para que a limpeza seja executada mesmo quando as etapas anteriores falharem. Isso evita vazamentos de recursos e cobranças inesperadas da AWS.
Problemas específicos do modelo
GUID da entidade não encontrado
Problema: Os modelos falham com erros Entity not found.
Soluções:
Encontre o GUID da entidade correta:
- Acesse a página de recursos monitorados no New Relic.
- Verifique o URL ou os metadados da entidade para obter o GUID.
- Use a pesquisa de entidade para localizar entidade
Verificar se a entidade existe na conta correta: Confirme se você está usando a entidade da mesma conta onde o fluxo de trabalho está implantado.
Confirme os dados de reporte da entidade: verifique se a entidade mostra Last seen — entidades desatualizadas podem ter sido removidas.
Para entidade AWS : Certifique-se de que a integração esteja ativa
Dica
Os GUIDs de entidade são específicos da conta. Mover o fluxo de trabalho entre contas requer a atualização de todos os GUIDs da entidade.
A consulta NRQL não retornou resultados.
Problema: Os modelos que utilizam NRQL consultam o conteúdo, mas retornam conjuntos de dados vazios.
Soluções:
Teste a consulta primeiro: Use o criador de consulta para validar a consulta antes de adicionar aos modelos
Verificar tipo de dados e nomes de eventos:
- Use
FROM Transaction, nãoFROM Transactions - Verifique se os nomes dos atributos correspondem exatamente (diferenciando maiúsculas de minúsculas).
- Use
Ajustar intervalos de tempo: Para dados esparsos, expanda a janela de tempo:
- Adicione
SINCE 1 hour agopara dados recentes. - Use
SINCE 1 day agopara tendências
- Adicione
Simplifique e teste incrementalmente: Comece com uma consulta básica e adicione filtros um de cada vez.
Verificar sintaxe NRQL: Verificar se a estrutura da consulta corresponde aos requisitos NRQL.
A implantação do modelo falha
Problema: Template não implanta ou apresenta erros durante a implantação.
Soluções:
- Verifique todas as informações necessárias: Certifique-se de ter preenchido todos os campos obrigatórios (credenciais, GUIDs, consulta).
- Verifique o formato das credenciais: os segredos devem usar o formato
${{ :secrets:keyName }}com o prefixo de dois pontos. - Teste as credenciais de forma independente: Antes da implantação, teste as credenciais AWS com AWS CLI e o token do Slack na APIdo Slack.
- Verifique os requisitos do modelo: Cada modelo lista pré-requisitos específicos — verifique se todos foram atendidos.
- Verifique a presença de caracteres especiais: Alguns campos (nomes de canais, consulta) podem não conter caracteres especiais — utilize caracteres alfanuméricos sempre que possível.
Aprovação fluxo de trabalho não responde
Problema: Os modelos que exigem aprovação do Slack (reversão do API Gateway, redimensionamento do EC2) não detectam reações.
Soluções:
Verificar escopos de token do bot:
reactions:read- Necessário para detectar reações com emojischat:write- É necessário publicar mensagens de aprovação.
Verifique o formato da reação: Use o emoji exato especificado no fluxo de trabalho (por exemplo,
thumbsuppara aprovação).Verifique as configurações de tempo limite: requests de aprovação expiram após o tempo limite configurado (geralmente de 5 a 10 minutos).
Garantir que o bot possa ler as mensagens: O bot deve estar no canal e ter permissão para ler o histórico de mensagens.
Teste com aprovação simples: Crie um fluxo de trabalho de teste com apenas lógica de aprovação para isolar o problema.
problemas de gerenciamento de instâncias do EC2
Problema: o modelo EC2 não consegue redimensionar ou gerenciar a estrutura.
Soluções:
- Verifique se CloudWatch Metric Streams estão configurados: Necessário para métricas EC2 em tempo real.
- Verifique se a integração de monitoramento do EC2 está ativa: Garante que os dados da instância fluam para o New Relic
- Confirme o estado do participante: o participante deve estar no estado
runningoustopped— estados de transição (pendente, parando) causam falhas. - Verifique a compatibilidade do tipo de instância: nem todos os tipos de instância suportam todas as operações de redimensionamento - verifique a documentação do tipo de instânciaAWS
- Verificar permissões de parada/início: a função IAM precisa de
ec2:StopInstanceseec2:StartInstancesalém deec2:ModifyInstanceAttribute
O modelo de análise JSON não está registrando dados.
Problema: O modelo de análise JSON é executado com sucesso, mas nenhum dado aparece nos logs New Relic.
Soluções:
- Verifique os endpointda API: Teste a URL da página de status em um navegador — certifique-se de que ela retorne um JSON válido.
- Verifique a estrutura JSON: o modelo espera um formato específico — verifique se os campos de integridade do componente correspondem à estrutura esperada.
- Revisar filtros de log: Garantir que a ação de registro utilize o tipo de evento e o atributo corretos.
- Teste com um endpoint simples: Use um endpoint JSON básico (como https://httpbin.org/json) para verificar se a mecânica do template funciona.
- Verificar permissões da conta: Verifique se o fluxo de trabalho tem permissão para gravar logs no New Relic.
Modelos de resolução de problemas
Se o seu fluxo de trabalho falhar ou não se comportar como esperado:
Verifique o histórico de execução: Vá para Workflow Automation > [Seu fluxo de trabalho] > Run History para ver logs de execução e mensagem de erro
Revise problemas comuns: Consulte resolução de problemas de fluxo de trabalho Automação para soluções para:
- Erros de credenciais e permissões da AWS
- Problemas de integração com o Slack
- Problemas com o GUID da entidade
- falhas de consultoria NRQL
- Tempo limite do fluxo de trabalho
- Resolução de problemas específica do modelo
Importante
Teste templates com segurança: Sempre teste primeiro em ambiente não produção. Modelos que alteram a infraestrutura (EC2, API Gateway) podem afetar a disponibilidade se estiverem configurados incorretamente.
Tópicos relacionados
Melhores práticas de fluxo de trabalho
Tratamento de erros e estratégias de teste para evitar problemas
Configure as credenciais da AWS.
Corrigir erros de autenticação e permissão da AWS
Criar destinos
Configure as integrações do Slack e de notificações corretamente
Limites do fluxo de trabalho
Entenda as restrições e os tempos limite do sistema