A interface OpenTelemetry APM é uma experiência com curadoria disponível para serviço entidade. Se você ainda não configurou seu serviço com New Relic e OpenTelemetry, consulte monitoramentoOpenTelemetry APM .
As páginas da interface OpenTelemetry APM foram projetadas para ajudar a identificar e diagnosticar problemas rapidamente. Muitos exigem que os dados estejam em conformidade com várias convenções semânticas do OpenTelemetry, mas alguns são de uso geral. Veja informações detalhadas e requisitos para cada página abaixo:
- Página de resumo
- Distribuindo página de rastreamento
- Página do mapa de serviço
- Página de transação
- Página do banco de dados
- Página de serviços externos
- Página de tempo de execução da JVM
- Página de tempo de execução Go
- Página de logs
- Página Errors Inbox
- Página do explorador métrico
Os seguintes conceitos da New Relic são recorrentes ou se sobrepõem nas páginas:
Encontre serviços OpenTelemetry APM
Para encontrar os serviços OpenTelemetry APM , navegue até All entities > Services > OpenTelemetry ou APM & Services. Clique em um serviço para navegar até a página de resumo do serviço.
Dentro do explorador de entidades você pode filtrar por tag entidade. Para obter detalhes sobre como as tags entidade são computadas, consulte RecursosOpenTelemetry no New Relic.
Página: Resumo
A página de resumo fornece uma visão geral da integridade do seu serviço, incluindo:
- Sinais clássicos: tempo de resposta, taxas de transferência e taxas de erros. Veja sinais clássicos para detalhes sobre como estes são computados.
- Entidade relacionada: outros serviços que comunicam com este serviço e infraestrutura relacionada. Consulte o mapa de serviço para uma visão detalhada.
- Atividade: status de quaisquer alertas ativos para este serviço.
- Distributed tracing insights: descubra se a entidade downstream ou upstream pode estar contribuindo para a degradação do desempenho. Consulte sinais de entidade de traces relacionados para obter mais detalhes.
- Instância: detalhamento de sinais clássicos por instância quando um serviço é escalado horizontalmente. Depende do atributo de recurso
service.instance.id
(ver atributo de entidade de serviço para mais detalhes).
Página: distributed tracing
A distributed tracing página fornece detalhados insights OpenTelemetry trace sobre os dados . Consulte distributed tracing para obter informações de uso da página. Consulte Rastreamento no para obter detalhes OpenTelemetry New Relic sobre como os dados são ingeridos no OpenTelemetry trace New Relic.
Assim como acontece com os sinais clássicos, os spans serão classificados como erros se o status do span estiver definido como ERROR
(por exemplo, otel.status_code = ERROR
). Se o intervalo for um erro, a descrição do status do intervalo (por exemplo, otel.status_description
) será exibida em detalhes do erro.
OpenTelemetry span evento anexa informações de contexto de evento adicionais a um intervalo específico. Eles são mais comumente usados para capturar informações de exceção. Se disponível, você pode visualizar o evento de um intervalo nos trace details.
Dica
A presença de um evento de exceção de intervalo não qualifica o intervalo como um erro por si só. Somente intervalos com status de intervalo definido como ERROR
são classificados como erros.
Página: Mapa de serviços
A página do mapa de serviço fornece uma representação visual de toda a sua arquitetura. Consulte o mapa de serviço para obter mais informações.
Página: transação
A página de transação fornece ferramentas para identificar problemas e analisar a transação de um serviço.
Para métrica, a consulta assume que os dados estão em conformidade com as convenções semânticas http métrica ou rpc métrica. Os atributo http.route
e rpc.method
são utilizados para listagem e filtragem por transação.
Para spans, as consultas são genéricas, utilizando apenas o modelo de dados de span de nível superior. Os prazos são contabilizados para taxas de transferência e tempo de resposta conforme descrito em sinais clássicos. O campo span name é usado para listar e filtrar por transação.
Página: banco de dados
A página banco de dados fornece ferramentas para identificar problemas e analisar as operações do cliente do banco de dados de um serviço.
Não existe uma visão do banco de dados baseada em métricas, uma vez que atualmente não existem convenções semânticas disponíveis.
Para spans, a consulta assume que os dados estão em conformidade com as convenções semânticas do db span. O nome do span e o atributo db.system
, db.sql.table
e db.operation
são usados para listar e filtrar operações do banco de dados.
Página: Serviços externos
A página externals fornece ferramentas para identificar problemas e analisar chamadas externas de um serviço, incluindo chamar entidade (serviços upstream) e entidade chamada (serviços downstream).
Não há visualização baseada em métricas da página de serviços externos.
Para spans, as consultas são genéricas, utilizando apenas o modelo de dados de span de nível superior. Os períodos são contados para taxas de transferência de serviço externo e tempo de resposta se estiverem saindo de um serviço, computando usando uma heurística de WHERE span.kind = client OR span.kind = producer
. banco de dados span de cliente são filtrados usando WHERE db.system is null
(veja a página banco de dados). Assim como acontece com os sinais clássicos, os spans são erros se tiverem um código de status ERROR
(por exemplo, otel.status_code = ERROR
). Se disponíveis, os dados das convenções semânticas http span e rpc span serão usados para classificar chamadas de serviço externas.
Página: tempo de execução JVM
A página de tempo de execução da JVM fornece ferramentas para identificar problemas e analisar a JVM de um serviço Java. A página é exibida apenas para serviços que usam OpenTelemetry java. Para diferenciar entre instâncias de serviço distintas, a página exige que o atributo de recurso service.instance.id
seja definido (veja atributo de entidade de serviço para mais detalhes).
A página de tempo de execução JVM mostra sinais clássicos junto com a métrica de tempo de execução JVM para correlacionar problemas de tempo de execução com o uso do serviço. A alternância span-métrica determina se os sinais clássicos são orientados por dados span ou métricos. Não há visualização baseada em intervalos para métricas de tempo de execução JVM.
Para métricas, a consulta assume que os dados estão em conformidade com as convenções semânticas métricasJVM . Observe que essas convenções estão incorporadas na biblioteca de instrumentação de tempo de execução OpenTelemetry Java, que é incluída automaticamente com o agente Java OpenTelemetry.
Página: Vá em tempo de execução
A página de tempo de execução Go fornece ferramentas para identificar problemas e analisar o tempo de execução de um serviço Go. A página é exibida apenas para serviços que usam OpenTelemetry Go. Para diferenciar entre instâncias de serviço distintas, a página exige que o atributo de recurso service.instance.id
seja definido (veja atributo de entidade de serviço para mais detalhes).
A página do tempo de execução do Go mostra sinais clássicos junto com a métrica do tempo de execução do Go para correlacionar problemas de tempo de execução com o uso do serviço. A alternância span-métrica determina se os sinais clássicos são orientados por dados span ou métricos. Não há visualização baseada em intervalos para a métrica de tempo de execução do Go.
Para métrica, os dados assumidos pela consulta são produzidos pela biblioteca de instrumentação de tempo de execução OpenTelemetry Go. Observe que atualmente não há convenções semânticas para métricas de tempo de execução Go.
Página: logs
A página de logs fornece ferramentas para identificar problemas e analisar o log de um serviço. Consulte interface de logs para obter mais informações.
Página: Errors Inbox
A página Errors Inbox fornece ferramentas para detectar e fazer triagem de erros de um serviço. Consulte Caixa de entrada de erros para obter mais detalhes.
A página errors inbox é orientada por detalhes de trace. Assim como acontece com os sinais clássicos, os spans serão classificados como erros se o status do span estiver definido como ERROR
(por exemplo, otel.status_code = ERROR
).
Os intervalos de erros são agrupados por sua impressão digital de erro, computados pela normalização de valores de identificação, como UUIDs, valores hexadecimais, endereços de e-mail, etc. Cada intervalo de erro distinto é uma instância individual dentro do grupo de erros. A mensagem do grupo de erros é determinada da seguinte forma:
- Descrição do status do período (por exemplo,
otel.status_description
) rpc.grpc.status_code
das convenções semânticas do span rpchttp.status_code
de convenções semânticas de extensão httphttp.response.status_code
de convenções semânticas de extensão httpundefined
se nenhuma das opções acima estiver presente
Página: explorador métrico
O explorador métrico fornece ferramentas para explorar a métrica de um serviço de forma genérica. Consulte explorar seus dados para obter mais informações.
Sinais clássicos
Os sinais clássicos de taxas de transferência, tempo de resposta e taxas de erros aparecem em diversos locais da interface do OpenTelemetry APM. Quando usados, eles são calculados da seguinte forma:
Para métrica, a consulta assume que os dados estão em conformidade com as convenções semânticas http métrica ou rpc métrica.
Para spans, as consultas são genéricas, utilizando apenas o modelo de dados de span de nível superior. Os spans são contados para taxas de transferência e tempo de resposta se forem spans de entrada raiz em um serviço, computando usando uma heurística de WHERE span.kind = server OR span.kind = consumer
. Os spans serão erros se tiverem um código de status ERROR
(por exemplo, otel.status_code = ERROR
).
Dados restritos com filtros
Várias páginas incluem uma barra de filtros, com opções como Limitar dados para.... Isso permite que você filtre consultas na página de acordo com os critérios. Por exemplo, você pode restringir uma implantação canário específica filtrando por service.version='1.2.3-canary'
. Os filtros são preservados ao navegar entre as páginas.
Alternância de métricas ou spans
Várias páginas incluem uma alternância métrica ou de spans. Isso permite alternar se as consultas são orientadas por dados span ou métricos com base nos requisitos de análise e na disponibilidade de dados.
As métricas não estão sujeitas a amostragem e, portanto, são mais precisas, especialmente no cálculo de taxas como taxas de transferência. No entanto, as métricas estão sujeitas a restrições de cardinalidade e podem carecer de determinados atributos importantes para análise. Em contraste, os vãos são amostrados e, portanto, sujeitos a problemas de precisão, mas possuem atributos mais ricos, uma vez que não estão sujeitos a restrições de cardinalidade.
Historicamente, OpenTelemetry API/SDKs e instrumentação da linguagem priorizaram trace a instrumentação. No entanto, o projeto já percorreu um longo caminho e as métricas estão disponíveis em quase todos os idiomas. Verifique a documentação da linguagem e instrumentação relevantes para obter mais detalhes.