Interface OpenTelemetry APM

A interface OpenTelemetry APM é uma experiência com curadoria disponível para serviço entidade. Se você ainda não configurou seu serviço com New Relic e OpenTelemetry, consulte monitoramentoOpenTelemetry APM .

As páginas da interface do usuário do OpenTelemetry APM foram projetadas para ajudar a identificar e diagnosticar problemas rapidamente. Muitos exigem que os dados estejam em conformidade com várias convenções semânticas do OpenTelemetry, mas alguns são de uso geral.

Os seguintes conceitos da New Relic são recorrentes ou se sobrepõem nas páginas:

Sinais clássicos
Dados restritos com filtros
Alternância de métricas ou spans

Encontre serviços OpenTelemetry APM

Para encontrar os serviços OpenTelemetry APM , navegue até All entities > Services > OpenTelemetry ou APM & Services. Clique em um serviço para navegar até a Summary page do serviço.

Dentro do explorador de entidades você pode filtrar por tag entidade. Para obter detalhes sobre como as tags entidade são computadas, consulte RecursosOpenTelemetry no New Relic.

Página: Resumo

A página de resumo fornece uma visão geral da integridade do seu serviço, incluindo:

Golden signals: tempo de resposta, taxas de transferência e taxas de erros. Veja Golden signals para detalhes sobre como estes são computados.
Entidade relacionada: outros serviços que se comunicam com este serviço e infraestrutura relacionada. Veja o Service map para uma visão detalhada.
Atividade: status de quaisquer alertas ativos para este serviço.
insightsde rastreamento distribuído: descubra se a entidade a jusante ou a montante pode estar contribuindo para o desempenho degradado. Consulte Sinais de entidade de rastreamento relacionados para obter mais detalhes.
Instância: detalhamento de sinais clássicos por instância quando um serviço é escalado horizontalmente. Depende do atributo de recurso service.instance.id (consulte Serviços para obter mais detalhes).

Página: distributed tracing

A distributed tracing página fornece detalhados insights OpenTelemetry trace sobre os dados . Consulte distributed tracing para obter informações de uso da página. Consulte Rastreamento no para obter detalhes OpenTelemetry New Relic sobre como os dados são ingeridos no OpenTelemetry trace New Relic.

Assim como acontece com os sinais clássicos, os spans serão classificados como erros se o status do span estiver definido como ERROR (por exemplo, otel.status_code = ERROR). Se o intervalo for um erro, a descrição do status do intervalo (por exemplo, otel.status_description) será exibida em detalhes do erro.

OpenTelemetry span evento anexa informações de contexto de evento adicionais a um intervalo específico. Eles são mais comumente usados para capturar informações de exceção. Se disponível, você pode visualizar o evento de um intervalo nos trace details.

Dica

A presença de um evento de exceção de intervalo não qualifica o intervalo como um erro por si só. Somente intervalos com status de intervalo definido como ERROR são classificados como erros.

Screenshot showing the right pane showing the two links for span events

Página: Mapa de serviços

A página do mapa de serviços fornece uma representação visual de toda a sua arquitetura. Veja os mapas de serviço para mais informações.

Página: transação

A página de transação fornece ferramentas para identificar problemas e analisar a transação de um serviço.

Para métrica, a consulta assume que os dados estão em conformidade com as convenções semânticas HTTP métrica ou RPC métrica . Os atributos http.route e rpc.method são usados para listar e filtrar por transação.

Para intervalos, as consultas são genéricas, utilizando apenas o modelo de dados de intervalo de nível superior. Os prazos são contabilizados para taxas de transferência e tempo de resposta conforme descrito em sinais clássicos. O campo de nome do intervalo é usado para listar e filtrar por transação.

Página: banco de dados

A página banco de dados fornece ferramentas para identificar problemas e analisar as operações do cliente do banco de dados de um serviço.

Não existe uma visão do banco de dados baseada em métricas, uma vez que atualmente não existem convenções semânticas disponíveis.

Para intervalos, a consulta assume que os dados estão em conformidade com as convenções semânticas de intervalo do BD . O nome do intervalo e os atributos db.system, db.sql.table e db.operation são usados para listar e filtrar operações de banco de dados.

Página: Serviços externos

A página externals fornece ferramentas para identificar problemas e analisar chamadas externas de um serviço, incluindo chamar entidade (serviços upstream) e entidade chamada (serviços downstream).

Não há visualização baseada em métricas da página de serviços externos.

Para intervalos, as consultas são genéricas, utilizando apenas o modelo de dados de intervalo de nível superior. Os intervalos são contados para taxas de transferência e tempo de resposta de serviço externo se estiverem saindo de um serviço, computar usando uma heurística de WHERE span.kind = client OR span.kind = producer. banco de dados span de cliente são filtrados usando WHERE db.system is null (veja Página: banco de dados). Assim como acontece com os sinais clássicos, os spans são considerados erros se tiverem um código de status ERROR (por exemplo, otel.status_code = ERROR). Se disponíveis, os dados das convenções semânticas de intervalo HTTP e intervalo RPC são usados para classificar chamadas de serviço externas.

Página: tempo de execução JVM

A página de tempo de execução da JVM fornece ferramentas para identificar problemas e analisar a JVM de um serviço Java. A página é exibida somente para serviços que usam OpenTelemetry java. Para diferenciar entre instâncias de serviços distintas, a página requer que o atributo de recurso service.instance.id seja definido (consulte Serviços para obter mais detalhes).

A página de tempo de execução JVM mostra sinais clássicos juntamente com métricas de tempo de execução JVM para correlacionar problemas de tempo de execução com o uso do serviço. A alternância métrica ou de spans determina se os sinais clássicos são controlados por dados de span ou métricos. Não há uma visualização baseada em intervalos para o tempo de execução métrico JVM .

Para métrica, a consulta assume que os dados estão em conformidade com as convenções semânticas JVM métrica . Observe que essas convenções são incorporadas na biblioteca de instrumentação de tempo de execução Java do OpenTelemetry, que é incluída automaticamente com o agente Java do OpenTelemetry.

Página: Vá em tempo de execução

A página de tempo de execução do Go fornece ferramentas para identificar problemas e analisar o tempo de execução de um serviço Go. A página é exibida apenas para serviços que usam o OpenTelemetry Go. Para diferenciar entre instâncias de serviços distintas, a página requer que o atributo de recurso service.instance.id seja definido (consulte Serviços para obter mais detalhes).

A página de tempo de execução do Go mostra sinais clássicos junto com o tempo de execução métrico do Go para correlacionar problemas de tempo de execução com o uso do serviço. A alternância métrica ou de spans determina se os sinais clássicos são controlados por dados de span ou métricos. Não há uma visualização baseada em intervalos para o tempo de execução métrica do Go.

Para métrica, os dados assumidos pela consulta são produzidos pela biblioteca de instrumentação de tempo de execução OpenTelemetry Go. Observe que atualmente não há convenções semânticas para métricas de tempo de execução Go.

Página: logs

A página de log fornece ferramentas para identificar problemas e analisar o log de um serviço. Consulte Usar interface de log para obter mais informações.

Página: Errors Inbox

A página Caixa de entrada de erros fornece ferramentas para detectar e classificar erros de um serviço. Consulte Introdução à Caixa de entrada de erros para obter mais detalhes.

A página errors inbox é orientada por detalhes de trace. Assim como acontece com os sinais clássicos, os spans serão classificados como erros se o status do span estiver definido como ERROR (por exemplo, otel.status_code = ERROR).

Os intervalos de erros são agrupados por sua impressão digital de erro, computados pela normalização de valores de identificação, como UUIDs, valores hexadecimais, endereços de e-mail, etc. Cada intervalo de erro distinto é uma instância individual dentro do grupo de erros. A mensagem do grupo de erros é determinada da seguinte forma:

Descrição do status do período (por exemplo, otel.status_description)
rpc.grpc.status_code das convenções semânticas de span RPC
http.status_code das convenções semânticas de span HTTP
http.response.status_code das convenções semânticas de span HTTP
undefined se nenhuma das opções acima estiver presente

Página: explorador métrico

O métrica explorer fornece ferramentas para explorar a métrica de um serviço de maneira genérica. Consulte Explorar seus dados para obter mais informações.

Sinais clássicos

Os sinais clássicos de taxas de transferência, tempo de resposta e taxas de erros aparecem em diversos locais da interface do OpenTelemetry APM. Quando usados, eles são calculados da seguinte forma:

Para métrica, a consulta assume que os dados estão em conformidade com as convenções semânticas HTTP métrica ou RPC métrica .

Para spans, as consultas são genéricas, utilizando apenas o modelo de dados de span de nível superior. Os spans são contados para taxas de transferência e tempo de resposta se forem spans de entrada raiz em um serviço, computando usando uma heurística de WHERE span.kind = server OR span.kind = consumer. Os spans serão erros se tiverem um código de status ERROR (por exemplo, otel.status_code = ERROR).

Dados restritos com filtros

Várias páginas incluem uma barra de filtros, com opções como Limitar dados para.... Isso permite que você filtre consultas na página de acordo com os critérios. Por exemplo, você pode restringir uma implantação canário específica filtrando por service.version='1.2.3-canary'. Os filtros são preservados ao navegar entre as páginas.

Alternância de métricas ou spans

Várias páginas incluem uma alternância de métrica ou spans. Isso permite que você escolha se as consultas são orientadas por dados de amplitude ou métricos com base nos requisitos de análise e na disponibilidade de dados.

As métricas não estão sujeitas a amostragem e, portanto, são mais precisas, especialmente no cálculo de taxas como taxas de transferência. No entanto, as métricas estão sujeitas a restrições de cardinalidade e podem carecer de determinados atributos importantes para análise. Em contraste, os vãos são amostrados e, portanto, sujeitos a problemas de precisão, mas possuem atributos mais ricos, uma vez que não estão sujeitos a restrições de cardinalidade.

Historicamente, OpenTelemetry API e SDKs da linguagem e a instrumentação priorizaram trace a instrumentação . No entanto, o projeto já percorreu um longo caminho e o Métrica está disponível em quase todos os idiomas. Verifique a documentação do idioma e da instrumentação relevantes para obter mais detalhes.

Métricas clássicas

Métricas clássicas são versões de baixa cardinalidade de sinais clássicos de dados, como métricas HTTP/RPC. Eles preenchem várias experiências de plataforma, incluindo o Explorer da entidade, a página de atividades da carga de trabalho e a página de detalhes do Monitoramento de alterações. Essas métricas usam nomes como newrelic.goldenmetrics.ext.service.*.

Importante

Historicamente, as métricas clássicas OpenTelemetry foram calculadas a partir de spans. Os vãos geralmente são amostrados, então eles fornecem apenas uma imagem parcial. Agora que as métricas estão amplamente disponíveis, as métricas clássicas são calculadas usando dados métricos em vez de dados span.

Esta tradução de máquina é fornecida para sua comodidade.

Encontre serviços OpenTelemetry APM .css-21sua1{background:none;border:none;width:0;padding:0;}