O New Relic se integra ao Amazon Web Services (AWS) usando o Amazon CloudWatch Metric Streams. Ao instalar a integração CloudWatch Metric Streams , você pode acessar métricas e dados do Amazon MemoryDB na plataforma New Relic .
Este documento explica como ativar a integração e descreve os tipos de dados relatados após a ativação.
Recurso
Colete dados de telemetria sobre seu cluster Amazon MemoryDB para que você possa monitor seus serviços, consultar dados recebidos e criar painéis para observar tudo rapidamente.
Ativar integração
Essa integração está disponível por meio do CloudWatch MetricStreams. Para habilitar essa integração, saiba como conectar serviços da AWS ao New Relic por meio da integração do CloudWatch Metric Streams.
Encontre e use dados
Para encontrar seus dados de integração, vá para one.newrelic.com > All capabilities > Metrics and events e filtre por aws.memorydb
.
Dados métricos
Esta integração coleta dados do Amazon MemoryDB.
Dados do cluster MemoryDB
Métrica | Unidade | Descrição |
---|---|---|
| Número | O número de realocações de valores por minuto executadas pelo processo de desfragmentação ativo. Isso é derivado da estatística active_defrag_hits no INFO. |
| Contar | O número total de tentativas malsucedidas de autenticação usando o comando AUTH. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizado. |
| Bytes | O número total de bytes alocados pelo MemoryDB para todos os propósitos, incluindo o conjunto de dados, buffers e assim por diante. |
| Bytes | O número total de bytes lidos do disco por minuto. Suportado somente para cluster usando nível de dados. |
| Bytes | O número total de bytes gravados no disco por minuto. Suportado somente para cluster usando nível de dados. |
| Contar | O número total de tentativas malsucedidas do usuário de executar comandos que ele não tem permissão para chamar. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizado. |
| Contar | O número de conexões de clientes, excluindo conexões de réplicas de leitura. O MemoryDB usa de 2 a 4 conexões para monitor o cluster em cada caso. Isso é derivado da estatística connected_clients em INFO. |
| Contar | O número de itens no cache. Isso é derivado da estatística do keyspace, somando todas as chaves em todo o keyspace. |
| Por cento | Porcentagem da memória disponível para o cluster que está em uso. Isso é calculado usando used_memory/maxmemory de INFO. |
| Por cento | Porcentagem da capacidade total de dados do cluster que está em uso. No nível de instância de dados, a métrica é calculada como (used_memory - mem_not_counted_for_evict + SSD used) / (maxmemory + SSD total capacity), onde used_memory e maxmemory são obtidos de INFO. Em todos os outros casos, a métrica é calculada usando used_memory/maxmemory. |
| Milissegundos | Expõe avg_ttl do DBO da estatística de keyspace do comando INFO. |
| Por cento | Fornece utilização de CPU do thread do mecanismo Valkey ou Redis OSS. Como o mecanismo é de thread único, você pode usar essa métrica para analisar a carga do próprio processo. A métrica EngineCPUUtilization fornece uma visibilidade mais precisa do processo. Você pode usá-lo em conjunto com a métrica CPUUtilization. CPUUtilization expõe a utilização da CPU para a instância do servidor como um todo, incluindo outros processos de gerenciamento e sistema operacional. Para tipos de nós maiores com quatro vCPUs ou mais, use a métrica EngineCPUUtilization para monitor e definir limites de dimensionamento. |
| Contar | O número de chaves que foram removidas devido ao limite de maxmemory. Isso é derivado da estatística evicted_keys no INFO. |
| Contar | Indica se o nó é o nó primário do fragmento atual. A métrica pode ser 0 (não primária) ou 1 (primária). |
| Contar | O número total de tentativas frustradas de usuários para acessar chaves para as quais eles não têm permissão. Você pode encontrar mais informações sobre falhas de autenticação individuais usando o comando ACL LOG. Sugerimos definir um alarme para detectar tentativas de acesso não autorizado. |
| Contar | O número de pesquisas de chaves somente leitura bem-sucedidas no dicionário principal. Isto é derivado da estatística keyspace_hits no INFO. |
| Contar | O número de pesquisas de chaves somente leitura malsucedidas no dicionário principal. Isso é derivado da estatística keyspace_misses no INFO. |
| Contar | O número de chaves sendo rastreadas pelo key tracking como uma porcentagem de tracking-table-max-keys. O key tracking é usado para auxiliar o cache do lado do cliente e notifica os clientes quando as chaves são modificadas. |
| Bytes por segundo | As taxas máximas de replicação observadas de transferência durante o último ciclo de medição. |
| Número | Indica a eficiência na alocação de memória do mecanismo Valkey ou Redis OSS. Certos limites significam comportamentos diferentes. O valor recomendado é ter fragmentação acima de 1,0. Isso é calculado a partir da estatística mem_fragmentation_ratio de INFO. |
| Contar | O número total de conexões que foram aceitas pelo servidor durante este período. Isso é derivado da estatística total_connections_received em INFO. |
| Contar | O número total de itens recuperados do disco por minuto. Suportado somente para cluster usando nível de dados. |
| Contar | O número total de itens gravados no disco por minuto. Suportado somente para cluster usando nível de dados. |
| Boleano | Este status tem dois valores: 0 ou 1. O valor 0 indica que os dados no nó primário do MemoryDB não estão sincronizados com o mecanismo Valkey ou Redis OSS no EC2. O valor 1 indica que os dados estão sincronizados. |
| Contar | O número total de eventos de expiração de chave. Isso é derivado da estatística expired_keys em INFO. |
| Bytes | Para nós em uma configuração replicada, ReplicationBytes relata o número de bytes que o primário está enviando para todas as suas réplicas. Esta métrica é representativa da carga de gravação no cluster. Isso é derivado da estatística master_repl_offset em INFO. |
| Contar | Número de comandos de gravação que foram atrasados devido à replicação síncrona. A replicação pode ser atrasada devido a vários fatores, por exemplo, congestionamento de rede ou excesso de taxas máximas de replicação de transferência. |
| Segundos | Esta métrica só é aplicável a um nó em execução como uma réplica de leitura. Representa o quão atrasada, em segundos, a réplica está na aplicação de alterações do nó primário. |
Criar alerta
Você pode configurar para notificá-lo se houver alguma alteração. Por exemplo, você pode configurar um alerta para notificar as partes relevantes sobre erros críticos ou fatais.
Saiba mais sobre como criar alertas aqui.