Collectd: Monitorando servidores - Revista Infra Magazine 5

Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Para efetuar o download você precisa estar logado. Clique aqui para efetuar o login
Confirmar voto
0
 (2)  (0)

Nesse artigo abordam-se aspectos de monitoramento de servidores Linux utilizando as principais ferramentas do mercado, ampliando a visão do administrador e possibilitando ações preventivas no ambiente

Do que se trata o artigo:

Nesse artigo abordam-se aspectos de monitoramento de servidores Linux utilizando as principais ferramentas do mercado, ampliando a visão do administrador e possibilitando ações preventivas no ambiente, como alertar seu cliente que o consumo de recursos está aumentando e que em breve ele poderá ter problemas.

Em que situação o tema útil:

Esse artigo pode ser aplicado em qualquer empresa que possua servidores Linux que queira monitorar. O artigo é igualmente útil para empresas que estão montando sua infraestrutura de TI e desejam evitar problemas no futuro, ou para empresas que desejam aprofundar o nível de monitoramento dos sistemas em produção.

Resumo DevMan:

Neste artigo abordam-se aspectos de monitoramento de servidores Linux utilizando o collectd como ferramenta de coleta de dados e o rrdcached para armazenamento dos dados (utilizados para a geração de gráficos). Durante esta parte da configuração, demonstra-se como compilar e instalar os pacotes collectd e rrdcached no Linux. Para isso utilizam-se alguns comandos do dia-a-dia do administrador de sistemas, entre eles: yum, wget, tar, scp e chkconfig.

Para visualização dos gráficos se utiliza o collection3 como front-end. Durante esta configuração se demonstra como instalar bibliotecas Perl através do CPAN, como criar scripts de inicialização baseado nas funções padrões da Red Hat e como se faz a instalação básica do apache httpd.

O monitoramento em um ambiente de infraestrutura de TI é um dos componentes básicos que o administrador de sistemas precisa para oferecer um serviço de qualidade. Imagine ter que entrar em servidor por servidor para saber se está tudo funcionando bem em seu ambiente. Em um ambiente pequeno, isso é possível, mas desnecessário, pois esse tempo pode ser gasto em outras tarefas.

Atualmente, muitas vezes, só se sabe que algo está com problema quando o usuário final liga para informar. Isso é algo que pode ser evitado. Quando o cliente ligar para reclamar, o administrador do sistema deve conhecer quais itens estão com problema e qual a previsão para normalizar. Isso demonstra que o administrador tem controle sobre sua infraestrutura e traz confiança para seu cliente, seja ele interno ou externo. Trabalhar de forma proativa é muito melhor do que de forma reativa e para isto é necessário um processo de monitoramento bem estabelecido.

O monitoramento deve contemplar todos os itens de infraestrutura que envolvam o funcionamento normal do seu ambiente, ou seja, ativos de rede (roteadores e switches), servidores e o que mais for possível monitorar.

Um sistema de monitoramento bem definido faz com que o administrador saiba o que está acontecendo no ambiente sem sequer se autenticar em um servidor. Em outras palavras, o administrador deve conter uma tela única que aponte se existe problema no ambiente computacional ou não. Para atingir este nível de maturidade, leva-se um tempo. Portanto não é preciso se preocupar se, no início, não for possível chegar a essa situação. Um processo contínuo de revisão e melhoria deve ser instaurado até que se alcance a qualidade esperada de monitoramento.

Monitoramento de servidores

Existem dois tipos de monitoramento em servidores: monitoramento ativo e monitoramento passivo. Basicamente, o monitoramento ativo é aquele onde o servidor busca as informações no item monitorado (máquina em que se executa um processo cliente). Por sua vez, o monitoramento passivo é aquele onde o processo cliente envia os dados para o servidor de monitoramento. A arquitetura e as ferramentas para isso devem ser avaliadas de acordo com o tipo de negócio e as necessidades.

Atualmente, no ambiente computacional aplicam-se ambos os tipos de monitoramento, pois além de ter a visão do servidor, é necessário ter a visão do usuário. Explica-se: imagine monitorar de forma passiva o processo do ntpd (network time protocol daemon). O processo está rodando, mas por algum motivo, o sincronismo de horário não está sendo feito. Então, de forma ativa, monitoram-se quantos minutos o servidor está diferente do servidor ntp (Network Time Protocol). Assim, tem-se a visão do sistema operacional (processo rodando) e a visão do usuário (quantos minutos de diferença de horário). Este tipo de estratégia deve ser aplicado em todo monitoramento.

Outro item importante é chegar ao valor do limite ideal para o monitoramento. Esse valor, chamado threshold, é o valor mínimo ou máximo que o item monitorado deve trabalhar. Por experiência, definem-se valores comumente utilizados, conforme citado nas explicações a seguir. Porém é conceitualmente errado predefinir o threshold para monitoramento, pois este deve ser adequado ao ambiente que se quer monitorar. Quando estiver montando o ambiente computacional, o administrador deve gastar um tempo analisando os gráficos de utilização dos recursos para chegar aos valores ideais. Se o administrador implementar o ambiente computacional sem esta tarefa, problemas com falsos-positivos podem ocorrer. Chamam-se falso-positivos os alarmes que aparecem no monitoramento, mas não correspondem a um problema real no ambiente. Isso é um erro de configuração do monitoramento e o processo de monitoramento deve ser reavaliado.

Monitoramento passivo

O monitoramento passivo é feito por um processo cliente instalado no item monitorado que coleta as informações de tempos em tempos e envia para o servidor central. O tempo de coleta no processo cliente pode ser diferente do tempo configurado na monitoração. Por exemplo, a coleta é realizada em intervalos de um minuto e o monitoramento é realizado a cada cinco minutos. Isso pode ser útil, pois ao gerar gráficos com o intervalo menor, o administrador do sistema terá maior visibilidade do comportamento do item monitorado. Porém, quanto menor o intervalo do monitoramento, mais carga haverá no cliente e no servidor. Por isso é importante avaliar os recursos disponíveis e sua necessidade. Se o ambiente possuir muitos servidores e não houver muitos recursos para o monitoramento, é possível melhorar o ambiente com o intervalo de coleta de 5 minutos.

CPU

Para o monitoramento de CPU, geralmente utiliza-se o valor de CPU idle (ociosa) com threshold mínimo de 10% do tempo de ociosidade para critical e 20% do tempo de ociosidade para warning, ou seja, quando a utilização for maior que 80% da capacidade total da CPU, está na hora de preocupar-se em aumentar a capacidade de processamento ou adicionar mais um servidor no grupo de servidores. Porém este threshold deve ser ajustado de acordo com a característica do serviço. Por exemplo, um servidor que faz processamento de logs tem seu threshold de warning em 95% e critical em 100%, pois a característica do serviço é de alto consumo de CPU. Então, o fato da CPU estar em 90% é aceitável. Porém, para um servidor de "

A exibição deste artigo foi interrompida :(
Este post está disponível para assinantes MVP

 
Você precisa estar logado para dar um feedback. Clique aqui para efetuar o login
Receba nossas novidades
Suporte ao aluno - Deixe a sua dúvida.