Collectd: Monitorando servidores - Revista Infra Magazine 5

Do que se trata o artigo:

Nesse artigo abordam-se aspectos de monitoramento de servidores Linux utilizando as principais ferramentas do mercado, ampliando a vis�o do administrador e possibilitando a��es preventivas no ambiente, como alertar seu cliente que o consumo de recursos est� aumentando e que em breve ele poder� ter problemas.

Em que situa��o o tema �til:

Esse artigo pode ser aplicado em qualquer empresa que possua servidores Linux que queira monitorar. O artigo � igualmente �til para empresas que est�o montando sua infraestrutura de TI e desejam evitar problemas no futuro, ou para empresas que desejam aprofundar o n�vel de monitoramento dos sistemas em produ��o.

Resumo DevMan:

Neste artigo abordam-se aspectos de monitoramento de servidores Linux utilizando o collectd como ferramenta de coleta de dados e o rrdcached para armazenamento dos dados (utilizados para a gera��o de gr�ficos). Durante esta parte da configura��o, demonstra-se como compilar e instalar os pacotes collectd e rrdcached no Linux. Para isso utilizam-se alguns comandos do dia-a-dia do administrador de sistemas, entre eles: yum, wget, tar, scp e chkconfig.

Para visualiza��o dos gr�ficos se utiliza o collection3 como front-end. Durante esta configura��o se demonstra como instalar bibliotecas Perl atrav�s do CPAN, como criar scripts de inicializa��o baseado nas fun��es padr�es da Red Hat e como se faz a instala��o b�sica do apache httpd.

O monitoramento em um ambiente de infraestrutura de TI � um dos componentes b�sicos que o administrador de sistemas precisa para oferecer um servi�o de qualidade. Imagine ter que entrar em servidor por servidor para saber se est� tudo funcionando bem em seu ambiente. Em um ambiente pequeno, isso � poss�vel, mas desnecess�rio, pois esse tempo pode ser gasto em outras tarefas.

Atualmente, muitas vezes, s� se sabe que algo est� com problema quando o usu�rio final liga para informar. Isso � algo que pode ser evitado. Quando o cliente ligar para reclamar, o administrador do sistema deve conhecer quais itens est�o com problema e qual a previs�o para normalizar. Isso demonstra que o administrador tem controle sobre sua infraestrutura e traz confian�a para seu cliente, seja ele interno ou externo. Trabalhar de forma proativa � muito melhor do que de forma reativa e para isto � necess�rio um processo de monitoramento bem estabelecido.

O monitoramento deve contemplar todos os itens de infraestrutura que envolvam o funcionamento normal do seu ambiente, ou seja, ativos de rede (roteadores e switches), servidores e o que mais for poss�vel monitorar.

Um sistema de monitoramento bem definido faz com que o administrador saiba o que est� acontecendo no ambiente sem sequer se autenticar em um servidor. Em outras palavras, o administrador deve conter uma tela �nica que aponte se existe problema no ambiente computacional ou n�o. Para atingir este n�vel de maturidade, leva-se um tempo. Portanto n�o � preciso se preocupar se, no in�cio, n�o for poss�vel chegar a essa situa��o. Um processo cont�nuo de revis�o e melhoria deve ser instaurado at� que se alcance a qualidade esperada de monitoramento.

Monitoramento de servidores

Existem dois tipos de monitoramento em servidores: monitoramento ativo e monitoramento passivo. Basicamente, o monitoramento ativo � aquele onde o servidor busca as informa��es no item monitorado (m�quina em que se executa um processo cliente). Por sua vez, o monitoramento passivo � aquele onde o processo cliente envia os dados para o servidor de monitoramento. A arquitetura e as ferramentas para isso devem ser avaliadas de acordo com o tipo de neg�cio e as necessidades.

Atualmente, no ambiente computacional aplicam-se ambos os tipos de monitoramento, pois al�m de ter a vis�o do servidor, � necess�rio ter a vis�o do usu�rio. Explica-se: imagine monitorar de forma passiva o processo do ntpd (network time protocol daemon). O processo est� rodando, mas por algum motivo, o sincronismo de hor�rio n�o est� sendo feito. Ent�o, de forma ativa, monitoram-se quantos minutos o servidor est� diferente do servidor ntp (Network Time Protocol). Assim, tem-se a vis�o do sistema operacional (processo rodando) e a vis�o do usu�rio (quantos minutos de diferen�a de hor�rio). Este tipo de estrat�gia deve ser aplicado em todo monitoramento.

Outro item importante � chegar ao valor do limite ideal para o monitoramento. Esse valor, chamado threshold, � o valor m�nimo ou m�ximo que o item monitorado deve trabalhar. Por experi�ncia, definem-se valores comumente utilizados, conforme citado nas explica��es a seguir. Por�m � conceitualmente errado predefinir o threshold para monitoramento, pois este deve ser adequado ao ambiente que se quer monitorar. Quando estiver montando o ambiente computacional, o administrador deve gastar um tempo analisando os gr�ficos de utiliza��o dos recursos para chegar aos valores ideais. Se o administrador implementar o ambiente computacional sem esta tarefa, problemas com falsos-positivos podem ocorrer. Chamam-se falso-positivos os alarmes que aparecem no monitoramento, mas n�o correspondem a um problema real no ambiente. Isso � um erro de configura��o do monitoramento e o processo de monitoramento deve ser reavaliado.

Monitoramento passivo

O monitoramento passivo � feito por um processo cliente instalado no item monitorado que coleta as informa��es de tempos em tempos e envia para o servidor central. O tempo de coleta no processo cliente pode ser diferente do tempo configurado na monitora��o. Por exemplo, a coleta � realizada em intervalos de um minuto e o monitoramento � realizado a cada cinco minutos. Isso pode ser �til, pois ao gerar gr�ficos com o intervalo menor, o administrador do sistema ter� maior visibilidade do comportamento do item monitorado. Por�m, quanto menor o intervalo do monitoramento, mais carga haver� no cliente e no servidor. Por isso � importante avaliar os recursos dispon�veis e sua necessidade. Se o ambiente possuir muitos servidores e n�o houver muitos recursos para o monitoramento, � poss�vel melhorar o ambiente com o intervalo de coleta de 5 minutos.

CPU

Para o monitoramento de CPU, geralmente utiliza-se o valor de CPU idle (ociosa) com threshold m�nimo de 10% do tempo de ociosidade para critical e 20% do tempo de ociosidade para warning, ou seja, quando a utiliza��o for maior que 80% da capacidade total da CPU, est� na hora de preocupar-se em aumentar a capacidade de processamento ou adicionar mais um servidor no grupo de servidores. Por�m este threshold deve ser ajustado de acordo com a caracter�stica do servi�o. Por exemplo, um servidor que faz processamento de logs tem seu threshold de warning em 95% e critical em 100%, pois a caracter�stica do servi�o � de alto consumo de CPU. Ent�o, o fato da CPU estar em 90% � aceit�vel. Por�m, para um servidor de memcached pode-se diminuir bastante o threshold da CPU. Quando a CPU est� acima de 80% de carga de processamento o administrador deve come�ar a se preocupar para evitar futuros problemas.

Mem�ria

Quando se fala de monitoramento de mem�ria, o ideal � monitorar sempre a mem�ria utilizada e a mem�ria de buffers, pois em sistemas de alto desempenho, o papel do cache � extremamente significativo para o sistema operacional, posto que opera��es de escrita e leitura em mem�ria s�o muitas vezes mais r�pidas do que as mesmas em disco. Portanto uma parte da mem�ria total deve estar sendo para realizar cache.

Swap

Quando a �rea de swap come�a a ser utilizada � porque a mem�ria do sistema j� foi alocada e o sistema operacional precisa disponibilizar mais mem�ria para um processo. Conforme mencionado anteriormente, opera��es de escrita e leitura s�o muito mais lentas em disco do que em mem�ria. O total da mem�ria swap deve ser pequeno, sen�o o servidor perder� desempenho significativamente at� ocasionar seu pr�prio travamento. Alguns megabytes ou no m�ximo um gigabyte j� � o suficiente para um momento de maior consumo. Se o servidor em quest�o fizer swapping frequentemente, deve-se analisar o aumento da mem�ria ou alguma aplica��o com memory leak. A falha memory leak � causada quando o sistema n�o desaloca mem�ria. Sendo assim, o processo ir� consumir cada vez mais mem�ria at� ocupar toda a �rea de swap ou travar. Em casos onde n�o � necess�rio alto desempenho por todo o tempo, o uso de swap pode se tornar aceit�vel.

Sistema de arquivos

O monitoramento do sistema de arquivos � realizado por porcentagem utilizada ou quantidade de espa�o livre. O que vai determinar a melhor forma de monitorar � o tamanho do sistema de arquivos. Se o tamanho total do sistema de arquivos for pequeno (menor que 100 gigabytes), utiliza-se porcentagem de espa�o livre. Por�m, se for grande (maior que 100 gigabytes) � melhor utilizar o total de espa�o livre. O /usr normalmente tem entre 3 e 8 gigabytes. Para esse tamanho estabelece-se o threshold de 80% para warning e 90% para critical, pois este tamanho � considerado pequeno. Por�m, para um servidor de arquivos de um terabyte, � melhor monitorar por espa�o livre.

Network File System

Pelo lado do servidor, deve-se utilizar as estat�sticas do servidor Network File System (NFS), ou seja, a quantidade das chamadas de cada tipo, por exemplo: read, write, create, commit etc. Pelo lado do cliente, deve-se certificar que o sistema de arquivos esteja em modo de leitura e escrita. A forma mais comum de realizar esta monitora��o � escrever um arquivo no sistema de arquivos, medir o tempo da escrita, realizar a leitura do arquivo e medir o tempo da leitura.

Discos

Um item importante para monitorar em disco � o tempo de resposta, ou seja, quanto tempo leva cada opera��o de escrita e leitura no disco. Quanto menor for esse tempo melhor desempenho ter� seu ambiente. O tempo varia muito entre fabricantes. Se o disco � local ou storage, qual modelo de RAID adotado, se a tecnologia � SATA, SSD, Storage FC, NAS etc. Outra alternativa � a quantidade de opera��es por segundo (IOPS). Quanto maior esse valor, mais carga haver� no disco. Um valor muito alto aumentar� o tempo de resposta.

Processos

� importante observar todos os processos que precisam estar funcionais no servidor. Os processos do sistema operacional s�o mais comuns, por exemplo, syslog, ntp, sshd, crond e sendmail. Os processos de aplica��es variam bastante, sendo que os mais comuns s�o o Hypertext Transfer Protocol Daemon (httpd) ou simplesmente servidor web e os processos Java. Pode-se monitorar apenas a quantidade de processos ou threads ou ent�o entrar em um detalhamento melhor, ou seja, monitorar a quantidade de mem�ria, a quantidade de escrita e leitura, e o tempo de uso da CPU do processo espec�fico. Com as ferramentas aqui expostas, o administrador do sistema conseguir� chegar ao n�vel alto de detalhamento.

Monitoramento ativo

O monitoramento ativo pode ser feito pelo pr�prio servidor de monitoramento ou por outro servidor. Isso vai depender da quantidade de itens monitorados e da quantidade de recursos do servidor alocado para essa tarefa.

Quando o processo de monitoramento estiver atrapalhando o pr�prio monitoramento, ou seja, quando a utiliza��o dos recursos feita pelos processos que correspondem ao monitoramento dos clientes for maior que a utiliza��o dos recursos feita pelo processo do sistema de monitoramento, o administrador deve separar as tarefas em servidores diferentes.

Para definir o monitoramento ativo, deve-se cumprir basicamente duas tarefas:

1. Monitoramento de portas (TCP e UDP): O monitoramento de portas TCP/UDP consiste em um teste de conectividade na porta e protocolo determinado. Por exemplo: telnet para TCP e netcat para UDP.

2. Scripts que simulam a situa��o atual do ambiente: Esses scripts devem reproduzir as a��es do usu�rio final.

Alguns exemplos de como fazer o monitoramento ativo s�o apresentados a seguir. A Tabela 1 mostra que para monitorar o servi�o Syslog configura-se o monitoramento da porta 1514 TCP e 514 UDP. Por�m, habitualmente, n�o se cria nenhum script para monitorar o servi�o.

Servi�o	Porta	Script
Syslog	1514 TCP e 514 UDP
NTP	123 TCP e 123 UDP	Diferen�a de hor�rio
SMTP	TCP 25 e/ou 465 TCP	Envio de e-mail
SSH	TCP 22
Web Server	TCP 80	P�gina de health check
Application Server	TCP 8080	P�gina de health check
Database	TCP 1521/ TCP 3306	Query

Tabela 1. Servi�os, portas e scripts.

Para monitorar o servi�o de NTP configura-se o monitoramento da porta 123 TCP e 123 UDP e cria-se um script para monitorar a diferen�a de hor�rio entre o servidor de monitoramento e o item monitorado. Nesse caso, � preciso se certificar do hor�rio do servidor de monitoramento.

No caso de um servidor de correio eletr�nico, � preciso que o protocolo Simple Mail Transfer Protocol (SMTP) esteja funcionando no servidor. Para monitor�-lo cria-se um script que envia uma mensagem eletr�nica.

� importante destacar que, sempre que for necess�ria a autentica��o para monitorar o servi�o � por exemplo: uma query no banco de dados � � preciso ter um usu�rio espec�fico para monitoramento.

Hands on

Agora se prop�e um laborat�rio para ver as coisas funcionando! Neste artigo, demonstram-se algumas ferramentas, mas nada que impe�a o usu�rio de montar sua pr�pria arquitetura e escolher suas ferramentas. O usu�rio pode fazer seus pr�prios monitores. Por�m, se j� existe algo bom que funciona, n�o � preciso gastar tempo desenvolvendo os pr�prios monitores. Deve-se criar os pr�prios monitores em casos muitos espec�ficos, ou seja, quando n�o existir um plugin j� pronto.

O sistema operacional em quest�o � o Mac OS X 10.6.8 e o Parallels Desktop para criar as m�quinas virtuais. Deve-se criar no m�nimo tr�s servidores: um para compilar os pacotes (n�o � recomendado que se compile os pacotes no servidor que roda o servi�o), outro para representar o papel de servidor central e, por �ltimo, outro para representar o papel de cliente. Os nomes dos servidores ser�o: builder01, server01 e client01. O sistema operacional de todas as m�quinas virtuais � o CentOS 5.7 x86_64.

Na se��o de downloads da Revista Infra Magazine, disponibiliza-se dois arquivos para instala��o do Sistema Operacional. Se o usu�rio possuir o software kickstart, deve utilizar o arquivo anaconda-ks.cfg, sen�o deve usar o rpm-qa.txt. Se o usu�rio seguir esses passos, o sistema operacional dever� ter os mesmos pacotes apresentados no arquivo rpm-qa.txt. Caso ocorram problemas, o usu�rio deve verificar se todos os pacotes foram instalados corretamente.

Ap�s a instala��o do sistema operacional, � preciso configurar a rede. A m�scara de rede ser� 255.255.255.240. Assim a sub-rede pode ter at� 14 m�quinas virtuais (VM), mais que suficiente para esse caso. Os endere�os IP ser�o 10.211.55.9, 10.211.55.10 e 10.211.55.11 para os servidores builder01, server01 e client01, respectivamente. Al�m disso, cada m�quina virtual tem 1 vCPU e 512 megabytes de mem�ria RAM.

Compilando pacotes

O servidor para compilar os pacotes necess�rios para nosso laborat�rio ser� o builder01. Deve-se executar a sequ�ncia de comandos a seguir para instalar o compilador:


  # ssh 10.211.55.10
  # yum -y install gcc

O gcc � um compilador de programas na linguagem C. Em servidores de produ��o em que sua fun��o n�o � atuar como um compilador, n�o � recomendado que este pacote seja instalado, pois com um compilador C dispon�vel � muito mais complexo garantir a seguran�a no servidor.

RRDtool

O RRDtool � uma ferramenta para gerenciar dados e gr�ficos coletados de tempos em tempos. Para o ambiente proposto, o bin�rio rrdcached, que � provido pelo pacote do RRDtool, e a biblioteca librrd.h, ser�o necess�rios para compilar o plugin RRDtool e o rrdcached. Veja mais sobre isso mais adiante neste texto.

O rrdcached armazena uma quantidade pr�-configurada de dados antes de atualizar o RRD, ou seja, diminui significativamente a quantidade de escrita e leitura em disco feitas para gerar os gr�ficos. Detalhes sobre o plugin rrdcached podem ser consultados no wiki do collectd. Execute a sequ�ncia de comandos mostrada na Listagem 1 para instalar o RRDtool.

Listagem 1. Instalando o RRDtool.


  # yum -y install cairo-devel pango-devel libxml2-devel
  # cd /usr/src
  # wget http://oss.oetiker.ch/rrdtool/pub/rrdtool.tar.gz
  # tar xzvf rrdtool.tar.gz
  # cd rrdtool-1.4.7/
  # ./configure --prefix=/opt/rrdtool-1.4.7
  # make && make install

O comando yum � utilizado para gerenciar os pacotes do sistema operacional.

O comando wget � utilizado para baixar arquivos da internet. Provavelmente, de dentro da rede, o usu�rio n�o ter� acesso para baixar arquivos da internet. Assim, o usu�rio deve solicitar o acesso ou baixar os c�digos fontes e copi�-los para o servidor.

O tar � um comando para compactar/descompactar arquivos. A Tabela 2 apresenta alguns par�metros para utiliza-lo. Para consultar todos os par�metros, deve-se executar o comando man tar.

Par�metro	Funcionalidade
x	Descompactar o arquivo
c	Compactar o arquivo
z	Utilizar gzip na descompacta��o/compacta��o
v	Imprimir no STDOUT os arquivos que est�o sendo descompactados/compactados
f	Especifica o nome do arquivo

Tabela 2. Par�metros do comando tar.

O pr�ximo comando � o configure, que � um script padr�o contido em todos os arquivos fontes para o usu�rio preparar o sistema. Se quiser conhecer mais sobre, deve-se executar o comando ./configure --help. O comando make compila os c�digos fontes para gerar os bin�rios, bibliotecas, arquivos de configura��o, documentos etc. A inclus�o do par�metro && significa que se o comando make for executado com sucesso o pr�ximo comando ser� executado em seguida. Caso contr�rio, o comando seguinte n�o ser� executado.

O comando make install instala, isto �, copia todos os arquivos gerados pelo comando make para o caminho informado atrav�s do par�metro --prefix do script de configure.

Collectd

O collectd � um agente de monitoramento bastante utilizado atualmente. Foi escrito visando consumir o m�nimo de recursos poss�veis. Para monitorar os recursos � preciso utilizar outros recursos, por isso o coletor de dados deve ser o mais leve poss�vel. O collectd e a maioria dos plugins foram escritos na linguagem de programa��o C, portanto utilizam pouco recurso do servidor monitorado. O usu�rio pode ter um servidor para gerar os gr�ficos ou ent�o o pr�prio servidor monitorado pode gerar os gr�ficos. Deve-se avaliar bem a segunda alternativa, pois gerar gr�ficos usa muitas opera��es de escrita em disco.

Seguem algumas caracter�sticas do collectd:

� Possui um escalonador pr�prio. Deste modo, n�o tem aquele velho conhecido problema do cron de n�o rodar os scripts ou de precisar de um sistema de automa��o pago;

� Possui muitos plugins para monitorar diversos servi�os. Exemplos: httpd, nginx, mysql, oracle, smtp etc.

O collectd � uma ferramenta muito bem documentada. No wiki (http://collectd.org/wiki/index.php) encontra-se uma explica��o detalhada sobre cada funcionalidade, ou seja, cada item de configura��o e plugin dispon�vel.

Preparar a instala��o

Este � um ponto crucial. Aqui o usu�rio deve preparar seu sistema, ou seja, habilitar todos os plugins que utilizar�. Por padr�o, o script ./configure do collectd tenta compilar todos os plugins, por�m ele s� habilitar� os plugins cujo as bibliotecas necess�rias estiverem dispon�veis.

Com os pacotes instalados anteriormente, nem todos os plugins estar�o habilitados, pois nem todas as bibliotecas necess�rias para a compila��o dos plugins est�o instaladas. Instale o pacote de acordo com o plugin que quer habilitar conforme a Tabela 3.

Plugin	Pacote
Generic	libgcrypt-devel e libxml2-devel
apache, ascent, bind, curl, curl_xml, nginx e write_http	curl-devel
Dbi	libdbi-devel
MySQL	MySQL-devel
DNS	libpcap-devel
Libvirt	libvirt-devel
Sensors	lm_sensors-devel
SNMP	net-snmp-devel
notify_desktop	libnotify-devel e gtk2-devel
PostgreSQL	postgresql84-devel
Python	python-devel

Tabela 3. Plugins e pacotes.

Ap�s instalar todas as bibliotecas necess�rias, execute a sequ�ncia de comandos da Listagem 2. Se nunca usou o CPAN e n�o sabe configur�-lo, quando for execut�-lo pela primeira vez, ele solicitar� as informa��es necess�rias para funcionar. Assim, basta escolher sempre a resposta padr�o que j� vem informada no prompt. CPAN (www.cpan.org) � onde se encontram todos os c�digos e m�dulos Perl.

Listagem 2. Instalando o collectd.


  # cd /usr/src
  # wget http://collectd.org/files/collectd-5.0.1.tar.gz
  # tar xzvf collectd-5.0.1.tar.gz
  # cd collectd-5.0.1 
  # ./configure --prefix=/opt/collectd-5.0.1 --enable-debug --with-librrd=/opt/rrdtool-1.4.7
  # make && make install
  # mkdir /opt/collectd-5.0.1/contrib
  # cp /usr/src/collectd-5.0.1/contrib/redhat/init.d-collectd /opt/collectd-5.0.1/contrib/
  # sed -i 's/\/etc\/collectd.conf/\/opt\/collectd\/etc\/collectd.conf/g' /opt/collectd-5.0.1/contrib/init.d-collectd
  # sed -i 's/\/usr\/sbin\/collectd/\/opt\/collectd\/sbin\/collectd/g' /opt/collectd-5.0.1/contrib/init.d-collectd
  # # sed -i 's/\"collectdmon\"/\/opt\/collectd\/sbin\/collectdmon/g' /opt/collectd-5.0.1/contrib/init.d-collectd
  # perl -MCPAN -e 'install HTML::Entities, Config::General, URI::Escape, Regexp::Common'
  # tar czvf perl-HTML-Entities.tar.gz /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/HTML/Entities.pm
  # tar czvf perl-Config-General.tar.gz /usr/lib/perl5/site_perl/5.8.8/Config/General /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Config/General /usr/lib/perl5/site_perl/5.8.8/Config/General.pm
  # tar czvf perl-URI-Escape.tar.gz /usr/lib/perl5/site_perl/5.8.8/URI/Escape.pm
  # tar czvf perl-Regexp-Common.tar.gz /usr/lib/perl5/site_perl/5.8.8/Regexp/Common /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Regexp/Common /usr/lib/perl5/site_perl/5.8.8/Regexp/Common.pm
  # tar czvf perl-HTML-Parser.tar.gz /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/HTML/Parser.pm /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/HTML/Parser
  # cd /usr/src/collectd-5.0.1/contrib/
  # tar czvf /opt/collection3.tar.gz collection3

Os gr�ficos que ser�o gerados pelo collectd ser�o armazenados em um RRD. Devido � forma de armazenamento do RRD para visualizar os gr�ficos, precisa-se de um sistema front-end, ou seja, um sistema para nos mostrar os dados que o collectd est� coletando. Existem v�rios atualmente, como collection3, collectgraph, heymon, entre outros. Neste artigo aborda-se o collection3.

Enviando os arquivos para outros servidores

Ap�s compilar e instalar o collectd, deve-se copiar os arquivos para o servidor que executar� a tarefa. Para isso, crie um arquivo compactado no formato tar de cada sistema instalado, ou seja, RRDtool, collectd e collection3. Execute a lista de comandos da Listagem 3.

Listagem 3. Copiando arquivos para servidor e cliente.


  # cd /opt
  # tar czvf rrdtool-1.4.7.tar.gz rrdtool-1.4.7/
  # scp rrdtool-1.4.7.tar.gz 10.211.55.10:/opt/
  # tar czvf collectd-5.0.1.tar.gz collectd-5.0.1
  # scp collectd-5.0.1.tar.gz 10.211.55.10:/opt/
  # scp collection3.tar.gz perl-* 10.211.55.10:/opt/
  # scp collectd-5.0.1.tar.gz 10.211.55.11:/opt/

O leitor realizou as seguintes atividades: entrou no diret�rio onde os arquivos foram instalados, compactou os arquivos do RRDtool e copiou o tar para o servidor de monitoramento, server01. Depois, fez a mesma coisa com o collectd e enviou para ambos os servidores, client01 e server01. O builder01 � o servidor onde gera-se os pacotes, portanto n�o se deve copiar nada para ele.

Configurando client01

O client01 ser� o servidor monitorado. Portanto instale o collectd e configure o envio dos dados para o server01. Para isso, execute a sequ�ncia de comandos da Listagem 4.

Listagem 4. Configurando collectd no cliente.


  # cd /opt
  # tar xzvf collectd-5.0.1.tar.gz
  # ln -s /opt/collectd-5.0.1 /opt/collectd
  # ln -s /opt/collectd/contrib/init.d-collectd /etc/init.d/collectd
  # vi /opt/collectd/etc/collectd.conf

Crie um link simb�lico para organiza��o dos seus pacotes, utilizando o comando ln, de acordo com a Listagem 4. Muitas vezes � preciso manter duas ou mais vers�es do sistema no servidor, geralmente em caso de atualiza��o. Assim, deve-se apontar o script de inicializa��o do collectd para o caminho especificado no link simb�lico.

Dessa forma, n�o ser� preciso fazer atualiza��es do script de inicializa��o somente por causa de uma atualiza��o de vers�o do collectd, pois o nome do link simb�lico permanecer� o mesmo, apesar da altera��o da vers�o. Outra vantagem de criar o link simb�lico � que o usu�rio saber� mais facilmente qual vers�o est� em funcionamento.

� importante destacar que neste texto, apenas os principais par�metros do arquivo de configura��o do collectd s�o abordados. Por�m existem muitas outras funcionalidades que podem ser conhecidas no arquivo de configura��o e tamb�m no wiki (http://collectd.org/wiki/index.php).

Neste momento o arquivo do collectd deve ser editado com os seguintes par�metros:

� #Interval 10: indica o intervalo de coleta. Vem comentado, pois o intervalo padr�o � de 10 segundos. Neste caso altere para 60 segundos, ou seja, um minuto e remova o coment�rio;

� #ReadThreads 5: Indica a quantidade de threads que o collectd utilizar� para fazer as coletas. Nesse caso n�o se deve alterar;

� LoadPlugin syslog: Vem habilitado por padr�o. Comente a linha, pois o log ser� espec�fico, ou seja, ao inv�s de enviar os logs para o syslog, vamos criar um arquivo separado. Desta forma fica mais f�cil verificar os logs;

� #LoadPlugin logfile: Vem desabilitado por padr�o, remova o coment�rio para habilit�-lo. A configura��o do plugin ficar� conforme apresentado na Listagem 5 e a explica��o dos par�metros aparece a seguir:

o LogLevel: debug, info ou error. Debug para imprimir todos os logs; info para imprimir logs informativos e de erros; e error para apenas imprimir logs de erros;

o File: Arquivo onde ser� gerado o log. As aspas duplas n�o devem ser esquecidas;

o Timestamp: true ou false. Imprimir ou n�o a data no log. Para conseguir investigar problemas ou erros s�o necess�rias as informa��es da data no log;

o PrintSeverity: true ou false. Imprimir ou n�o loglevel no arquivo de log.

Em seguida retire os coment�rios de alguns plugins, removendo o caractere #:

� #LoadPlugin contextswitch: Vem desabilitado por padr�o, mas deve ser habilitado. Esse plugin monitora a troca de contexto da CPU. N�o � necess�ria nenhuma configura��o;

� #LoadPlugin df: Vem desabilitado por padr�o, mas deve ser habilitado. Este plugin monitora todos os sistemas de arquivos. N�o � necess�ria nenhuma configura��o;

� #LoadPlugin disk: Vem desabilitado por padr�o, mas deve ser habilitado e configurado conforme a Listagem 6. Este plugin monitora os discos, quantidade de IOPS, response time etc.;

� #LoadPlugin network: Vem desabilitado por padr�o, mas deve ser habilitado e configurado conforme a Listagem 7. Esse � o plugin que envia os dados para o servidor;

� #LoadPlugin swap: Vem desabilitado por padr�o, mas deve ser habilitado. Esse plugin monitora o swap;

� # LoadPlugin protocols: Vem desabilitado por padr�o, mas deve ser habilitado. Esse plugin monitora os protocolos de rede (TCP, UDP, ICMP etc.);

� #LoadPlugin tcpconns: Vem desabilitado por padr�o, mas deve ser habilitado. Esse plugin monitora a quantidade de conex�es por determinado estado (established, listen, time_wait etc.);

� #LoadPlugin uptime: Vem desabilitado por padr�o, mas deve ser habilitado. Esse plugin monitora o tempo que o sistema operacional est� ligado;

� #LoadPlugin users: Vem desabilitado por padr�o, mas deve ser habilitado. Esse plugin monitora a quantidade de usu�rios com sess�o aberta no servidor.

Listagem 5. Configura��o do plugin logfile.


  <Plugin logfile>
    LogLevel info
    File �/opt/collectd/var/log/collectd.log�
    Timestamp true
    PrintSeverity true
  </Plugin>

Listagem 6. Configura��o do Plugin disk.


  <Plugin disk>
    Disk "/^[h|s]d[a-f][0-9]?$/"
    # IgnoreSelected false
  </Plugin>

Listagem 7. Configura��o do plugin network cliente.


  <Plugin network>
    # cliente setup:
    Server "10.211.55.10" "25566"
  </Plugin>

O arquivo que est� sendo editado deve ser salvo como collectd.conf.

Demonstra-se a seguir algumas configura��es adicionais que podem ser aplicadas no arquivo collectd.conf, se desejar monitorar o servi�o.

O Postfix, por exemplo, � um sistema de e-mail bastante completo e utilizado. Observe a Listagem 8 para verificar como monitorar uma fila de e-mails. Al�m disso, adicione o texto LoadPlugin filecount no arquivo collectd.conf.

Listagem 8. Monitorando a fila do postfix.


  <Plugin filecount>
    <Directory "/var/spool/postfix/active/">
      Instance "active"
    </Directory>
    <Directory "/var/spool/postfix/bounce/">
      Instance "bounce"
    </Directory>
    <Directory "/var/spool/postfix/corrupt/">
      Instance "corrupt"
    </Directory>
    <Directory "/var/spool/postfix/deferred/">
      Instance "deferred"
    </Directory>
    <Directory "/var/spool/postfix/incoming/">
      Instance "incoming"
    </Directory>
    <Directory "/var/spool/postfix/hold/">
      Instance "hold"
    </Directory>
  </Plugin>

O banco de dados MySQL � atualmente utilizado por empresas de grande porte e diversas solu��es de c�digo aberto. Observe a Listagem 9 para configurar o monitoramento da inst�ncia MySQL. Al�m disso, adicione o texto LoadPlugin mysql no arquivo collectd.conf.

Listagem 9. Monitorando o MySQL.


  <Plugin mysql>
    <Database mysql>
      Database "mysql"
    </Database>
  </Plugin>

Conforme mencionado anteriormente, o servi�o de NTPD � respons�vel pelo sincronismo do hor�rio. Para habilitar sua monitora��o, adicione a linha abaixo no arquivo de configura��o do collectd:

LoadPlugin ntpd

Para concluir, � importante monitorar os processos do sistema operacional. Observe na Listagem 10 um exemplo de configura��o do plugin para isso. Em seguida, insira o texto LoadPlugin processes no arquivo collectd.conf.

Listagem 10. Monitorando processos do SO.


  <Plugin processes>
    Process "klogd"
    Process "syslogd"
    Process "portmap"
    Process "crond"
    Process "sshd"
    Process "httpd"
    Process "mysqld"
    Process "mysqld_safe"
    Process "ntpd"
    Process "collectdmon"
    Process "collectd"
  </Plugin>

At� este momento, apenas algumas configura��es pr�vias necess�rias foram feitas para que o servi�o do collectd funcione adequadamente. Agora � preciso definir como o collectd ser� instanciado quando a m�quina monitorada for inicializada. Isso � feito ao se executar a sequ�ncia de comandos da Listagem 11.

Listagem 11. Inicializa��o do collectd cliente.


  # chmod +x /etc/init.d/collectd
  # /etc/init.d/collectd start
  # tail -f /opt/collectd/var/log/collectd.log
  # chkconfig --add collectd
  # chkconfig --list collectd

Segue a explica��o dos comandos executados:

1. Adi��o da permiss�o de execu��o para o script de inicializa��o do collectd;

2. Inicializa��o do daemon;

3. Leitura das �ltimas linhas do arquivo e apresenta��o das pr�ximas linhas escritas. Com isso verifica-se a ocorr�ncia de algum erro durante o processo de inicializa��o do collectd;

4. Adi��o do script de inicializa��o do collectd para ser executado no boot do servidor;

5. Listagem dos run level e verifica��o se o script � executado ou n�o.

Configurando server01

O servidor server01 ser� o servidor de monitoramento. Ele receber� os dados do collectd cliente para gerar os gr�ficos e fazer o monitoramento. Execute a sequ�ncia de comandos da Listagem 12 para configurar o RRDtool. O conte�do do arquivo /etc/init.d/rrdcached � apresentado na Listagem 13. Este arquivo � o script de inicializa��o do rrdcached. N�o vem dispon�vel no c�digo fonte, por isso disponibiliza-se um caso necessite.

Listagem 12. Configura��o do RRDtool no servidor.


  # cd /opt
  # tar xzvf rrdtool-1.4.7.tar.gz
  # ln -s /opt/rrdtool-1.4.7 /opt/rrdtool
       
  # vi /etc/init.d/rrdcached
  # chmod +x /etc/init.d/rrdcached 
  # /etc/init.d/rrdcached start
  # /etc/init.d/rrdcached status
  # chkconfig --add rrdcached
  # chkconfig --list rrdcached

Listagem 13. Arquivo de inicializa��o do rrdcached.


  #!/bin/bash
  #
  # by Thiago Nache > thiago.borges@tivit.com.br || thiagonbcarvalho@gmail.com # 20111229
  #
  # chkconfig: 2345 15 85
  # description: script to management rrdcached
  # processname: rrdcached
   
  # enviroment
  RRDCACHEDBIN="/opt/rrdtool/bin/rrdcached"
  RRDCACHEDPARAMS=" -l /var/run/rrdcached.sock -w 1200 -z 480 -t 36 -F > /dev/null 2>&1"
   
  # source function library
  . /etc/init.d/functions
   
  RETVAL=0
   
  start() {
    echo -n $"Starting rrdcached service: "
   
    if [ ! -x ${RRDCACHEDBIN} ];
    then
      echo -n $"Cannot execute rrdcached bin: ${RRDCACHEDBIN}!"
    fi
   
    daemon "${RRDCACHEDBIN} ${RRDCACHEDPARAMS}"
    RETVAL=$?
    echo
  }
   
  stop() {
    echo -n $"Shutting down rrdcached service: "
    killproc ${RRDCACHEDBIN}
    RETVAL=$?
   
    echo
  }
   
  case "$1" in
    start)
      start
      ;;
    stop)
      stop
      ;;
    restart|reload)
      stop
      sleep 2
      start
      ;;
    status)
      status ${RRDCACHEDBIN}
      RETVAL=$?
      ;;
    *)
      echo $"Usage: $0 {start|stop|restart|status}"
      exit 1
  esac
   
  exit $RETVAL

Conforme o par�metro �w (em segundos) contido no script de inicializa��o, os gr�ficos ser�o atualizados a cada vinte minutos. Deve-se adequ�-lo conforme o ambiente a se monitorar. Se o intervalo for pequeno, a quantidade de entrada e sa�da (I/O) gerada pelo collectd n�o diminuir� muito. Se for muito alto demorar� muito para ver os gr�ficos.

A configura��o inicial do collectd ser� exatamente igual aos passos da configura��o do cliente. Portanto, deve-se executar a sequ�ncia de comandos da Listagem 4 at� a parte de editar o arquivo collectd.conf. Vamos ent�o conhecer o que difere a partir deste ponto.

Resumindo, a diferen�a da configura��o do collectd � que os plugins UnixSock e rrdcached s�o carregados (eles n�o s�o utilizados na configura��o do cliente) e o plugin network ter� configura��o diferente. Ao inv�s de informar o servidor, cria-se uma porta em estado de receber conex�o (listening).

O plugin UnixSock � necess�rio para conseguir ler os dados do collectd server. Observe a configura��o do mesmo na Listagem 14. Para concluir esta etapa, adicione LoadPlugin unixsock no arquivo collectd.conf.

Listagem 14. Configura��o do plugin unixsock.


  <Plugin unixsock>
    SocketFile "/var/run/collectd-unixsock"
    SocketGroup "root"
    SocketPerms "0666"
    # DeleteSocket false
  </Plugin>

Analisando os par�metros:

� SocketFile: Indica o caminho onde o socket ser� criado;

� SocketGroup: Indica o grupo que � o dono do arquivo;

� SocketPerms: Indica a permiss�o do socket.

O plugin rrdcached, por sua vez, armazenar� os dados do RRD em mem�ria cache. Observe a Listagem 15 para saber como configur�-lo. Para findar esta etapa, adicione LoadPlugin rrdcached no arquivo collectd.conf.

Listagem 15. Configura��o do plugin rrdcached.


  <Plugin rrdcached>
    DaemonAddress "unix:/var/run/rrdcached.sock"
    DataDir "/opt/collectd-5.0.1/var/lib/collectd/rrd"
    CreateFiles true
    CollectStatistics true
  </Plugin>

Analisando os par�metros:

� DaemonAddress: Indica o caminho para o socket. Esse caminho deve ser o mesmo que o do script de inicializa��o do rrdcached;

� DataDir: Indica o diret�rio onde os rrds ser�o criados;

� CreateFiles: true ou false. Sempre configure como true, pois do contr�rio os arquivos nunca ser�o criados;

� CollectStatistics: true ou false. Op��o para gerar ou n�o os gr�ficos de estat�sticas do rrdcached.

J� no plugin network, configura-se o endere�o IP e a porta que o collectd ir� receber as conex�es. A configura��o do mesmo � apresentada na Listagem 16. Assim como realizado nos passos anteriores, adicione LoadPlugin network no arquivo collectd.conf.

Listagem 16. Configura��o do plugin network servidor.


  <Plugin network>
    # server setup:
    Listen "10.211.55.10" "25566"
  </Plugin>

Como mencionado anteriormente, ser� necess�rio um front-end para exibir os gr�ficos. Dessa forma, para configurar o collection3, execute a sequ�ncia de comandos da Listagem 17. O conte�do do arquivo /etc/httpd/conf.d/colletion3 � exibido na Listagem 18.

Listagem 17. Configurando o collection3 no servidor.


  # yum -y install httpd
  # vi /etc/httpd/conf.d/collection3
  # cp -r /opt/collectd-5.0.1/lib/perl5/site_perl/5.8.8/Collectd /usr/lib/perl5/site_perl/5.8.8/
  # cp -r /opt/rrdtool-1.4.7/lib/perl/5.8.8/x86_64-linux-thread-multi/* /usr/lib/perl5/site_perl/5.8.8/
  # cd /opt
  # tar xzvf perl-HTML-Entities.tar.gz -C /
  # tar xzvf perl-HTML-Parser.tar.gz -C /
  # tar xzvf perl-Config-General.tar.gz -C /
  # tar xzvf perl-URI-Escape.tar.gz -C /
  # tar xzvf perl-Regexp-Common.tar.gz -C /
  # tar xzvf collection3.tar.gz -C /var/www/html/
  # chown -R apache: /var/www/cgi-bin/collection3/
  # echo "DataDir \"/opt/collectd-5.0.1/var/lib/collectd/rrd\"" >> /var/www/cgi-bin/collection3/etc/collection.conf
  # echo "UnixSockAddr \"/var/run/collectd-unixsock\"" >> /var/www/cgi-bin/collection3/etc/collection.conf

Listagem 18. Configura��o do collection3 para o httpd.

<Directory "/var/www/html/collection3/bin/">
    AllowOverride None
    Options +ExecCGI
    Order allow,deny
    Allow from all   
  </Directory>

Nestas listagens instala-se o Apache httpd atrav�s do yum, configura-se um virtual host para o collection3 e descompacta-se as bibliotecas Perl.

Conclus�o

Por fim, se todas as configura��es e comandos sugeridos foram realizados com sucesso, o browser apresentar� os gr�ficos quando apontado para o endere�o http://10.211.55.10/cgi-bin/collection3/bin/index.cgi. Lembre-se de considerar o tempo de atualiza��o do rrdcached, pois configuramos para atualizar a cada 20 minutos.

Pronto, o monitoramento passivo est� finalizado. Os dados j� est�o sendo monitorados e disponibilizados. Para completar sua infraestrutura de monitoramento, os pr�ximos passos s�o analisar o ambiente para definir os thresholds e configurar um software para gerar os alertas.

Links

Site do collectd
http://collectd.org

Wiki sobre o Collectd
http://collectd.org/wiki/index.php/Main_Page

Site do RRDtool
http://oss.oetiker.ch/rrdtool/

Wiki sobre o RRDtool
http://oss.oetiker.ch/rrdtool-trac/

Documenta��o do RRDtool
http://oss.oetiker.ch/rrdtool/doc/index.en.html

Site do CPAN
http://www.cpan.org