Monitorando ativos de rede e servi�os - Revista Infra Magazine 7

Do que se trata o artigo:

Nesse artigo abordaremos aspectos de monitoramento de ativos de redes utilizando as principais ferramentas open source. Perceberemos que estas ferramentas s�o ricas em recursos, possuindo diferentes abordagens que garantem o total controle da infraestrutura de redes.

Em que situa��o o tema �til:

Esse artigo � interessante para todas as empresas que utilizam infraestrutura de TI. Com o conte�do aqui exposto consegue-se garantir que a infraestrutura de redes esteja funcional. Veremos que atrav�s das abordagens apresentadas neste artigo o administrador poder� controlar o crescimento da utiliza��o da infraestrutura e prever seu crescimento antes da ocorr�ncia de problemas.

Resumo DevMan:

Neste artigo discutiremos o monitoramento de ativos de redes utilizando o protocolo SNMP e abordaremos alguns aspectos em servidores Linux como, por exemplo, instalar m�dulos atrav�s do CPAN e gerenciar pacotes RPM. Explicaremos como funciona o monitoramento de uma infraestrutura de redes e demonstraremos algumas configura��es. Para isso, utilizaremos pacotes do Linux para simular os equipamentos de rede e criaremos o monitoramento baseado em Nagios.

Em uma infraestrutura de TI, a fun��o dos equipamentos de rede � imprescind�vel para o correto funcionamento dos outros componentes. Se a comunica��o de rede n�o estiver funcionando corretamente, os servi�os podem se comportar de maneira inesperada e com certeza gerar�o problemas.

Neste artigo abordaremos como monitorar os equipamentos de rede de forma abrangente para que o administrador possa agir antes do problema acontecer.

Para monitorar equipamentos de rede podemos fazer uso de recursos dispon�veis nos pr�prios equipamentos. Mas para que voc� consiga monitorar o equipamento � preciso que o mesmo tenha suporte ao protocolo SNMP (Simple Network Management Protocol). Atualmente, a grande maioria dos equipamentos j� possui esta funcionalidade. No entanto, � importante citar que a grande maioria dos equipamentos n�o possui as configura��es necess�rias para o monitoramento definidas como padr�o, ent�o consulte o administrador de rede ou veja no manual do equipamento como habilitar tais configura��es.

O SNMP � um protocolo exclusivo para gerenciar ativos de rede. Ele � quem gerencia as informa��es do equipamento, ou seja, o protocolo � respons�vel pela coleta e disponibiliza��o dos valores. Com o protocolo SNMP voc� pode ler e gravar informa��es. Por�m, para fins de monitoramento, utiliza-se apenas o recurso de leitura das informa��es, pois quem coleta e grava os valores � o pr�prio sistema do equipamento. Neste artigo, utilizaremos a vers�o 3 do protocolo SNMP, que exige autentica��o por usu�rio e senha. Portanto, certifique-se que exista um usu�rio espec�fico para o monitoramento e apenas com permiss�o de leitura.

Para que o protocolo saiba o que coletar e onde ele deve gravar cada valor, disponibiliza-se a MIB (Management Information Base). Esta base de dados fornecer� v�rios identificadores de objetos (OID) que nos dir�o a quem pertence aquele valor. Por exemplo: o identificador de objeto 1.3.6.1.4.1.789.1.2.1.4 se refere ao valor de CPU idle (ociosa) de alguns switches Cisco. Certifique-se que esta base de informa��es foi carregada no equipamento que se quer monitorar. Como cada equipamento possui sua pr�pria MIB, deve vir junto com o equipamento ou estar dispon�vel no site do fabricante.

A MIB de estat�sticas de utiliza��o da rede � a mais comum entre todos os ativos de rede. Ela � organizada atrav�s de �ndices chamados ifIndex. Durante o monitoramento, cada porta do seu ativo de rede receber� um ID sequencial para que voc� consiga localizar a informa��o de cada porta separadamente.

A forma ativa de monitoramento do SNMP � feita atrav�s de requisi��es que podem ser GetRequest, GetNextRequest ou GetBulkRequest. Para minimizar o impacto gerado pelo monitoramento, utilize o GetRequest, pois se utilizadas muitas requisi��es GetNextRequest ou poucas requisi��es GetBulkRequest, voc� consumir� muito recurso do ativo de rede e isto n�o � bom.

Al�m da forma ativa de monitoramento, o SNMP tamb�m disponibiliza o SNMPTrap. Um trap consiste no envio de um identificador (OID) quando ocorrer determinado evento no equipamento. Por exemplo: para o evento de queda de conectividade (link down) e restabelecimento de conectividade (link up), � enviado um identificador X para o servidor de monitoramento. Dado esta informa��o, entende-se que o servidor de monitoramento precisar� de um sistema que entenda o que significa este identificador e envie a mensagem para o sistema de monitoramento.

SNMP Trap Translator

O SNMP Trap Translator ou SNMPTT � um projeto de c�digo aberto para integrar o daemon snmptrapd com o sistema de monitoramento Nagios (explicado mais adiante).

O projeto consiste em diversos scripts Perl (ler Nota DevMan 1) para realizar diversas tarefas, entre elas a de ser o traphandle, ou seja, quem recebe a sa�da do daemon snmptrapd e as traduz para o Nagios. O daemon snmptrapd � um bin�rio do pacote net-snmp do Linux.

Nota DevMan 1. Perl

Conforme definido no portal www.perl.org.br, Perl � uma linguagem de programa��o est�vel e multiplataforma, usada em aplica��es de miss�o cr�tica em todos os setores, e tem sido bastante usada para desenvolver aplica��es web de todos os tipos.

Nagios

O Nagios � definido como sendo um conjunto de projetos para monitoramento de infraestrutura de TI. Estes projetos s�o: Nagios core, Nagios plug-ins, Nagios Frontends e Nagios Config Tools. Por se tratar de quatro projetos, percebe-se que o Nagios � um grande e completo sistema de monitoramento, al�m de ser totalmente open source. Existe tamb�m uma vers�o do Nagios paga chamada Nagios XI. Por�m, n�o iremos considerar esta vers�o neste artigo.

Nagios Core

O Nagios core � o projeto inicial do Nagios e consiste no sistema de monitoramento em si, ou seja, o sistema respons�vel por todas as fun��es de monitorar. Como exemplos de atividades desempenhadas pelo Nagios Core, temos: gerenciar a agenda de monitoramento, realizar o monitoramento ativo, gerar alertas, etc.

Existem diversas formas de se implementar o Nagios, tudo vai depender de quantos servidores ser�o monitorados e qual o n�vel de detalhamento de monitoramento que voc� quer. Se voc� tiver at� 100 servidores, voc� pode utilizar o NRPE (Nagios Remote Plugin Executor) e fazer o monitoramento ativo no mesmo servidor que gera os alarmes. Por�m, se sua infraestrutura for maior que isso ou tiver probabilidade de crescer, recomenda-se que voc� utilize o collectd para coletar os valores nos servidores monitorados, crie um servi�o no Nagios para ler os valores do collectd e gere os alarmes. � importante tamb�m separar a fun��o de acompanhar a situa��o da rede da fun��o de realizar o monitoramento ativo. Assim, recomenda-se ter servidores Nagios espec�ficos para fazer o monitoramento ativo, pois com o aumento da quantidade de servidores, a concorr�ncia entre os servi�os de monitoramento poder� trazer problemas.

Hands on

A partir de agora, trabalharemos em um estudo de caso considerando o monitoramento de ativos de rede nas formas ativa e passiva.

O sistema operacional que utilizaremos ser� o Mac OS X 10.6.8 e o Parallels Desktop para criar a m�quina virtual do laborat�rio. Durante a instala��o, escolha o tipo minimal, ou seja, n�o ser� personalizado nenhum pacote do sistema operacional.

Na se��o de downloads da Infra Magazine disponibilizamos dois arquivos para instala��o do sistema operacional. Se o usu�rio possuir o software kickstart, deve utilizar o arquivo anaconda-ks.cfg, sen�o deve usar o rpm-qa.txt. Se o usu�rio seguir esses passos, � importante que o sistema operacional tenha os mesmos pacotes instalados conforme o arquivo rpm-qa.txt.

A Tabela 1 apresenta as informa��es para instala��o e configura��o do servidor.

Nome	Sistema operacional	Proc	Mem	Endere�o IP	M�scara de rede
Nagios01	CentOS 6.3 x86_64	1	1G	10.211.55.11	255.255.255.240

Tabela 1. Informa��o da m�quina virtual.

Banco de dados

Para este estudo de caso, utilizaremos um banco de dados para algumas funcionalidades. Assim, instale um banco de dados no nagios01. Ambas as ferramentas de monitoramento que faremos uso suportam o MySQL e o PostgreSQL. Para instalar o banco de dados MySQL, execute o comando yum install -y mysql-server, e para instalar o PostgreSQL, execute o comando yum install -y postgresql84-server postgresql84-plperl.

SELinux

O SELinux � uma facilidade de seguran�a dispon�vel no CentOS. Recomenda-se que voc� deixe-o habilitado. Para que tudo funcione corretamente com o SELinux, voc� deve ativ�-lo conforme os passos descritos na Listagem 1.

Caso voc� tenha problemas para utilizar o SELinux, desabilite-o com o comando setenforce 0.

Listagem 1. Habilitando o m�dulo SELinux.


module mypol 1.0;
   
  require {
      type snmpd_t;
      type var_spool_t;
      class dir { write add_name };
      class file { write ioctl create open getattr };
  }
   
  #============= snmpd_t ==============
  #!!!! This avc is allowed in the current policy
   
  allow snmpd_t var_spool_t:dir { write add_name };
  allow snmpd_t var_spool_t:file { ioctl getattr };
  #!!!! This avc is allowed in the current policy
   
  allow snmpd_t var_spool_t:file { write create open };

Nagios

Como o foco deste estudo de caso n�o � a instala��o do Nagios (mas seu uso), utilizaremos um RPM (RPM Package Manager) fornecido pelo reposit�rio do Fedora (distribui��o Linux para a comunidade da Red Hat). Recomenda-se que o Nagios seja compilado pelo pr�prio administrador.

Para proceder com a instala��o do Nagios, execute a sequ�ncia de comandos apresentados na Listagem 2.

Listagem 2. Comandos para instala��o do Nagios.


  # rpm -ihv http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-7.noarch.rpm
  # yum install -y httpd
  # chkconfig httpd on
  # iptables -I INPUT -p tcp --dport 80 -j ACCEPT
  # service iptables save
  # yum install -y nagios nagios-plugins-all
  # htpasswd -c /etc/nagios/htpasswd.users nagiosadmin
  # chkconfig nagios on

O comando rpm � utilizado para gerenciar pacotes RPM. Neste caso, instala-se o pacote do EPEL que adicionar� o reposit�rio do Fedora �s configura��es do YUM. Perceba que o pacote n�o est� hospedado no servidor local, o rpm utiliza o protocolo HTTP para baixar o arquivo e depois segue o procedimento de instala��o.

O comando yum � utilizado para gerenciar os pacotes do sistema operacional. Na Listagem 2, o empregamos para instalar o Apache HTTPD, Nagios e Nagios Plugins.

Na sequ�ncia, utilizamos o comando iptables para liberar a regra de firewall da porta 80 (HTTP). Em nosso exemplo n�o utilizaremos HTTPS. Portanto, n�o foi realizada a regra para a porta 443. Se voc� pretende usar SSL, crie a regra tamb�m para a porta 443, conforme o par�metro --dport do comando iptables.

J� o comando chkconfig � utilizado para gerenciar os servi�os que s�o iniciados no processo de inicializa��o do sistema operacional. O aproveitamos em nosso estudo para indicar que o Apache deve ser iniciado nos run levels padr�es.

O script de inicializa��o do Nagios fornecido pelo pacote RPM utiliza o sh como Shell. Em nosso estudo, alteramos para ele adotar o bash. Para isso, informamos o comando sed.

Por fim, o comando htpasswd � um bin�rio que foi instalado no pacote httpd. Com ele foi criada a autentica��o do usu�rio nagiosadmin para o Apache (htpasswd.users).

Monitoramento passivo

O monitoramento passivo de equipamentos de rede � feito atrav�s de traps. Trap � o resultado de um evento gerado no equipamento, sendo o mais conhecido o de perda e restabelecimento de conectividade da porta de rede. Quando conectamos o cabo de rede, o estado da porta � alterado de down para up. Este evento gera um trap com OID correspondente ao evento de link up. Quando desconectamos o cabo, o procedimento � o mesmo, mas trocam-se os estados.

NetSNMP

O snmptrapd � o servi�o que recebe os traps dos ativos de rede e realiza um pipe para o script do SNMPTT. Para utiliz�-lo, execute a sequ�ncia de comandos da Listagem 3 para instalar o pacote Net-SNMP com suporte ao Perl, pois conforme dito anteriormente, nossos plugins utilizam-se da linguagem de programa��o Perl.

Listagem 3. Comandos para instala��o do NetSNMP.


  # yum install -y net-snmp net-snmp-perl net-snmp-utils
  # chkconfig snmptrapd on
  # echo 'OPTIONS="-On -Oa -Lsd -p /var/run/snmptrapd.pid"' >> /etc/sysconfig/snmptrapd
  # service snmptrapd start

SNMPTT

O SNMPTT � o script que iniciar� o tratamento do trap e enviar� os dados coletados ao sistema de monitoramento Nagios. Como os scripts s�o escritos na linguagem Perl, precisamos instalar alguns plugins, e para isto faremos uso do CPAN. Sendo assim, execute o comando cpan e responda no para a pergunta �Are you ready for manual configuration? [yes]�. Em seguida, no shell do CPAN, digite quit. Feito isso, execute o comando cpan para que sejam realizadas as configura��es iniciais do acesso ao CPAN. As configura��es s�o muitas e n�o abordaremos neste artigo, pois n�o s�o necess�rias para este exemplo.

Agora execute a sequ�ncia de comandos da Listagem 4, para instalar os m�dulos Perl necess�rios. Estes m�dulos s�o as bibliotecas necess�rias para que os scripts funcionem.

Listagem 4. Instalando m�dulos Perl.


  # yum install -y perl-CPAN perl-Time-HiRes make
  # perl -MCPAN -e 'install Perl::OSType, ExtUtils::MakeMaker'
  # perl -MCPAN -e 'install Module::Build::Compat, Config::IniFiles'

Responda yes para confirmar a instala��o dos m�dulos dependentes. Basta apertar a tecla Enter, pois j� � a resposta padr�o.

Nosso pr�ximo passo � instalar o SNMPTT. Para isso, execute a sequ�ncia de comandos da Listagem 5. O comando groupadd � utilizado para criar grupos e o comando useradd para criar usu�rios. Perceba que criamos o grupo snmptt e o usu�rio snmptt dentro desse grupo.

Ap�s isso, utilizamos o sed para alterar os arquivos de inicializa��o do SNMPTT. Na sequ�ncia, o comando mkdir � especificado para criar diret�rios. Criamos os diret�rios para armazenar os logs e o spool do SNMPTT.

Em seguida, criamos os arquivos de logs em branco a partir do comando touch. Por fim, com o comando chown, alteramos o propriet�rio dos arquivos e diret�rios. Perceba que definimos tamb�m o tempo de vida do log e a inicializa��o autom�tica do servi�o. Com isso, todas as configura��es necess�rias para o servi�o do SNMPTT est�o finalizadas.

Listagem 5. Comandos para instala��o do SNMPTT.


  # yum install -y wget
  # wget http://downloads.sourceforge.net/project/snmptt/snmptt/snmptt_1.3/snmptt_1.3.tgz
  # tar xzvf snmptt_1.3.tgz
  # cd snmptt_1.3
  # cp snmptt.logrotate /etc/logrotate.d/snmptt
  # cp snmptt-init.d /etc/init.d/snmptt 
  # cp snmptthandler /usr/sbin
  # cp snmptt /usr/sbin
  # cp snmpttconvert /usr/sbin
  # cp snmpttconvertmib /usr/sbin
  # cp snmptt.ini /etc/snmp/snmptt.ini
  # chkconfig --add snmptt
  # chkconfig snmptt on
  # groupadd snmptt
  # adduser -g snmptt snmptt
  # sed -i "s/^\/etc\/snmp\/snmptt.conf/\/etc\/snmp\/snmptt.conf.if-mib/g" /etc/snmp/snmptt.ini
  # sed -i "s/log_system_enable = 0/log_system_enable = 1/g" /etc/snmp/snmptt.ini
  # sed -i "s/^net_snmp_perl_enable = 0/net_snmp_perl_enable = 1/g" /etc/snmp/snmptt.ini
  # mkdir /var/spool/snmptt/
  # mkdir /var/log/snmptt/
  # chown -R snmptt: /var/spool/snmptt/ /var/log/snmptt /etc/snmp/snmptt.ini
  # chcon system_u:object_r:var_spool_t:s0 /var/spool/snmptt

Para finalizar a configura��o do monitoramento via traps, devemos criar o arquivo de tradu��o da MIB para o SNMPTT utilizando o script snmpttconvertmib. Este � respons�vel por ler o arquivo MIB e gerar o arquivo de configura��o do SNMPTT. O par�metro out � onde o arquivo do SNMPTT ser� gerado, e o par�metro exec � o script que envia o resultado ao Nagios. O script do par�metro exec (submit_check_result) � provido pelo pacote do Nagios.

# snmpttconvertmib --in=/usr/share/snmp/mibs/IF-MIB.txt --out=/etc/snmp/snmptt.conf.if-mib --exec='/usr/lib64/nagios/plugins/eventhandlers/submit_check_result $r TRAP 2'

Para facilitar o uso, cada plugin do Nagios trabalha com c�digos de sa�da. Se o c�digo de sa�da for 0, significa que o plugin foi executado e o servi�o est� normal; se for 1, significa que voc� deve ficar alerta (WARNING); se for 2, significa que existe um problema no ambiente; e se for 3, significa que ocorreu algum erro na execu��o do plugin.

O n�mero 2 ap�s a palavra TRAP � o c�digo de sa�da para o Nagios. Em nosso estudo de caso, estamos utilizando apenas o Trap de perda de conectividade, portanto o c�digo de sa�da ser� 2, que significa CRITICAL. Quando um link perde a conectividade, significa que existe um problema no ambiente, portanto o c�digo de retorno deve ser 2.

SNMPTrapd

O snmptrapd � o daemon que recebe o trap do ativo de rede e o envia para que o SNMPTT fa�a a tradu��o e depois a envie ao Nagios. Na se��o de downloads da revista voc� encontrar� o arquivo snmptrapd.conf. Copie-o para a pasta /etc/snmp. J� o arquivo TRAP-TEST-MIB.txt deve ser copiado para o diret�rio das MIBs (/usr/share/snmp/mibs/). Por �ltimo, copie o script submit_check_result para /usr/lib64/nagios/plugins/eventhandlers/ e execute o comando chmod +x /usr/lib64/nagios/plug-ins/eventhandlers/submit_check_result.

O comando a seguir adiciona uma linha no arquivo de configura��o do Nagios para criar o servi�o do Trap:

# echo 'cfg_file=/etc/nagios/objects/snmp.cfg' >> /etc/nagios/nagios.cfg

Na se��o de downloads da Infra Magazine voc� tamb�m encontrar� o arquivo snmp.cfg. Copie-o para o diret�rio /etc/nagios/objects/. Este arquivo de configura��o representa a configura��o do servi�o do Nagios para receber os traps.

comando a seguir adiciona a configura��o do servi�o do Trap no servidor localhost. Com isto, o Nagios passa a monitorar o servi�o de traps para o servidor localhost.

# echo -e "define service{\n\tuse\t\tsnmptrap-service\n\thost_name\tlocalhost\n\t}" >> /etc/nagios/objects/localhost.cfg

Agora execute a sequ�ncia de comandos da Listagem 6 para iniciar os servi�os configurados.

Listagem 6. Iniciando os servi�os configurados.


  # service snmptt start
  # service snmptrapd start
  # service nagios start
  # service httpd start

Com os servi�os rodando, todas as configura��es e depend�ncias est�o prontas. Agora execute o pr�ximo comando para enviar um trap id�ntico ao que o ativo de rede enviar�, a fim de verificarmos o funcionamento do monitoramento.

# snmptrap -v 1 -c public localhost TRAP-TEST-MIB::demotraps localhost 2 0 '' IF-MIB::ifIndex i 1

Aten��o: a resolu��o de nome precisa estar id�ntica a localhost. Portanto, a linha dos hosts para localhost deve estar conforme o trecho:

127.0.0.1       localhost       localhost.localdomain

Ap�s a execu��o desse comando, o snmptrapd receber� um trap que ser� encaminhado para o script snmptraphandler. O script far� a tradu��o e utilizar� o script submit_check_result para enviar o resultado para o nagios.cmd. Ap�s a escrita do resultado no nagios.cmd, o alarme surgir� no monitoramento.

Prosseguindo com a configura��o dos nossos servi�os de monitoramento, destacaremos um item muito importante e que muitas vezes n�o � considerado: a porta do switch ou roteador. � muito importante que se monitore o tr�fego da porta de rede al�m do seu status de conectividade, ou seja, n�o basta saber se a porta est� UP ou DOWN, precisamos verificar tamb�m qual � o tamanho do tr�fego. A recomenda��o � que o tr�fego fique entre 60% e 70% da capacidade da porta.

Para esta etapa de nosso estudo de caso, faremos uso do memcached. Este � um banco de dados n�o relacional vol�til, ou seja, � um banco de dados baseado em chave e valor armazenado em mem�ria. Assim, execute o comando a seguir para instalar o memcached:

# yum install -y memcached

Para facilitar a configura��o de nosso exemplo, utilizaremos o daemon SNMPD para representar o papel do ativo de rede. Como o daemon possui a mesma MIB do ativo de rede, aplicam-se as mesmas configura��es. Deste modo, execute o comando a seguir para criar um acesso apenas de leitura para o service:

# echo 'rocommunity public' > /etc/snmp/snmpd.conf

Feito isso, execute os comandos a seguir para iniciar o servi�o e test�-lo:

# service snmpd start
  # snmpwalk -v 1 -c public localhost system

No arquivo snmp.cfg baixado anteriormente, existe a configura��o do servi�o para monitorar se a porta est� Up ou Down via SNMP com ifIndex 1. Agora, voc� precisa configurar um service para cada porta. Portanto, execute o comando abaixo para configurar o monitoramento da porta 1 para o host localhost:

# echo -e "define service{\n\tuse\tlink-status-1\n\thost_name\tlocalhost\n\t}" >> /etc/nagios/objects/localhost.cfg

Para completar o monitoramento, � preciso monitorar o tr�fego das portas dos ativos de redes. Para isso, novamente na se��o de downloads da Infra Magazine, disponibiliza-se um script para coletar os dados e disponibiliz�-los no memcached que configuramos anteriormente. O nome do arquivo � get_bandwidth.pl. Grave-o no diret�rio /opt/.

O arquivo de configura��o para o script get_bandwidth.pl deve ser criado pelo administrador em /etc/get_bandwidth.conf. O conte�do deste arquivo � separado por �;�, sendo o primeiro campo o nome do servidor ou endere�o IP, o segundo a community SNMP e os pr�ximos campos s�o os �ndices das portas a coletar. Exemplo: localhost;public;1;2;3.

Como apresentado no comando a seguir, nota-se que o script precisa da permiss�o de execu��o e da lib do Perl para o memcached:


  # chmod +x /opt/get_bandwidth.pl
  # yum install -y perl-Cache-Memcached

Para finalizar, colocamos o script no cron para coletar os valores a cada minuto:


  # echo '*/1 * * * * /opt/get_bandwidth.pl' >> /var/spool/cron/root
  # service crond restart

Conclus�o

O monitoramento de redes � essencial para a infraestrutura de TI. Deste modo, visando seguran�a e confiabilidade, deve-se aplicar o monitoramento ativo e passivo para garantir o seu correto funcionamento.

Baseado em solu��es open source, mostramos neste artigo como � poss�vel monitorar de forma eficiente e eficaz toda a infraestrutura da rede, garantindo assim o bom funcionamento de todos os outros componentes.

Agora seu ambiente j� est� pronto para receber as notifica��es de perda e reestabelecimento de conectividade, al�m de qualquer outro trap enviado pelo ativo de rede. Com as configura��es efetuadas, tamb�m � poss�vel monitorar ativamente o status de cada porta.

Links

Site do Collectd
http://collectd.org

Wiki do Collectd
http://collectd.org/wiki/index.php/Main_Page

Documenta��o do Nagios
http://library.nagios.com/library/products/nagioscore/manuals/

Site do CPAN
http://www.cpan.org