Artigo SQL Magazine 17 - Otimizando um servidor Linux para banco de dados

Clique aqui para ler esse�artigo em PDF.

Clique aqui para ler todos os artigos desta ediç�o

Otimizando um servidor Linux para banco de dados - Parte II

por Carlos Eduardo Smanioto

�

Leitura obrigat�ria

Para uma melhor compreens�o desse artigo, � aconselhada a leitura da primeira parte publicada na ediç�o 12 da SQL Magazine com o t�tulo �Otimizando um servidor Linux para banco de dados�.

�

Nessa segunda parte do artigo sobre tuning de servidores Linux para banco de dados estaremos focando a otimizaç�o do Kernel do Linux. Veremos tamb�m a teoria relacionada com as configuraç�es descritas a fim de dar ao leitor plena consci�ncia do que estaremos fazendo. Abordaremos aqui conceitos que n�o se aplicam somente a banco de dados, mas tamb�m a outros softwares utilizados em servidores de rede, como o SAMBA, que permite montar no Linux um servidor de arquivos e dom�nio, substituindo Windows 2000 Server como servidor PDC (Primary Domain Controller).

Uma breve introduç�o

Diferente do Windows onde temos poucas opç�es de configuraç�o e otimizaç�o do sistema operacional em relaç�o a um servidor de BD, no Unix (e seus derivados) as configuraç�es do sistema operacional est�o diretamente relacionadas com a performance do SGBD. Nesse artigo, apresentarei as principais modificaç�es no kernel para alcançar o alto desempenho. Antes, no entanto, falaremos de um assunto que foi citado superficialmente na primeira parte do artigo: RAID.

RAIDs

RAID � a sigla para Redundant Array of Inexpensive/Independent Disks - "Matriz Redundante de Discos de Baixo Custo/Independentes". O objetivo do RAID � criar um sistema contra falhas de HD atrav�s do armazenamento redundante dos dados em v�rios discos, aumentando tamb�m a performance de gravaç�o e recuperaç�o dos dados.

Podemos criar RAIDs via hardware ou software. � poss�vel criar uma unidade RAID com apenas um HD, no entanto isso n�o faria sentido, visto que n�o haveria redund�ncia, e portanto n�o traria qualquer tipo de vantagem. Consideramos ent�o que para se criar um RAID precisamos de no m�nimo dois HDs. Uma unidade RAID � composta por �n� HDs, sendo que o sistema operacional n�o diferencia os HDs que a comp�e, enxergando-os como uma �nica unidade RAID. Lembram-se da primeira parte do artigo, quando citei o LVM? O RAID tem o mesmo conceito, ali�s, o RAID 0 (Striping) foi explicado no LVM. Atrav�s do RAID, al�m de garantirmos a disponibilidade dos dados em caso de falha em algum dos discos, tamb�m equilibramos o acesso �s informaç�es, diminuindo os gargalos de I/O, aumentando assim o desempenho de acesso ao disco pelo SGBD.

N�veis de RAID

A tecnologia RAID possui diversos n�veis. Cada n�vel representa uma combinaç�o do uso dos discos no que se refere ao espelhamento dos dados, fracionamento (striping), detecç�o de falhas, etc. Estaremos comentando nesse artigo os 6 n�veis b�sicos de RAID.

�

RAID 0

Conhecido como striping ou fracionamento. Nele os dados s�o divididos em pequenos segmentos e distribu�dos entre os discos (ver Figura 1). Este n�vel n�o oferece toler�ncia a falhas, mas � o mais r�pido de todos os n�veis de RAID. O RAID 0 � usado apenas para ganhar performance, uma vez que a distribuiç�o dos dados entre os discos proporciona grande velocidade na gravaç�o e leitura de informaç�es. Quanto mais discos houver, mais velocidade � obtida. Apesar da limitaç�o do hardware controlador de disco, de maneira geral � poss�vel formar um RAID 0 com at� quatro discos. Segundo o site www.mcpdomain.com/artigos/raidsystem.asp, o aumento do desempenho � de 98% com dois HDs, 180% usando tr�s HDs, e 250% usando quatro HDs. No entanto, n�o recomendo usar um RAID 0 sem t�cnicas de backup e medidas que permitam proteger a informaç�o contra acidentes, pois ele n�o oferece toler�ncia contra falhas.

�

Figura 1. RAID 0.

�

RAID 1

Tamb�m conhecido como mirroring (espelhamento). Nele, cada bit gravado no primeiro HD � gravado no segundo HD, fazendo com que o segundo disco seja um espelho do primeiro. Assim, em caso de crash do primeiro HD, os dados estariam �ntegros no segundo. Na Figura 2 vemos oito HDs espelhados em pares. A gravaç�o dos dados no RAID 1 � mais lenta, mas a leitura � bastante r�pida, pois o controlador RAID ter� duas fontes de pesquisa para localizar o dado requisitado. Esse � um dos n�veis de RAID mais caros, pois para cada gigabyte de informaç�o armazenada, � necess�rio um outro gigabyte para espelhamento.

�

Figura 2. RAID 1.

�

RAID 2 (ECC)

Este tipo de RAID utiliza discos separados para armazenar os dados e as informaç�es de redund�ncia (paridade) (ver Figura 3). As informaç�es de paridade s�o geradas a n�vel de bit, utilizando um processo conhecido por Hamming Error Correcting Codes (ECC), que permite tanto identificar como corrigir poss�veis erros nas informaç�es, surgidos depois que as mesmas foram gravadas. V�rios fatores fazem com que esse n�vel de RAID n�o seja utilizado atualmente, entre eles est� o alto custo devido ao grande n�mero de HDs necess�rios, e o fato de que os HDs atuais j� oferecem correç�es de erro baseadas em ECC no seu pr�prio hardware. A distribuiç�o dos dados a n�vel de bits faz com que a performance das leituras rand�micas de dados seja terr�vel.

�" [...] continue lendo...

Artigo SQL Magazine 17 - Otimizando um servidor Linux para banco de dados - Parte II

Artigo da Revista SQL Magazine - Edição 17.

Artigos relacionados