Desmistificando o Storage Corporativo

Artigo do tipo Exemplos Pr�ticos

Porque esse artigo � �til
O objetivo deste artigo � desmistificar o storage corporativo para os profissionais que n�o tiveram oportunidade de ver de perto ou trabalhar com estes equipamentos, mas administram aplica��es que dependem destes, como bancos de dados, servidores de e-mail corporativo e servidores de arquivo, por exemplo. � muito f�cil se perder na sopa de letrinhas do mundo do storage (SAN, FC, SAS, LUN, RAID, GBIC, iSCSI), mas esta breve explica��o deve fornecer uma base te�rica razo�vel para que qualquer n�o especialista seja capaz de entender do assunto, ao ponto de poder discutir com um especialista em storage para explicar uma demanda corretamente.

Conhecer a terminologia e os conceitos envolvidos em solu��es de storage � essencial para todo profissional que administra aplica��es que delas dependem (bancos de dados, e-mail, servidor de arquivos, dentre outras).

De uma d�cada para c�, o storage corporativo se tornou cada vez mais presente na infraestrutura de TI das empresas. � um equipamento fundamental para quem deseja disponibilidade e alto desempenho. O problema � que, por se tratar de uma tecnologia relativamente recente, e que poucos profissionais, particularmente em in�cio de carreira, t�m a oportunidade de conhecer de perto, acaba se criando um mito em torno do assunto, o que s� contribui para a falta de informa��o. E porque � importante conhecer o storage? Porque o volume de dados vem crescendo em um ritmo vertiginoso, e nada indica que essa tend�ncia v� mudar nos pr�ximos anos. Para lidar com volumes de dados multi-terabyte, o armazenamento local (disco interno) simplesmente n�o � uma op��o. Fora isso, conforme o volume de dados aumenta, em muitos casos a demanda por desempenho aumenta, logo � necess�rio um equipamento que tenha os recursos e a robustez necess�ria para suportar essa demanda.

Com base em tudo o que foi citado, este artigo se prop�e a desmistificar o storage ao abordar os principais assuntos relacionados de forma clara e objetiva. A ideia n�o � que o leitor se transforme em um especialista em storage da noite para o dia, mas sim que o conte�do exposto aqui sirva de ponto de partida para um aprendizado mais profundo, sem deixar de lado a necessidade do saber pr�tico para o dia a dia.

Configura��o F�sica

Neste t�pico mostraremos os componentes de hardware mais comuns em uma solu��o de storage, bem como um exemplo de arquitetura t�pica de SAN.

Hardware

Como usu�rios finais de um storage corporativo, vemos apenas os discos acess�veis por um servidor. Para n�s e para o servidor � transparente se esse disco � local ou se faz parte de uma SAN (Storage Area Network). A seguir, descrevemos os equipamentos necess�rios para que uma solu��o desse tipo funcione corretamente.

Storage

O storage � um equipamento que permite a instala��o de uma grande quantidade de discos de tipos diversos (veja o BOX 1) e possui formas de conectividade para permitir o acesso por diversos servidores. O storage � tipicamente composto por:

� Controladoras ou storage processors (Figura 1), que gerenciam toda a configura��o do equipamento, a conectividade externa, o acesso aos discos e ao cache de dados. Normalmente h� mais de uma, para redund�ncia em caso de falha;

� Gavetas ou Drive enclosures (Figura 2), que s�o os acess�rios que recebem os discos.

Os equipamentos mais sofisticados s�o constru�dos de forma modular, de modo que � poss�vel a expans�o pela adi��o de mais controladoras ou drive enclosures posteriormente. Na Figura 3 � poss�vel ver um storage completo com seus m�dulos montado em rack.

Figura 1. Storage Processor.

Figura 2. Drive Enclosure.

Figura 3. Storage montado em rack, vis�o frontal.

BOX 1. Tipos de Disco

Os equipamentos atuais suportam o que h� de mais moderno em tecnologia de disco. Internamente os discos de tecnologia tradicional (placas girat�rias com cabe�as de leitura) s�o bastante similares. Eles diferem no tipo de conex�o e na velocidade de rota��o. Quanto maior a rota��o, maior o desempenho. A seguir, temos uma breve descri��o dos tipos mais comuns:

FC (Fiber Channel): S�o discos de alto desempenho, com op��es de 10.000 e 15.000 RPM, muito utilizados em equipamentos de grande porte. Atualmente s�o oferecidos em tamanhos diversos, que podem variar de 146 GB a 2 TB;

SAS (Serial Attached SCSI): S�o discos de alto desempenho que utilizam a conex�o SAS de 6 Gbps, com op��es de 10.000 e 15.000 RPM, muito utilizados em equipamentos de pequeno a grande porte. Atualmente s�o oferecidos em tamanhos de 300, 450 e 600 GB;

NL-SAS (Near-Line SAS): S�o discos de baixo custo que utilizam a conex�o SAS. Normalmente com velocidade de 7.200 RPM, s�o utilizados para dados que n�o possuem alta demanda de acesso, como dados hist�ricos, por exemplo. Atualmente s�o oferecidos em tamanhos de 1 a 3 TB;

SATA (Serial ATA): S�o discos de baixo custo que utilizam a conex�o SATA (Serial ATA) de 3 Gbps. S�o encontrados em equipamentos um pouco mais antigos e possuem fun��o similar � dos discos NL-SAS;

SSD (Solid State Disk): S�o discos baseados em mem�ria flash, que oferecem o melhor desempenho entre todos os tipos mencionados acima, por n�o possu�rem partes m�veis. � uma tecnologia recente e bastante promissora, e por isso, ainda muito cara para uso em larga escala. S�o utilizados em aplica��es onde o m�ximo desempenho � essencial.

Switch

Os switches (Figura 4) t�m o papel de implementar a conectividade entre os servidores e o storage. Normalmente � utilizado mais de um, tamb�m por quest�es de redund�ncia.

A conex�o com os servidores � feita a partir de cabos, cujo tipo varia de acordo com o switch utilizado. Os tipos mais comuns atualmente s�o:

� Fiber Channel (FC), que utiliza fibra �tica para o tr�fego de dados, e que suporta desde dist�ncias pequenas (at� 100m, chamada �shortwave�) at� grandes dist�ncias (at� 50 km, chamada �longwave�). Conex�es FC utilizam um tipo de switch especial comumente chamado de �SAN switch�;

� iSCSI (Internet SCSI), que utiliza switches de rede comuns e cabos de rede UTP (par tran�ado) ou fibra �tica.

As conex�es FC podem operar em velocidades que variam de 1 a 16 Gbps, sendo que as mais comuns atualmente s�o de 4 e 8 Gbps. As conex�es iSCSI dependem da infraestrutura de rede, e podem utilizar conex�es de 1 ou 10 Gbps, dependendo do switch de rede utilizado.

O fato de a tecnologia iSCSI utilizar switches de rede comuns traz uma grande vantagem em termos de custo, pelo fato desta infraestrutura j� existir nas empresas, mas normalmente com desempenho inferior aos switches FC (Fiber Channel), devido ao fato de trafegar comandos SCSI sobre o protocolo TCP/IP, o que tem um impacto significativo. Switches FC � a escolha comum em solu��es que demandam alto desempenho.

As conex�es FC e iSCSI de 10 Gbps, que utilizam fibras �ticas como meio, necessitam de transceivers (conversores de m�dia) para cada porta de conex�o. Esses conversores (veja a Figura 5) se chamam GBIC (Gigabit Interface Converter), e servem para converter o sinal da fibra (luz) para o sinal eletr�nico do switch e vice-versa. Na Figura 6 � poss�vel ver um exemplo de conector de fibra �tica, utilizado para conex�o com GBICs.

� comum se utilizar o termo �fabric� para descrever o switch SAN.

Figura 4. Switch SAN. Repare nas portas vazias, prontas para receber as GBICs.

Figura 5. GBIC � Gigabit Interface Converter

Figura 6. Conector de fibra �tica

HBA (Host Bus Adapter)

HBA (Figura 7) � a placa que instalamos nos servidores para permitir a conectividade com a SAN. Normalmente possuem duas portas (para redund�ncia) eexistem modelos espec�ficos para conex�es FC e iSCSI (no caso do iSCSI, podem ser utilizadas at� placas de rede comuns).

A HBA utilizada em conex�es FC possui um identificador �nico chamado WWN (World Wide Name), que possui papel similar a um endere�o MAC de uma placa de rede. Esse identificador � utilizado nas configura��es realizadas nos switches SAN para identificar as conex�es de cada servidor.

Figura 7. HBA � Host Bus Adapter.

Todos esses equipamentos se comunicam utilizando os comandos do protocolo SCSI (Small Computer System Interface), criado nos anos 80 e que originou diversos conectores, que come�aram a cair em desuso com a chegada do SAS (que significa Serial Attached SCSI, uma evolu��o dos padr�es anteriores). Os conectores SCSI se foram, mas o protocolo permaneceu.

Arquitetura F�sica T�pica

Um disco tradicional funciona dentro do servidor, com dist�ncias de cabos pequenas (10-20 cm) e com cabeamento e conectores protegidos pelo gabinete. Quando falamos de SAN, os equipamentos muitas vezes est�o em racks separados, e �s vezes at� em pr�dios separados, o que traz um fator de risco adicional � solu��o. Por esse motivo a redund�ncia � fundamental em uma solu��o de storage.

No diagrama apresentado na Figura 8 podemos ver uma arquitetura t�pica de SAN: um storage com duas controladoras que possuem duas portas cada, dois switches SAN e alguns servidores. Cada controladora passa por cada um dos switches, e cada porta das placas HBA dos servidores tamb�m v�o para switches separados. Dessa forma, se um switch,uma controladora ou uma porta de HBA falhar, o sistema inteiro continua a funcionar.

abrir imagem em nova janela

Figura 8. Arquitetura T�pica de uma SAN

Configura��o l�gica

Depois de explicar os componentes f�sicos da solu��o, vamos � configura��o l�gica dos equipamentos.

Uma vez que o storage esteja instalado (processo que normalmente � feito pelo fabricante), os servidores com suas placas HBA, e tudo isso conectado atrav�s de switches SAN, como no desenho da Figura 8, temos duas tarefas importantes:

� Configura��o dos discos: � a configura��o dos discos para permitir que sejam utilizados pelas aplica��es;

� Configura��o da conectividade: � a configura��o que permite que todos os equipamentos se comuniquem entre si, e mais importante, que n�o acessem recursos indevidamente.

Configura��o dos discos � O que � RAID ?

Quando pensamos em storage corporativo, 100% das vezes pensamos em RAID. O RAID traz diversas vantagens em rela��o � configura��o de um disco stand alone, como por exemplo, seguran�a e melhor desempenho. Aqui vale uma pausa para discutirmos o que � RAID. O termo RAID significa Redundant Array of Independent Disks, e� uma tecnologia que permite o agrupamento l�gico de discos (array) para obter melhor desempenho, seguran�a ou custo.O RAID � classificado em n�veis (levels), que determinam o funcionamento dos discos na configura��o selecionada, e o tipo de redund�ncia.

Para determinar o n�vel de RAID ideal para cada caso sempre devem levar em conta tr�s fatores: custo, desempenho e seguran�a de dados. Normalmente quando obt�m o melhor em dois desses fatores, se perde no terceiro. � tudo uma quest�o de escolher o mais apropriado para cada necessidade.

Existem v�rios n�veis de RAID, mas os que foram consagrados pelo uso e, portanto s�o os mais comuns, s�o apresentados a seguir:

� 0 (striping): � o n�vel de RAID que oferece o melhor desempenho e custo, com a contrapartida de n�o oferecer seguran�a. Os dados s�o distribu�dos pouco a pouco em cada disco do array, o que faz com que o acesso de leitura e escrita seja muito r�pido, mas em caso de perda de um disco, o array inteiro falha. S� � utilizado em situa��es particulares onde a seguran�a de dados n�o � importante (por exemplo, discos tempor�rios para renderiza��o de v�deos, que demandam alto desempenho, mas que o processo pode ser reiniciado caso os discos falhem);

� 1 (mirroring - espelhamento): Oferece �tima rela��o entre desempenho e seguran�a, com o custo de utilizar no m�nimo metade do espa�o total para garantir a redund�ncia. Todos os dados que s�o gravados em um disco s�o automaticamente gravados em um ou mais discos, o que garante a seguran�a dos dados caso um disco falhe. Teoricamente, no entanto, � poss�vel utilizar mais de dois discos em RAID 1, o que aumentaria o n�mero de c�pias dos dados (um array RAID 1 com tr�s discos, por exemplo, possui o dado original em um disco mais duas c�pias), mas na pr�tica isso n�o � comum. Normalmente s�o utilizados apenas dois discos para formar um array RAID 1, que tolera a perda de apenas um disco;

� 10 (striping de mirror): Funciona como um array RAID 0 constru�do no topo de dois ou mais arrays RAID 1. Com isso oferece desempenho pr�ximo ao do RAID 0 com a redund�ncia do RAID 1. � o n�vel mais indicado quando se deseja m�ximo desempenho com seguran�a, mas � o mais caro de todos: utiliza metade do espa�o total para redund�ncia, como no RAID 1, e s�o necess�rios ao menos quatro discos para formar um array RAID 10.

Para este n�vel de RAID, o mecanismo de toler�ncia a falhas � um pouco mais complicado. Um array RAID 10 tolera a perda de at� um disco por �array� RAID 1, ou seja, se temos seis discos em RAID 10, podemos pensar em tr�s pares de discos em RAID 1 unidos para formar um array RAID 0. Nesse caso, podemos perder at� um disco de cada par, mas n�o os dois discos de um mesmo par;

� 5 (striping com paridade distribu�da): Oferece �tima rela��o entre custo e seguran�a, mas o desempenho de escrita � abaixo dos demais devido ao esfor�o de manuten��o dos dados de paridade, que servem para reconstruir o array no caso de falha de um disco. Utiliza normalmente o espa�o de um disco apenas para manter a redund�ncia, e s�o necess�rios no m�nimo tr�s discos para formar um array RAID 5. Tolera a perda de at� um disco.

O c�lculo de paridade, que garante a seguran�a do RAID 5, funciona da seguinte forma: pense em tr�s discos id�nticos, onde todas as posi��es de grava��o de dados possuem um endere�o espec�fico que seja comum a todos os discos, ou seja, a terceira posi��o de todos os discos se chama �3�, por exemplo. Ao gravar um bit em um determinado endere�o, a controladora RAID faz um c�lculo (XOR, operador l�gico �ou exclusivo�) entre esse bit e o bit do endere�o tr�s de um dos discos vizinhos, gerando um terceiro bit, que � o bit de paridade. Esse bit de paridade ser� gravado no endere�o tr�s de um disco diferente dos dois utilizados para o c�lculo. Isso � realizado para todos os dados que s�o gravados em um array RAID 5, e esse processo � feito de uma forma que a cada dado gravado, a combina��o de discos utilizados para gerar a paridade e o disco utilizado para grav�-la sejam diferentes. Dessa forma, quando um disco � perdido, � poss�vel reconstruir os seus dados a partir dos dados e bits de paridade dos demais;

� 6 (striping com dupla paridade): Similar ao RAID 5, mas grava dois bits de paridade para cada bit gravado. Por isso tem desempenho de escrita fraco, mas tem a grande vantagem de suportar a falha de at� dois discos do array.

Para concluir, vale notar que boa parte dos equipamentos atuais de storage suporta a configura��o de um ou mais discos como hot-spare, que t�m a fun��o de �estepe� em situa��es de falha. Nesses casos, o storage, ao detectar uma falha, pode iniciar um rebuild do array utilizando o disco de spare automaticamente, sem interven��o humana.

Sele��o do n�vel de RAID

Para determinar qual n�vel de RAID devemos utilizar, � preciso pensar em quatro quest�es importantes:

� Quanto espa�o � necess�rio?

� Qual � o or�amento?

� Qual � a necessidade de seguran�a?

� Qual � a necessidade de desempenho?

Na pr�tica, essas perguntas devem vir antes da compra dos equipamentos, para determinar a configura��o do equipamento a ser comprado. No entanto, para o nosso exerc�cio mental de n�o especialistas, vale faz�-las agora, supondo que temos ao nosso dispor todos os recursos que desejarmos (a realidade normalmente � bem diferente).

Conhecer bem os n�veis de RAID, ao ponto de sugerir com autoridade qual deve ser utilizado, � fundamental para todo profissional de infraestrutura, at� para evitar generaliza��es do tipo �RAID 5 � ruim� ou �RAID 10 � o melhor�. Cada um � mais apropriado para determinado caso.

Para responder �s tr�s primeiras perguntas, n�o � preciso um grande esfor�o, e elas est�o intimamente ligadas. No entanto, a resposta � quest�o do desempenho � a mais complicada e que exige mais aten��o. Na se��o final deste artigo, que fala de workloads e IOPS, podemos ver uma explica��o detalhada sobre a rela��o entre workload, IOPS e n�vel RAID, bem como exemplos dessa l�gica.

Uma vez determinado o n�vel RAID, podemos criar nosso primeiro array de discos, tamb�m conhecido como RAID group. Esse array deve ser dividido em Logical Units, ou LUNs (LUN no singular). A logical unit � como uma parti��o de disco, s� que de fato � a parti��o de um array, que por sua vez � a uni�o de v�rios discos (parti��o da uni�o?!?). Simplificando: os discos s�o unidos fisicamente como um array com a configura��o de n�vel RAID, e depois divididos logicamente em LUNs para serem acessados pelos servidores. Uma vez que a LUN seja apresentada ao servidor, este passa a trat�-la como um disco comum, que deve ser formatado para depois ser utilizado.

Configura��o da conectividade

Para que o disco possa ser apresentado ao servidor, existem mais alguns passos a serem realizados, que est�o relacionados � seguran�a:

� Zoning: � a configura��o feita no switch SAN que diz quais portas falam com quais. Normalmente � feita de forma que a HBA de um servidor acesse somente a HBA da controladora do storage, de modo a n�o permitir acessos indevidos;

� Configura��o de Storage Groups: � a configura��o feita no storage que diz quais LUNs podem ser acessadas por quais servidores. � a segunda camada de prote��o a acessos indevidos, ao n�o permitir que um servidor acesse um disco que n�o lhe pertence. Aqui vale um par�ntese: em ambientes de cluster, onde dois ou mais servidores precisam acessar um determinado disco, todos os servidores devem fazer parte do mesmo storage group que os discos, e o controle de qual servidor acessa qual disco � feito via software.

O ato de adicionar uma LUN a um storage group existente configura o ato de apresentar o disco para o servidor. A partir deste momento, o disco estar� vis�vel para o sistema operacional.

Conclu�das estas tarefas, o storage est� pronto para ser utilizado.

Funcionalidades importantes

Ap�s ler a explica��o at� aqui, deve estar claro que o storage oferece uma s�rie de vantagens em rela��o a uma configura��o de disco interno, principalmente na capacidade de implementar solu��es de alto desempenho.

Al�m disso, o storage normalmente possui uma s�rie de funcionalidades adicionais que s�o menos conhecidas, mas n�o menos importantes, do ponto de vista de gerenciamento. A seguir est�o descritas algumas dessas funcionalidades:

� Clone: � a capacidade de clonar os dados de uma determinada LUN. A vantagem do clone em compara��o a uma c�pia de arquivos do sistema operacional, � que o clone ocorre inteiro dentro do storage, sem tr�fego pela SAN, e por isso tende a ser muito mais r�pido. � �til em migra��es de servidores onde se deseja ter um backup completo e r�pido;

� Snapshot: � a capacidade de tirar uma �fotografia� de uma determinada LUN em uma posi��o no tempo. Snapshots normalmente s�o implementados utilizando uma t�cnica chamada �copy-on-write�, que somente grava a vers�o antiga dos dados no snapshot conforme estes s�o alterados na LUN original. Dessa forma, o snapshot tem um tamanho bastante pequeno quando criado, e vai crescendo conforme a LUN original � alterada. A fun��o mais importante do snapshot � permitir que se restaure o estado dos dados de uma LUN �quele que existia no momento em que o snapshot foi criado. � �til em aplica��es de patches, quando se deseja poder desfazer as altera��es sem restaurar um backup, por exemplo;

� Thin provisioning: � a capacidade de alocar uma LUN que possua aloca��o din�mica, ou seja, podemos criar uma LUN �thin� de 100 GB, mas ela s� ocupar� o espa�o que estiver em uso pelo servidor, similar aos discos de crescimento din�mico dos produtos de virtualiza��o. Isso � �til quando n�o temos uma estimativa precisa da necessidade de aloca��o de espa�o para um servidor, e, portanto n�o queremos comprometer uma �rea do storage desnecessariamente;

� Storage Pools e Tiering: � a alternativa aos arrays/RAID groups tradicionais, e que vem ganhando espa�o ultimamente. Em vez de configurar arrays para cada aplica��o, selecionando um tipo de disco espec�fico, alguns equipamentos oferecem a op��o de criar um storage pool com muitos, se n�o todos os discos do storage, misturando discos r�pidos e lentos. O storage passa ent�o a analisar a carga submetida e a identificar o perfil de acesso de cada dado. Uma vez identificado o perfil, o storage realoca dados muito acessados para discos mais r�pidos, e dados pouco acessados para discos mais lentos.

As LUNs s�o criadas diretamente sobre o storage pool, e voc� pode recomendar (repare o termo) em qual camada (�tier�) de discos aquela LUN deve operar. No final, quem decide onde a LUN vai ficar � o storage, ap�s a an�lise, que tipicamente ocorre uma vez por dia. A ideia aqui � que o storage tem mais condi��es do que n�s de analisar os dados de acesso para decidir onde � melhor colocar cada LUN, e ele tem a capacidade de refazer essa aloca��o todos os dias. Na pr�tica, nem os fabricantes recomendam o uso de pools para aplica��es que exigem m�ximo desempenho, mas para ambientes onde o desempenho n�o � t�o cr�tico, a facilidade de administra��o � bastante compensadora, pois libera o administrador da tarefa de controlar a ocupa��o array por array;

� Replica��o block-level: � a capacidade de manter uma replica��o online de LUNs no mesmo storage ou em storages diferentes, at� em localidades diferentes, no n�vel de bloco do disco, sem se importar com o conte�do. A LUN replicada fica em um estado chamado de �crash-consistent�, ou seja, similar ao estado em que um disco fica quando o computador � desligado abruptamente. Contudo, com os file systems modernos (NTFS, ext3, ext4) que possuem journaling, isso normalmente n�o � um problema. Essa funcionalidade � muito �til para a cria��o de sites de conting�ncia (disaster recovery). Solu��es de replica��o block-level normalmente precisam de um software opcional instalado no storage, comprado � parte.

Workloads, IOPS, efici�ncia de espa�o e �calculadora RAID�

Normalmente utilizamos a m�trica de IOPS (I/Os por segundo) para falar de desempenho, ou mais especificamente de carga de trabalho (workload), quando vamos especificar a necessidade de desempenho de um array de discos para uma determinada aplica��o, e a partir dessa informa��o realizar o dimensionamento apropriado. Cada tipo de disco possui um valor nominal de IOPS suportado, que somado ao tipo de RAID e � quantidade de discos do array nos d� uma estimativa de quantos IOPS o array ir� suportar.

Na Tabela 1 podemos ver uma lista de valores t�picos de IOPS para modelos comuns de disco, retirada do manual de um equipamento de porte intermedi�rio de um grande fabricante do mercado (considerando I/O rand�mico, pior caso).

Tabela 1. Valores m�dios de IOPS por tipo de disco.

Cada n�vel de RAID, devido �s suas particularidades de implementa��o, possui determinado fator de impacto de escrita. O fator de impacto funciona como um multiplicador, de modo que para obtermos a quantidade real de escritas que ser�o realizadas no array, � preciso multiplicar a quantidade de escritas realizadas pelo sistema operacional pelo fator de impacto.

Quanto maior o fator de impacto, menor o desempenho de escrita no array. A Tabela 2 mostra os fatores de impacto para os n�veis de RAID mais comuns.

Tabela 2. Fatores de Impacto de Escrita por n�vel de RAID.

Quando dizemos que o RAID 5 possui impacto 4, isso significa que para cada escrita realizada por uma aplica��o no servidor, o storage ir� realizar 4 escritas nos discos que comp�em o array.

Outra informa��o importante � a efici�ncia de espa�o de cada n�vel de RAID. Precisamos desses valores para determinar qual ser� o espa�o �til do nosso array. Na Tabela 3 podemos ver as f�rmulas de efici�ncia de espa�o para os n�veis de RAID mais comuns.

Tabela 3. Efici�ncia de Espa�o por n�vel de RAID.

Resumindo, para determinar a configura��o de um array � preciso considerar:

� Capacidade de IOPS do tipo de disco selecionado;

� Distribui��o do I/O entre leituras e escritas (percentual de cada), para avaliar o impacto da escolha do n�vel do RAID;

� Efici�ncia do n�vel do RAID escolhido, para determinar quanto espa�o �til ter� dispon�vel.

Outra informa��o importante � o tipo de I/O realizado pela aplica��o, se sequencial ou rand�mico. No nosso caso, como estamos utilizando valores de IOPS pensando em acesso rand�mico, que � o pior caso, podemos ignorar essa informa��o (o arquiteto de storage normalmente n�o pode, mas n�s n�o somos os especialistas aqui).

Tomando como base os n�meros das Tabelas 1, 2 e 3, podemos pensar em uma s�rie de c�lculos para nos guiar no dimensionamento de arrays.

Para exercitar os conceitos apresentados, propomos dois exemplos aqui, que demonstram bem a complexidade do assunto storage, e que servir�o como base para o c�lculo de dimensionamento.

Exemplo 1: Dimensione um array de discos em um storage para suportar um banco de dados de 5 TB. Temos a informa��o de que � um banco de dados com grande volume de transa��es durante o dia, que em momentos de pico atinge 5.000 IOPS, e que 60% desse acesso � de escrita.

Ao analisar o enunciado do problema, podemos perceber que:

� 60% do acesso � de escrita. Assim sendo, n�o faz sentido escolhermos um n�vel de RAID que penalize muito a escrita, como os n�veis 5 ou 6. Por se tratar de um banco de dados, podemos supor que h� a necessidade de redund�ncia, o que faz com que descartemos o n�vel 0. Nossa escolha nesse caso ser� pelo RAID 10;

� Comparando a demanda de IOPS (5.000) com o volume de IOPS m�dio suportado por um disco r�pido, n�o-SSD (180, de acordo com a Tabela 1), podemos perceber que precisaremos de muitos discos:

5.000 IOPS / 180 IOPS por disco = 27,7 discos

� Ao considerarmos que 60% desse acesso � de escrita, e o fator de impacto de escrita do RAID 10 � 2, de acordo com a Tabela 2, temos o seguinte c�lculo:

( ((5000 * 60%) * 2) + (5000 * 40%) ) / 180 = 44,4 discos

Decompondo a f�rmula, temos que:

60% de 5000 IOPS de escrita = 3000 IOPS

40% de 5000 IOPS de leitura = 2000 IOPS

3000 IOPS de escrita * 2 (fator de impacto de escrita do RAID 10) = 6000 IOPS

Total de IOPS = 6000 + 2000 = 8000 IOPS

8000 (Total de IOPS) /180 (IOPS por disco) = 44,4 discos

Desse exemplo, podemos derivar a seguinte f�rmula:

D = ( ((iops * w) * i) + (iops * r) ) / iops_avg

Onde:

D: Total de discos a ser utilizado;

iops: Total de IOPS para o qual se deseja dimensionar o array;

i: fator de impacto de escrita para o n�vel de RAID;

w: percentual de escrita dos IOPS totais;

r: percentual de leitura dos IOPS totais;

iops_avg: IOPS m�dio do tipo de disco a ser utilizado no array;

Ap�s calcular a quantidade de discos necess�ria, � preciso definir o tamanho do disco a ser utilizado. Ao consultar a Tabela 3 podemos obter a f�rmula de efici�ncia de espa�o do RAID 10, que � x/2, onde x � a capacidade somada de todos os discos. Pelo c�lculo anterior, identificamos que precisamos de 5 TB em 44 discos. Logo, temos:

5000 = 44x/2

x = 10000/44

x = 227 GB por disco

Arredondando o resultado obtido para o pr�ximo tamanho comum de disco, temos discos de 300 GB. Para confirmarmos se o nosso c�lculo est� correto, podemos inverter a conta, e com o tamanho de disco proposto, temos:

(300*44)/2 = 6600 GB

Assim, com 44 discos FC ou SAS de 15.000 RPM e 300 GB, conseguimos atender � demanda do nosso banco de dados com folga.

Exemplo 2: Dimensione um array de discos em um storage para suportar um servidor de arquivos de 10 TB. Temos a informa��o de que � um servidor de arquivos pouco utilizado, com muitos dados hist�ricos, que em momentos de pico atinge 500 IOPS, e que 80% desse acesso s�o de leitura.

Ao analisar o enunciado do problema, podemos perceber que:

� 80% do acesso s�o de leitura e precisamos de 10 TB �teis. Nesse caso, podemos escolher um n�vel de RAID mais econ�mico, como o 5 ou 6. Para efeito de compara��o, faremos a conta com os dois;

� Se o servidor de arquivos � pouco utilizado, podemos configurar o nosso array com discos mais lentos e baratos. Escolhemos, ent�o, os discos NL-SAS de 7200 RPM, que fazem 90 IOPS cada.

A seguir � apresentado o exemplo de c�lculo para um RAID 5 com discos NL-SAS de 7200 RPM:

Quantidade de IOPS m�dio do disco NL-SAS 7200 RPM (Tabela 1): 90

Fator de impacto do RAID 5 (Tabela 2): 4

Efici�ncia de espa�o do RAID 5 (Tabela 3): 1-1/n

Repetindo a f�rmula do exemplo anterior, temos:

( ((500 * 20%) * 4) + (500 * 80%) ) / 90 = 8,88 discos

Arredondando para o inteiro mais pr�ximo, temos 9 discos em RAID 5.

Para determinar o tamanho do disco desejado, utilizamos a f�rmula de efici�ncia do RAID 5:

1-(1/9) = 0,89

10 TB (total de espa�o necess�rio) / 9 discos / 0,89 = 1,25 TB por disco

Agora, faremos o c�lculo considerando o uso de RAID 6 com discos NL-SAS de 7200 RPM:

Quantidade de IOPS m�dio do disco NL-SAS 7200 RPM (Tabela 1): 90

Fator de impacto do RAID 6 (Tabela 2): 6

Efici�ncia de espa�o do RAID 6 (Tabela 3): 1-2/n

Repetindo a f�rmula do exemplo anterior, temos:

( ((500 * 20%) * 6) + (500 * 80%) ) / 90 = 11,11

Arredondando para o inteiro mais pr�ximo, temos 11 discos em RAID 6.

Para determinar o tamanho do disco desejado, utilizamos a f�rmula de efici�ncia:

1-(2/11) = 0,81

10 TB (total de espa�o necess�rio)/ 11 discos / 0,81 = 1,12 TB por disco

Nos dois casos, arredondando o resultado para o pr�ximo tamanho de disco existente no mercado, temos discos de 1,5 TB. Se optarmos pelo RAID 6, ser�o necess�rios dois discos a mais, por�m com suporte � falha de at� dois discos, o que pode ser uma vantagem dependendo da import�ncia dos dados em quest�o.

Conclus�o

Neste artigo foram apresentados os principais componentes envolvidos em uma solu��o de storage corporativo, as principais configura��es necess�rias e foi fornecida uma explica��o sobre RAID e suas indica��es. Al�m disso, foram mostrados exemplos de workload e de dimensionamento para volume e desempenho.

� importante refor�ar que sempre devemos confiar o trabalho de configura��o ao arquiteto ou administrador do storage, que tem a experi�ncia para avaliar todos os par�metros necess�rios e tomar a melhor decis�o poss�vel. Estes profissionais normalmente precisam levar em considera��o outros fatores ao desenhar uma solu��o de storage, como o n�mero �timo de discos por array dependendo do n�vel de RAID e a quantidade de discos dispon�vel. A quest�o � que, apesar de ser o especialista em storage, nem sempre esse t�cnico � especialista na sua aplica��o, e a� � importante saber falar a �l�ngua� do storage para conseguir estabelecer essa ponte e obter o melhor resultado poss�vel.

Confira outros conte�dos:

Por Mateus Em 2015

Acelere seus resultados com o Prime.

Plano Start

12x R$89,00

Saiba mais

Plano Prime

12x R$199,00

Saiba mais

Plano Prime +

12x R$299,00

Saiba mais

Escolha seu Plano	Plano Start	Plano Prime	Plano Prime +
Forma��o completa Programador
Uso de IAs e automa��es
Exerc�cios gamificados
Projetos pr�ticos
Suporte ao conte�do
Comunidade de alunos
Cursos e artigos em +40 tecnologias
Trilha Monetize seu conhecimento
Mentoria T�cnica personalizada
Mentoria fazendo $ em 60 dias
Mentoria Primeiro emprego
Suporte humanizado 24 horas
Aulas exclusivas com especialistas
Mentorias mensais		2 por m�s	ilimitada
Tempo de assinatura	12 meses	12 meses	12 meses
	Saiba mais	Saiba mais	Saiba mais

Quero tirar uma d�vida

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Desmistificando o Storage Corporativo

O objetivo deste artigo � desmistificar o storage corporativo para os profissionais que n�o tiveram oportunidade de ver de perto ou trabalhar com estes equipamentos, mas dependem deles, como bancos de dados, emails, entre outros.

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?