Capacity Planning - Revista SQL Magazine 97

De que se trata o artigo?

O objetivo deste artigo � demonstrar como definir os n�veis de servi�os requeridos pelos usu�rios e como dimensionar a capacidade do HW para atender aos n�veis acordados. Sendo assim, este artigo serve para conhecer quais volumes de neg�cio se relacionam aos elementos de infraestrutura, entender quais as principais funcionalidades do neg�cio impactam os servidores e antever problemas de desempenho.

Em que situa��o o tema � �til?

Determinar a capacidade de produ��o atual e futura com n�veis de desempenho satisfat�rios

Resumo DevMan:

� cada vez mais comum nas organiza��es de TI gerenciar, analisar e corrigir problemas de desempenho que os usu�rios relatam. Neste contexto, este artigo visa a detalhar teoricamente um projeto de capacity planning, bem como mostrar quais s�o e como coletar as m�tricas importantes para a realiza��o desse tipo de projeto.

� cada vez mais comum nas organiza��es de TI gerenciar, analisar e corrigir problemas de desempenho que os usu�rios relatam. No mundo perfeito, os administradores se preparam com anteced�ncia a fim de evitar gargalos, utilizando-se do que chamamos de capacity planning. Esse tipo de projeto tem por objetivo determinar a capacidade de produ��o para responder a novas demandas, fornecendo n�veis satisfat�rios de servi�os aos usu�rios e mantendo, assim, uma boa rela��o custo-benef�cio. Neste contexto, este artigo visa a detalhar teoricamente um projeto de capacity planning, bem como mostrar quais s�o e como coletar as m�tricas importantes para a realiza��o desse tipo de projeto.

A Figura 1 mostra os tr�s pilares fundamentais para a realiza��o de um capacity planning.

Figura 1. Pilares do Capacity Planning

Vamos, ent�o, detalhar cada um desses pilares.

Determinar os n�veis de servi�os requeridos pelos usu�rios

O primeiro passo em projeto de capacity planning � categorizar o trabalho realizado pelo sistema e alinhar as expectativas dos usu�rios do modo como o trabalho � realizado.

Nessa fase, o capacity planning deve focar seus esfor�os em:

� Who: quem realiza o trabalho (usu�rio ou departamento);

� What: qual tipo de trabalho � realizado (relat�rio de finan�as);

� How: como o trabalho � realizado (rotina batch); e

� Establish Service Levels: acordar um n�vel satisfat�rio entre service provider (provedor do servi�o) e o service consumer (cliente). O service levels � frequentemente definido pela perspectiva do usu�rio, tipicamente em tempo de resposta e throughput.

O processo global de estabelecimento de requisitos em n�vel de servi�o exige primeiro uma compreens�o dos workloads (cargas de trabalho) e service que � a classifica��o l�gica do trabalho realizado em um computador do sistema, como mostrado na Figura 2.

Figura 2. Workloads e Service

A partir deste entendimento inicial, como estabelecer os n�veis de servi�o?

Os n�veis de servi�o devem ser estabelecidos conforme as metas plaus�veis para o neg�cio e, para tanto, ser� necess�rio conhecer, no m�nimo:

� Os processos de neg�cio envolvidos com determinado servi�o;

� A prioridade para o neg�cio do servi�o;

� O crescimento esperado da procura pelo servi�o durante os pr�ximos anos;

� O pior tempo de resposta aceit�vel para o servi�o; e

� Sazonalidade do servi�o.

N�o s�o necess�rios acordos formais e assinados pela TI e a �rea de neg�cios, mas � recomend�vel garantir que ambas as partes recebam as informa��es supracitadas. Estabelecidos tais acordos, o Capacity poder� garantir um desempenho adequado a um custo m�nimo.

Analisar a capacidade de processamento instalada

Devemos analisar a capacidade atual para que ela seja alinhada �s expectativas de tempo de resposta dos usu�rios.

Nessa fase � necess�rio:

� Comparar as medidas de todos os itens referenciados nos acordos de n�vel de servi�o com seus objetivos, o que fornece a resposta sobre a capacidade atual estar ou n�o adequada ao que esperam os usu�rios;

� Analisar o uso de todos os dispositivos envolvidos no sistema CPU, mem�ria, dispositivo de I/O, banco de dados, servidor de aplica��o, entre outros; e

� Mensurar o tempo de resposta e a utiliza��o de recursos para cada workload e determinar quais recursos do sistema est�o sendo mais consumidos para cada workload.

Como mensurar o uso global de recursos?

� importante realizar o monitoramento de cada um dos recursos envolvidos no sistema computacional, verificando se algum deles est� saturado (utiliza��o pr�xima ou igual a 100%). Caso haja satura��o, os workloads que utilizam tal recurso estar�o suscept�veis a apresentar tempos piores de resposta. O tempo de resposta pode ser definido segundo a f�rmula abaixo:

Tempo de Resposta = Tempo de Servi�o + Tempo de Espera (Wait Events)

Por isso, mostra-se importante tamb�m o detalhamento de cada workload com rela��o aos recursos utilizados, refletido em algo semelhante � Figura 3. Por exemplo, imagine um comando ou processo que obtenha o relat�rio das ap�lices de seguro fechadas no �ltimo m�s e um detalhamento de onde � gasto o tempo para completar este workload.

Figura 3. Detalhamento de recursos utilizados por workload

Dimensionar a capacidade necess�ria para atender os n�veis de servi�os atuais e futuros

Utilizando as previs�es de crescimento do neg�cio e os requisitos do sistema, deve-se implementar as altera��es necess�rias para manter os mesmos n�veis de servi�o alinhados com as perspectivas de crescimento do neg�cio.

Nessa fase ser� necess�rio conhecer:

� Crescimento esperado do neg�cio;

� Requisitos para novas funcionalidades/aplica��es; e

� Consolida��o dos itens acima com as m�tricas coletadas pelos dispositivos atuais.

Conhecendo algumas m�tricas

Agora que conhecemos a teoria para a realiza��o de um projeto de capacity planning, vamos analisar quais m�tricas podem ser coletadas para cada camada que constitui o sistema computacional.

Primeiramente, temos que definir thresholds (limites) que indicam n�veis de conforto satisfat�rios, por exemplo 50 GB de redo di�rio. Ultrapassando esse n�vel, os tamanhos dos arquivos t�m de ser reajustados para manter o tempo de leitura recomendado pelo Oracle (15 a 30 min).

Depois disso, ser� necess�rio verificar as m�tricas do Oracle com as m�tricas coletadas pelos outros componentes do sistema computacional. As m�tricas que podem ser coletadas s�o:

� CPU: utiliza��o, run-queue, context switches (volunt�rias e involunt�rias), interrup��es, system calls;

� Storage: N�mero de IOPS/second, Queue Depth, Tamanho de IOPS, Tempo de resposta, throughput;

� Filesystem: crescimento e tempo de resposta;

� Mem�ria: mem�ria f�sica consumida, swap in/out e Page faults;

� Rede: Throughput e detalhes do netstat �s e kstat; e

� Servidor de aplica��o (supondo IIS): time-taken, bytes-sent, bytes-received, status, cs-uri-stem, cs-uri-query, cs(cookie), cs(referrer).

Do monitoramento do servidor de aplica��o, podemos retirar as informa��es plotadas como exemplo na Figura 4.

Figura 4. Workloads e Service

J� as m�tricas que devem ser coletadas para uma an�lise detalhada do banco de dados s�o:

� Users (transactions, logons, parses);

� Redo activity;

� Temp activity;

� Tablespace e espa�o usado pelos objetos;

� Pga usage;

� Sga usage;

� Parallel Operations;

� I/O Operations; e

� File Stats e Temp Stats.

Para Wait events devemos analisar os top waits events, events idle e parallel (PX*) waits (se houver), conforme pode ser visto no exemplo da Figura 5.

Figura 5. Top Wait Events

A decomposi��o do tempo de resposta mostra que events idle e parallel n�o s�o significativos no dia analisado desta base. Ent�o vamos detalhar rapidamente os principais wait events plotados na Figura 5:

� CPU: tempo gasto de CPU para processamento das opera��es;

� Db file scattered read: tempo gasto com leituras multiblocks;

� Db file sequencial read: tempo gasto com leituras single-blocks;

...

Fim do trecho gratuito • continue abaixo

CONTE�DO EXCLUSIVO