Introdu��o ao DB2

Neste artigo iremos fazer uma introdu��o ao DB2 � este poderoso banco de dados que infelizmente ainda � muito desconhecido aqui no Brasil, tendo em contrapartida um mercado de trabalho destinado a DBAs bastante aquecido.�O DB2 n�o � um sistema de dif�cil administra��o. Ele disp�e de muitas ferramentas para a administra��o do banco, como o Control Center. O DB2 conta ainda com o tradicional Command Line Editor para a opera��o via linha de comando.

O Control Center e o Command Line Editor est�o dispon�veis nas vers�es Windows, Linux e Unix do DB2.

Instala��o

A instala��o do DB2 � muito simples, existem apenas alguns detalhes a serem vistos durante a instala��o.

A vers�o que eu utilizo � Personal Edition, que tem as mesmas funcionalidades de outras vers�es maiores do DB2, mais com o fator de ser uma vers�o para single-user, ou seja, ela n�o permite que v�rias pessoas se conectem remotamente nele, � uma vers�o ideal para desenvolver e estudar o DB2.

Figura 1: Instala��o

�

Ao iniciar a instala��o, a primeira coisa com que nos deparamos � com uma lista de pr�-requisitos para instala��o do produto. O item de Instalation Pre-requisites pode ser visto como curiosidade para conhecermos os pr�-requisitos de hardware e software necess�rios para utiliza��o ideal do DB2 (ver�Figura 1).�

Siga a instala��o normalmente at� chegar � sele��o de tipo de instala��o (ver�Figura 2).�Nesta tela, apenas escolha a instala��o Typical, mas selecione o Additional functions Data warehousing que vai servir para ativar o suporte a Data warehousing no DB2.

Figura 2: Adicionar Datawarehousing

Na pr�xima tela (ver�Figura 3) informamos o usu�rio e senha a ser utilizado pra inicializa��o do DB2. Este usu�rio ser� tamb�m o usu�rio interno dele, aqui, temos que informar um usu�rio e senha local j� existente na sua maquina.�

Vale ressaltar aqui alguns detalhes sobre a defini��o da senha. Esta deve ser uma senha v�lida para o DB2, ou seja, tem que seguir as seguintes regras:�

conter entre 1 a 30 caracteres;
incluir letras, n�meros, @, #, ou $;
n�o pode come�ar com IBM, SYS, SQL, ou um n�mero;
n�o pode ser uma palavra reservada do DB2��(USERS, ADMINS, GUESTS, PUBLIC, LOCAL), ou uma palavra reservada de SQL;
n�o pode terminar com $;
n�o pode incluir caracteres acentuados.

Figura 3: Usu�rio e senha

Agora siga normalmente a instala��o at� chegar � tela mostrada na�Figura 4. Ela apresenta informa��es sobre o Health Monitor. Este ir� verificar se o DB2 esta �saud�vel�, rodando corretamente, etc. Caso algo aconte�a com o DB2, como travar ou cair por algum motivo, ser� enviado um e-mail para a pessoa especificada nestes campos informando a situa��o do banco. Na nossa instala��o podemos ou preencher o campos com algum dado ou, como na�Figura 4, escolher a segunda op��o para preenche-los depois. Agora � s� continuar a instala��o at� o fim.

Figura 4: Health Monitor

Algumas informa��es adicionais, inclusive vers�es de avalia��o podem ser encontradas no site�http://www.ibm.com/software/data/db2/�para download gratuito.

Procedimento p�s-instala��o

Ao final da instala��o do DB2, o sistema pergunta se usu�rio deseja criar um banco de dados e um data warehouse como exemplos. Esta etapa normalmente passa despercebida pelo usu�rio. Portanto, n�o se preocupe! Mesmo que voc� n�o tenha percebido a ferramenta First Steps (Figura 5),�� poss�vel fazer a cria��o dos exemplos posteriormente atrav�s dos seguintes passos:

Abra o First Steps, que fica no menu de Iniciar / Programas / IBM DB2 / Set-up Tools /�First Steps.
Clique em Create Sample Databases. Logo em seguida selecione DB2 UDB sample e Data Warehousing sample.
Clicando neles aparecer� a tela de login. Entre como usu�rio administrador, digitando a senha que foi criada durante a instala��o (o usu�rio padr�o chama-se db2admin).

O sistema proceder� ent�o com a cria��o do banco de dados. Este processo pode levar at� cinco minutos, em m�dia. Agora, com o banco de dados de exemplo criado, vamos ver como � a sua estrutura utilizando o Control Center (Figura 6).

Figura 5: Tela do DB2 First Steps

�

Figura 6: Tela do Control Center

�

Neste exemplo, os bancos de dados de exemplo que foram criados s�o: DWCTBC e TBC_MD. Ambos est�o relacionados ao data warehouse SAMPLE que iremos analisar na terceira parte deste artigo.

Abrindo o database SAMPLE (o data warehouse de exemplo), voc� poder� verificar toda a estrutura associada a um banco de dados DB2. Aten��o particular deve ser dada � estrutura de tabelas auxiliares que s�o criadas. Estas tabelas auxiliares, tamb�m conhecidas como tabelas Cat�logo, s�o as tabelas internas que cont�m todas as informa��es criadas sobre tudo no DB2, como usu�rios, as tabelas criadas, �ndices, etc. Nas vers�es de alta plataforma (MAINFRAME), a �nica forma de voc� conseguir, por exemplo, ver os �ndices criados em uma tabela � consultando a tabela SYSIBM.SYSINDEXES. Sendo assim, � muito importante conhecer e consultar sempre estas tabelas, pois elas s�o de grande auxilio para um DBA e at� mesmo para um desenvolvedor que utiliza DB2 como base de dados. Estas tabelas s�o criadas utilizando um SCHEMA chamado SYSIBM. Este SCHEMA � basicamente o nome do usu�rio respons�vel pela cria��o da tabela. Como veremos como proceder para a cria��o de tabelas mais a fundo no pr�ximo artigo, abordaremos melhor o assunto SCHEMAS tamb�m na pr�xima mat�ria j� que este ser� muito utilizado na cria��o de tabelas.

Criando o seu primeiro banco de dados

Vamos agora criar nosso primeiro banco de dados. Para isso usaremos o Control Center, embora a mesma opera��o tamb�m possa ser realizada utilizando o Command Line Editor. Nossa op��o se d� pela facilidade de uso dos assistentes de cria��o do Control Center como veremos adiante. O c�digo equivalente no Command Line Editor ser� exibido ao final do processo.

Passo 1

Antes de abrir o Control Center � necess�rio verificar se o DB2 esta ativo. Isto pode ser percebido atrav�s do �cone verde que fica no System Tray do Windows.

Para acessar a ferramenta Create Database, clique na pasta All Databases dentro do Control Center, e depois com o bot�o direito do mouse, clique em Create Database | Standard. O primeiro passo ser� preencher o database name. Este deve possuir de 1 a 8 caracteres (que n�o podem ser caracteres especiais). A mesma regra deve ser seguida para o Alias, que � um �apelido� pelo qual o banco de dados ser� reconhecido na rede, tanto local como remota. O ideal � usar o mesmo nome para o Alias, como apresentado na�Figura 7.

Figura 7: Tela Name do Database Wizard

�

Passo 2

Na segunda etapa examinaremos a forma de armazenamento e gerenciamento das tabelas no banco de dados. Existem dois tipos de gerenciamento de espa�o para as tabelas: System-Managed Space (SMS) e DataBase-Managed Space (DMS).

Como o leitor j� deve suspeitar, h� vantagens e desvantagens que devem ser consideradas ao se optar por um tipo de gerenciamento para armazenar os dados.

Vantagens de um espa�o de tabelas SMS (System-Managed Space):

O espa�o n�o � alocado pelo sistema at� que seja solicitado;
A cria��o de um banco de dados requer menos trabalho inicial do que o trabalho necess�rio para pr�-definir os containers. Um container � uma localiza��o f�sica de armazenamento dos dados. Ele � associado a um�espa�o de tabela�e pode ser um arquivo,�diret�rio ou um dispositivo.

Vantagens de um espa�o de tabelas DMS (Database-Managed Space):

O tamanho de um espa�o de tabelas pode ser aumentado pela adi��o de containers utilizando a instru��o ALTER TABLESPACE;
Uma tabela pode ser dividida em m�ltiplos espa�os com base no tipo de dados que est�o sendo armazenados: Campo extensor; �ndices; Dados de tabela regular.

Num cen�rio prov�vel, podemos ter a separa��o dos dados da tabela por motivos de desempenho ou para aumentar a quantidade de dados armazenados para uma tabela. Por exemplo, uma tabela com 2 GB de dados de tabela regular, 2 GB de dados de �ndice e 10 TB de dados longos.

A localiza��o dos dados no disco pode ser controlada se o sistema operacional permitir;
Se todos os dados da tabela estiverem em um �nico espa�o de tabelas, um espa�o de tabelas poder� ser eliminado e redefinido com menos sobrecarga do que o necess�rio para eliminar e redefinir uma tabela;
Em geral, um conjunto bem afinado de espa�os de tabela DMS supera os espa�os de tabela SMS.

Prosseguimos com o nosso exemplo selecionando a op��o SMS (ver�Figura 8). N�o iremos ainda trabalhar com cont�ineres, assunto de um pr�ximo artigo.

Figura 8: User Tables

�

Passo 2

Nesta etapa vamos examinar como ser� a forma de armazenamento das tabelas de cat�logo do sistema. Seguiremos exatamente as mesmas regras da etapa anterior.

Cat�logos do sistema s�o tabelas especiais que cont�m informa��es sobre todos os objetos em um�banco de dados. Eles incluem as�tabelas,�telas�e��ndices, al�m de controles de seguran�a como�restri��es�e�n�veis�de autoriza��o espec�ficos para os bancos de dados. Estas tabelas de cat�logo de sistema s�o criadas no momento da cria��o do banco de dados.

Quando um objeto � criado, alterado ou eliminado, o DB2 insere, atualiza ou exclui linhas do cat�logo que descrevem o objeto e como este se relaciona a outros objetos. Os cat�logos servem principalmente para fins de leitura, e s�o mantidos pelo DB2. Al�m disso, esses dados est�o dispon�veis para consulta, utilizando SQL.

Vamos especificar o container novamente como a pasta C:\DB2 e utilizar o gerenciamento SMS para este exemplo como mostra a�Figura 9.

Figura 9: Armazenamento das tabelas de catalogo

�

Passo 4

Agora faremos algumas configura��es para a performance do banco de dados. Temos duas configura��es b�sicas: uma para deixar o DB2 atualizar o tamanho do tablespace automaticamente, e outra para especificar os tamanhos para os tablespaces.

Caso opte pela configura��o personalizada, voc� poder� especificar todos os tamanhos para o banco de dados.

O valor padr�o dos buffers atribu�dos pelo DB2 � ideal para uma base de dados m�dia de 25 MB at� 250MB. Este range de valores � ideal para o exemplo exposto. Para bancos maiores, o DB2 tamb�m possui padr�es pr�-definidos, sendo que estes valores podem ser alterados a qualquer hora no banco.

Para este exemplo, escolheremos a primeira op��o �Allow DB2 to update table space preferch size automatically� como mostra a�Figura 10.

Figura 10: Performance do banco de dados

Passo 5

Prosseguiremos com a escolha da localidade em que o banco de dados se encontra. Esta etapa tamb�m � importante n�o s� para a gera��o de logs com o fuso hor�rio correto, mas tamb�m para a compatibiliza��o dos caracteres especiais. Exatamente nestes logs � que definimos a codepage do banco de dados, sendo que o padr�o para Brasil � o Code set 1252 (ver�Figura 10).

� importante ressaltar que estes dados n�o podem ser alterados depois da cria��o do banco. Caso estas configura��es estejam erradas, ser� necess�rio excluir este banco de dados e cri�-lo novamente.

Figura 11: Localiza��o do banco de dados

�

Passo 6

Nesta etapa final, o DB2 exibe um sum�rio b�sico do que foi feito para a cria��o do banco de dados. O bot�o Finish finaliza o processo de cria��o do banco de dados. � importante enfatizar que o c�digo SQL para a cria��o do banco de dados pode ser obtido pressionando-se o bot�o Show Command (este SQL poder� ser executado pelo Command Line Editor).

Apresentamos abaixo o c�digo SQL gerado pelo exemplo:

CREATE DATABASE SQLMAG ON 'C:' ALIAS SQLMAG USING CODESET 1252 TERRITORY BR WITH 'Banco de Dados SQL Magazine';

Design Advisor

Logo ap�s o t�rmino da cria��o do banco de dados, o assistente do Design Advisor ser� exibido. O Design Advisor n�o � obrigat�rio para o seu banco, contudo faremos um coment�rio breve a respeito.

A fun��o do Design Advisor � otimizar as cargas de trabalho do banco de dados. A carga de trabalho consiste no n�mero de instru��es SQL executadas contra um banco de dados. Cada instru��o SQL na carga de trabalho recebe uma�freq��ncia. O Design Advisor utiliza a carga de trabalho especificada para determinar quais �ndices ser�o recomendados e criados. Com o Design Advisor podemos trabalhar os seguintes recursos:

�ndices

Conceitualmente, um �ndice � uma ajuda de acesso a dados que pode ser criado em uma�tabela. Fisicamente, ele � um conjunto ordenado de ponteiros para linhas em uma tabela.

Cada �ndice � baseado nos valores de dados de uma ou mais colunas em uma tabela, sendo que cada �ndice � um objeto separado dos dados na tabela. Quando um �ndice � criado, o�gerenciador de banco de dados�construir� a estrutura e a manter� automaticamente. A cria��o de um �ndice atende aos seguintes fins:

oferecer uma maneira r�pida de localizar linhas em uma tabela baseada em seus valores nas colunas chave. Em alguns casos, todas as informa��es necess�rias para uma consulta poder�o ser encontradas no �ndice, tornando desnecess�ria a leitura da tabela;
refor�ar as regras de exclusividade, definindo uma coluna ou grupo de colunas como �ndice exclusivo ou chave principal;
oferecer uma ordena��o l�gica das linhas de uma tabela baseada nos valores de coluna chave;
criar clusters das linhas de uma tabela no armazenamento f�sico de acordo com a ordem do �ndice definido.

Tabela de consulta materializada

As MQTs (Materialized Query Tables) constituem uma maneira poderosa de melhorar o tempo de resposta de consultas complexas, especialmente aquelas que possam envolver alguns dos seguintes itens:

dados agregados em uma ou mais dimens�es;
jun��es e dados agregados em um grupo de tabelas;
dados de um subconjunto de dados comumente acessado, isto �, a partir de uma parti��o horizontal ou vertical "ativa";
dados reparticionados de uma tabela ou de parte de uma tabela em um ambiente de banco de dados particionado.

O conhecimento das MQTs � integrado ao compilador SQL. No compilador SQL, a fase de regrava��o da consulta e o otimizador correspondem a consultas �s MQTs, e determinam se uma MQT deve ser substitu�da por uma consulta que acesse as tabelas b�sicas. Se uma MQT for utilizada, o recurso EXPLAIN poder� fornecer informa��es sobre qual MQT foi selecionada.

Embora traga consigo alguns benef�cios, � importante destacar tamb�m que as MQTs incorrem em custos para espa�o de armazenamento e em sobrecarga envolvida nas atualiza��es. Isto ocorre pois os dados de uma MQT s�o armazenados de forma redundante: uma vez na MQT e outra na tabela ou tabelas b�sicas subjacentes. Isso significa que sempre que os dados das tabelas b�sicas forem atualizados, ser�o necess�rias duas atualiza��es para REFRESH IMMEDIATE MQTs. Em uma carga de trabalho com muitas atualiza��es, esse custo pode exceder os benef�cios de desempenho de candidatos � MQT.

Tamb�m haver� sobrecarga administrativa associada �s MQTs sempre que utilit�rios como LOAD, BACKUP, RESTORE ou RUNSTATS forem executados.

Para determinar se as MQTs oferecem vantagens significativas no desempenho, o Design Advisor considera os custos associados �s MQTs juntamente com as caracter�sticas da carga de trabalho especificada.

Multidimensional Clustering

O MDC (Multidimensional Clustering) permite fazer um cluster f�sico dos dados de uma tabela em mais de uma chave ou dimens�o, simultaneamente. Ele pode aprimorar significativamente o desempenho da consulta. Al�m disso, pode reduzir igualmente a sobrecarga da manuten��o de dados, como opera��es de manuten��o de reorganiza��o e �ndice durante as opera��es de inser��o, atualiza��o e exclus�o. O Multidimensional Clustering � destinado principalmente para data warehousing em grandes ambientes de banco de dados, mas tamb�m pode ser utilizado em ambientes OLTP (Online Transaction Processing).�

Antes da vers�o 8, o DB2 UDB suportava apenas single-dimensional clustering de dados por meio do uso de �ndices de cluster. Utilizando um �ndice de cluster, o DB2 UDB tenta manter a ordem f�sica de dados nas p�ginas na ordem principal do �ndice, conforme os registros s�o inseridos e atualizados na tabela. Os �ndices de cluster aprimoram enormemente o desempenho das consultas de alcance que possuem predicados contendo a chave (ou chaves) do �ndice de cluster, visto que uma parte da tabela precisa ser acessada. Quando as p�ginas s�o subseq�entes, uma pr�-busca mais eficiente pode ser executada.�

O MDC estende esses benef�cios para mais de uma dimens�o ou chave de cluster. No caso do desempenho de consultas, as consultas de alcance que envolvam qualquer combina��o das dimens�es de tabelas especificadas se beneficiar�o com o cluster. Essas consultas n�o ir�o acessar apenas as p�ginas contendo registros com os valores corretos de dimens�o, como tamb�m essas p�ginas de qualifica��o ser�o agrupadas pelas extens�es. Al�m do mais, embora uma tabela com um �ndice de cluster possa ficar sem cluster com o tempo, conforme a tabela for sendo preenchida com espa�os, uma tabela MDC pode manter seu cluster em todas as dimens�es autom�tica e continuamente, eliminando assim a necessidade de reorganizar a tabela para restaurar a ordem f�sica dos dados.�

Embora traga consigo alguns benef�cios, � importante destacar tamb�m que a implementa��o das recomenda��es de tabelas MDC requer a elimina��o e recria��o das tabelas, al�m da cria��o de espa�o de armazenamento adicional para armazen�-las. Se tiver certeza de que n�o deseja fazer isso, n�o selecione esse recurso.

At� a pr�xima.

Confira outros conte�dos:

Por Leandro Em 2008

Oferta ativa

ATÉ

50 % OFF

Aprenda a programar de verdade
com o método que já formou +100 mil alunos.

Garantir desconto

Introdu��o ao DB2

Esse artigo mostra uma introdu��o ao DB2 e ensina como trabalhar com o banco de dados DB2.

Instala��o

Procedimento p�s-instala��o

Criando o seu primeiro banco de dados

Passo 1

Passo 2

Passo 2

Passo 4

Passo 5

Passo 6

Design Advisor

�ndices

Tabela de consulta materializada

Multidimensional Clustering

Confira outros conte�dos: