Artigo Java Magazine 30 - O Novo HSQLDB

Esse artigo faz parte da revista Java Magazine edi��o 30. Clique aqui para ler todos os artigos desta edi��o

OR: windowtext; FONT-FAMILY: Verdana">Y: Verdana; mso-bidi-font-size: 16.0pt">Conhe�a a nova vers�o do mais popular banco de dados Java

Aprenda a configurar bancos de dados HSQLDB em uma rede local ou a embutir o engine deste banco de dados em suas aplica��es Java

Fernando Lozano

O HSQLDB � um banco de dados criado inteiramente em Java, capaz de operar embutido em uma aplica��o ou como um servidor de rede independente. Suporta um rico dialeto SQL, incluindo triggers, integridade referencial, outer joins, vis�es, transa��es, campos BLOB, schemas, roles e consultas correlatas. O dialeto SQL do HSQLDB � mais rico do que muitos SGBDs tidos como �mais poderosos�, por exemplo o MySQL. Tudo dentro de um pacote jar contendo menos de 200 Kb (se compilado sem as ferramentas gr�ficas de administra��o e servidor web embutido).

A popularidade do HSQLDB � ineg�vel se olharmos para os projetos que o incluem como padr�o, que v�o desde servidores de aplica��o J2EE como o JBoss, at� ferramentas de desenvolvimento desktop como o iReport. A vers�o 2.0 do OpenOffice, a popular su�te de escrit�rios que se firmou como alternativa ao Office da Microsoft, mesmo n�o sendo uma aplica��o escrita em Java, inclui o HSQLDB como servidor de banco de dados embutido na aplica��o OOo Base (que fornece funcionalidade similar ao Access da Microsoft).

O HSQLDB j� foi apresentado antes nesta coluna, na Edi��o 7, al�m de ter sido usado em v�rios exemplos de aplica��es (como nas s�ries recentes sobre o Tomcat 5 e o NetBeans), e em outras mat�rias da Java Magazine. No presente artigo s�o apresentados novos recursos da vers�o 1.8 e funcionalidades avan�adas n�o vistas no primeiro artigo. S�o fornecidas tamb�m informa��es suficientes para quem nunca antes usou o HSQLDB decidir se ele pode ser ou n�o a solu��o para suas necessidades, e para criar as primeiras aplica��es para esse banco de dados livre 100% Java.

O corpo principal deste artigo apresenta a arquitetura, caracter�sticas e recursos do HSQLDB. Depois s�o apresentadas ferramentas para administra��o do banco. O artigo finaliza com dicas para a programa��o de procedimentos armazenados. O tutorial �Primeiros passos com o HSQLDB� apresenta a instala��o e o uso b�sico do banco de dados, incluindo a cria��o de uma aplica��o cliente.

Terminologia e conceitos gerais

Antes de prosseguir com o HSQLDB, vamos definir a terminologia utilizada. Chamamos de banco de dados um conjunto de informa��es organizadas para um prop�sito espec�fico. Conceitualmente, um arquivo .txt pode ser um banco de dados, por exemplo, se este arquivo for a rela��o de "favoritos" do seu navegador web, ou suas senhas de acesso a servi�os on-line, como o de provedor internet ou um portal frequentemente visitado. At� mesmo um caderno onde se anotam telefones e endere�os de e-mail dos amigos tamb�m � um banco de dados pode ser considerado um banco de dados.

J� um sistema gerenciador de bancos de dados (SGBD) � o software que gerencia o acesso a um ou mais bancos de dados, em vez de deixar outras aplica��es o acessarem diretamente. O SGBD garante performance e integridade no acesso e na modifica��o aos dados, simplificando a escrita de aplica��es. Sendo muito comum se fazer o acesso a dados por meio de SGBDs, o termo �banco de dados� � usado freq�entemente como sin�nimo de SGBD.

Se o SGBD est� embutido em uma aplica��o, em vez de executar como um servidor de rede, costuma-se cham�-lo de engine (motor ou mecanismo) de banco de dados.

Arquitetura do HSQLDB

O HSQLDB foi criado para ser um banco de dados leve, com pouca demanda de uso de processador, mem�ria e armazenamento. Ele � voltado para uso embarcado, seja internalizado a uma aplica��o desktop, ou dentro de um hardware especialmente projetado. O HSQLDB foi, por exemplo, utilizado com sucesso no PDA Zaurus da Sharp e como parte do sistema de apura��o eletr�nica das elei��es no Brasil (no software fornecido para a imprensa, candidatos e partidos acompanharem as apura��es em tempo real).

O Projeto JVending (jvending.sf.net), uma aplica��o de com�rcio P2P, fornece um porte do HSQLDB 1.8 para o profile CDC do J2ME. � necess�rio tamb�m o pacote opcional (para o J2ME) JDBC-CDC (jcp.org/en/jsr/detail?id=169). A vers�o customizada do HSQLDB pode ser baixada em sf.net/project/showfiles.php?group_id=10291 e o JDBC-CDC em java.sun.com/products/jdbc/download.html#cdcfp

O cora��o do HSQLDB � um engine SQL que opera inteiramente em mem�ria, sem usar arquivos tempor�rios em disco. Isto torna o HSQLDB capaz, por exemplo, de operar inteiramente a partir de um CD, ou em ambientes apenas com (pouca) mem�ria Flash. Mas traz uma limita��o: todos os registros que satisfizerem a uma consulta devem ser mantidos em mem�ria. O mesmo ocorre com os �ndices das tabelas. Ou seja, embora o HSQLDB seja capaz de lidar com bancos de dados ocupando at� 8 Gb em disco (utilizando o tipo de tabela cached, apresentado mais adiante), ele n�o ser� capaz de retornar todos os registros deste banco como resultado de uma �nica consulta.

Uma forma de contornar esta limita��o � usar a cl�usula LIMIT do comando SELECT, para limitar a quantidade de registros retornados, e assim transformar o que seria uma �nica consulta em uma sucess�o de consultas que retornam, cada uma, uma fra��o dos resultados desejados.

O engine do HSQLDB roda como um �nico thread, de modo que realiza um comando SQL por vez. Se este comando for um procedimento armazenado, este ser� totalmente executado antes que outro comando SQL possa ser processado. Pode parecer uma limita��o muito s�ria, mas ela permite ao engine utilizar pouca mem�ria e para gerenciar locks e transa��es. De fato, o manual do HSQLDB afirma que 170 Kb de RAM s�o suficientes para rodar o engine (fora a quantidade de mem�ria utilizada pelos ResultSets JDBC abertos pela aplica��o e pela mem�ria ocupada pela pr�pria JVM).

O fato do engine utilizar um �nico thread n�o impede que o servidor HSQLDB aceite v�rias conex�es de rede simult�neas, sendo cada uma servida pelo seu pr�prio thread. Tamb�m n�o impede que cada conex�o esteja percorrendo um ResultSet diferente ao mesmo tempo, pois cada thread de conex�o mant�m a refer�ncia aos seus dados retornados. Mas v�rias conex�es simult�neas aumentam a demanda de mem�ria do servidor HSQLDB, e a execu��o de comandos SQL um-a-um pode comprometer o tempo de resposta quando houver uma grande quantidade de usu�rios simult�neos.

Por outro lado, com v�rios threads independentes gerenciando as conex�es, as atividades que envolvem acesso a rede (envio de comandos SQL e devolu��o de resultados) s�o executadas em paralelo. Assim o HSQLDB � capaz de atender a algumas dezenas de usu�rios concorrentes sem que se perceba, na maioria dos casos, alguma degrada��o de performance.

Se uma aplica��o (local ou servidora) utilizar v�rios bancos de dados HSQLDB simultaneamente, cada banco ter� seu pr�prio thread de engine, de modo que usu�rios de um banco n�o competem com usu�rios de outras.

Benchmarks criados pelo projeto PolePosition (polepos.org) colocaram o HSQLDB de modo geral com uma performance superior a outros bancos de dados livres, entre eles o MySQL e o Apache Derby (apresentado na Edi��o 29). As p�ginas do projeto dizem que a maioria dos bancos propriet�rios tiveram nos testes um desempenho bastante inferior ao MySQL (e portanto tamb�m ao HSQLDB), mas quest�es de licenciamento impedem o projeto de divulgar os resultados para estes bancos.

Modos de opera��o

Para dar maior flexibilidade ao desenvolvedor, o HSQLDB pode operar em quatro modos de opera��o, que determinam como aplica��es-clientes se comunicam com o engine SQL: Server, Standalone, Web Server e Servlet. Tr�s desses modos de opera��o (Server, Web Server e Servlet) permitem o uso de conex�es seguras no padr�o SSL/TLS, utilizando o JCE (Java Cryptography Extensions).

Standalone

No modo Standalone, o HSQLDB roda na mesma JVM que a aplica��o. Pode haver v�rias conex�es simult�neas ao banco, desde que todas partam de outros threads na mesma JVM. Este modo � geralmente o preferido para aplica��es embarcadas, por n�o exigir a abertura de portas TCP, nem impor o consumo de mem�ria e processamento adicional gerado pelo envio dos comandos SQL e pela serializa��o dos resultados.

O engine SQL em si roda em um thread separado, que s� ser� finalizado ao ser encerrada a JVM (chamando-se o m�todo System.exit()) ou se for enviado o comando SQL shutdown, da mesma forma que se faria no modo Server.

Containers web ou EJB podem usar o modo Standalone em vez do modo server. Ter�o assim um ambiente mais leve e mais seguro, j� que o banco de dados n�o estar� exposto a conex�es externas. Esta possibilidade � nova no 1.8, pois antes um banco HSQLDB no modo Standalone s� permitia uma conex�o por vez (veja o quadro �Novos recursos da vers�o 1.8�).

Server

O modo Server � o preferencial para desenvolvimento, ou quando se usa o HSQLDB como servidor de banco de dados departamental. Nesse modo de opera��o, s�o aceitas conex�es em uma porta TCP (por padr�o a 9001), utilizando um protocolo de aplica��o pr�prio do HSQLDB. Dessa maneira, v�rios clientes em JVMs diferentes podem acessar o mesmo banco de dados simultaneamente.

O servidor s� ser� encerrado se ele receber o comando SQL shutdown, que deve ser enviado por uma conex�o realizada por um usu�rio com permiss�es de administrador do banco (por padr�o o usu�rio "sa").

Web Server

Para situa��es em que se deseja fornecer acesso remoto ao banco de dados, mas h� um firewall no meio do caminho, existe o modo de opera��o Web Server. Neste modo o HSQLDB aceita conex�es TCP/IP encapsulando comandos SQL, e retorna os resultados pela mesma conex�o.

Um cen�rio para o modo Web Server � o uso de applets Java ou do Java Web Start (JWS). Nesses casos, as configura��es do sandbox[1] da JVM podem impedir que sejam criadas conex�es TCP/IP a outro que n�o o servidor web de origem da aplica��o. Assim, rodar o pr�prio HSQLDB como servidor web contorna esta restri��es.

No modo Web Server, o HSQLDB tamb�m � capaz de responder a requisi��es GET e HEAD para arquivos est�ticos (imagens, arquivos HTML etc.). Dessa forma, ele mesmo poderia fornecer a p�gina web que cont�m o applet ou a aplica��o JWS para iniciar a aplica��o.

Diferentemente de conex�es HTTP padr�o, o HSQLDB no modo Web Server mant�m a conex�o aberta para receber m�ltiplos comandos SQL. Isso possibilita a realiza��o de transa��es (o quadro �Novos recursos da vers�o 1.8� mostra mais detalhes).

O comando shutdown continua sendo necess�rio para finalizar o HSQLDB neste modo.

Servlet

O modo Servlet atende a usu�rios de servi�os de hospedagem compartilhada em sites web. Muitos destes servi�os n�o fornecem acesso a um banco de dados, ou fornecem apenas uma op��o padr�o (a mais popular � o MySQL). O usu�rio pode fazer a instala��o de pacotes war ou em alguns casos at� pacotes ejb-jar e ear, mas n�o pode instalar novas aplica��es no servidor do provedor, especialmente aplica��es que escutem em portas TCP ( pois isto pode comprometer a seguran�a do servidor e afetar outros usu�rios). Para contornar as limita��es do servi�o oferecido pelo provedor, o HSQLDB fornece um servlet que recebe comandos SQL como parte dos par�metros da requisi��o HTTP e devolve os resultados como resposta � requisi��o.

O modo Servlet � praticamente igual ao Web Server � apenas o HSQLDB n�o responde diretamente a conex�es HTTP, deixando que o container web (ou o servidor web que o cont�m) responda �s requisi��es. Como no modo Web Server, ele utiliza conex�es HTTP persistentes para permitir a realiza��o de transa��es no banco de dados.

Da mesma forma que no modo Standalone, o engine � executado como um thread, em separado dos threads que executam o servlet do HSQLDB, e deve ser encerrado pelo comando shutdown.

Modo Standalone e servidores de aplica��es

Foi dito, na descri��o do modo Standalone, que esse modo pode ser adequado para aplica��es web e EJB, mesmo para usu�rios de servi�os de hospedagem compartilhada � se apenas a aplica��o acessar o banco de dados. Entretanto, o modo Standalone n�o permite conex�es remotas para realizar tarefas administrativas (como mudar as colunas de uma tabela) ou para depura��o (verificar diretamente os dados armazenados em uma tabela, para conferir o resultado de uma consulta).

Por isso, alguns usu�rios preferem usar os modos Web Server ou Servlet � se o modo Server n�o foi poss�vel por causa de firewalls ou restri��es do provedor de hospedagem. Por outro lado, os modos de servidor deixam o banco exposto a conex�es diretas e poss�veis ataques de hackers, envolvendo captura ou adivinha��o das senhas dos usu�rios. De modo geral, n�o � recomendado expor diretamente um servidor de banco de dados a conex�es partindo de fora da rede local da empresa, embora o suporte a SSL no HSQLDB possa amenizar bastante os riscos.

Outros usu�rios usam um �console SQL� rodando como um servlet ou p�gina JSP de uma aplica��o web, que aceita comandos SQL gen�ricos e exibe os resultados da sua execu��o. Dessa forma, h� a vantagem de performance do modo Standalone com a flexibilidade de realizar remotamente tarefas administrativas, sem necessidade de parar a aplica��o web. Embora um console SQL como esse seja simples de escrever, deix�-lo dispon�vel no provedor junto com a aplica��o representa praticamente os mesmos riscos de seguran�a que deixar o pr�prio servidor de banco de dados aceitando conex�es diretas.

Tipos de tabelas

O HSQLDB permite definir tr�s tipos de tabelas. O tipo deve ser estabelecido no momento da cria��o da tabela, e determina a estrutura de armazenamento dos dados em mem�ria e/ou em disco.

Em mem�ria (Memory)

O tipo Memory � o padr�o para a cria��o de tabelas. Com ele, todos os registros da tabela s�o mantidos em mem�ria para acesso r�pido. Entretanto, os dados s�o preservados permanentemente em disco na finaliza��o do banco de dados, e tamb�m no log de transa��es, evitando a perda de dados em caso de falha no software ou hardware do servidor.

O uso de tabelas do tipo Memory pode levar a grandes demandas de mem�ria na aplica��o. Por outro lado, v�rias aplica��es se beneficiam de ter seus dados inteiramente em mem�ria, e � mais simples e confi�vel utilizar este recurso do HSQLDB do que usar mecanismos de cache com um banco de dados tradicional, pois o cache feito fora do banco de dados pode facilmente ficar desatualizado.

Em cache (Cached)

Tabelas Cached mant�m os registros acessados mais recentemente em mem�ria, mas gravam todos o dados em disco de forma imediata. O tamanho do cache � configurado pelo administrador para a banco de dados como um todo, n�o por tabela ou por banco de dados, de modo que ele possa limitar o consumo de mem�ria total.

Tabelas cached tamb�m ajudam a limitar o tamanho do arquivo .script do banco de dados e a dura��o de uma opera��o de checkpoint (mais sobre estes adiante).

Texto (Text)

Uma do tipo Text usa um arquivo texto comum (seguindo o padr�o CSV) para armazenamento permanente dos seus registros, e a mesma �rea de mem�ria para cache de registros que � utilizada para as tabelas cached. Tabelas de texto simplificam a troca de dados com fontes externas de dados, ao custo de uma pequena perda de performance.

A primeira linha do arquivo � um cabe�alho que fornece os nomes das colunas da tabela. Cada uma das linha restantes corresponde a um registro. O caractere separador de campos usado (a v�rgula, como padr�o), e o uso de aspas ou outro delimitador para strings podem ser definidos para cada tabela, com o comando SQL set, ou de forma global no arquivo de propriedades do banco de dados.

Definindo o tipo de uma tabela

O tipo da tabela � determinado no momento da sua cria��o. Entre as palavras-chave create e table deve ser indicado o tipo de tabela, e o comando SQL create table gera tabelas em mem�ria. Dessa forma, os dois comandos a seguir s�o equivalentes:

create table <nome> (<colunas>...) ...

Quer ler esse conteúdo completo? Tenha acesso completo