Consultas case insensitive no Firebird

Introdu��o

A maioria das aplica��es que desenvolvemos, independente de plataforma, precisam fazer consultas a bancos de dados com frequ�ncia. Os tipos de dados e valores utilizados s�o v�rios e por isso as consultas devem estar adequadas �s v�rias situa��es poss�veis.

Por exemplo, fazer uma consulta a uma tabela usando um valor inteiro como filtro � relativamente simples, pois esse tipo de dado � �exato�. Ou seja, um valor num�rico inteiro n�o possui varia��es como acentos, mai�sculo ou min�sculo, etc.

Por�m, quando trabalhamos com colunas do tipo texto, enfrentamos esse tipo de dificuldade que muitas vezes atrapalham a realiza��o de queries. O fator que mais causa problema com esse tipo de consulta � a varia��o de letras mai�sculas e min�sculas. Afinal, o usu�rio que est� buscando um registro em sua aplica��o, n�o deve ser obrigado a saber exatamente como o texto est� escrito, se totalmente em mai�sculo, em min�sculo, ou com varia��es.

Suponha, por exemplo, uma tabela de clientes com a seguinte estrutura.

Figura 1: Estrutura da tabela de clientes

O usu�rio de uma aplica��o que acesse essa tabela pode desejar pesquisar os clientes por c�digo, nesse caso ele deve informar um valor inteiro e que ser� facilmente localizado no banco de dados. Por�m, ele pode desejar consultar pelo nome ou endere�o do cliente, nesse caso, independente de como os dados est�o gravados e de como o valor ser� digitado no campo de busca da aplica��o, os registros devem ser recuperados. Para esses casos, precisamos de uma consulta CASE INSENSITIVE, ou seja, que desconsidere as diferen�as entre letras mai�sculas e min�sculas.

Al�m disso, a consulta n�o pode perder desempenho por causa dessa dificuldade. Os resultados devem ser exibidos o mais r�pido poss�vel. Percebemos ent�o que ser� necess�rio utilizar algum recurso para garantir o desempenho da aplica��o, como criar �NDICES nas colunas de pesquisa.

Nesse artigo veremos como contornar essa situa��o utilizando o banco de dados Firebird. Ser�o apresentadas solu��es adequadas �s vers�es 1.5, 2.0 e 2.1.2 desse SGBD.

Colunas case insensitive no Firebird

Uma forma de realizar consultas case insensitive � converter tanto o texto da coluna quanto o valor buscado para mai�sculo. Por�m, esse m�todo tem algumas limita��es, pois nem todos os caracteres podem ser convertidos para mai�sculo, por exemplo, em alguns idiomas europeus.

Para evitar esse problema, � preciso definir o mesmo COLLATION para os dois textos, de forma a torn�-los compat�veis. Como foi dado o exemplo das linguagens europeias, nesse artigo utilizaremos o collation DE_DE e o charset do banco � o ISO8859_1.

O collation pode ser definido no momento da cria��o da tabela ou direto na consulta, como veremos a seguir.

Listagem 1: Definindo o collation na cria��o da tabela

CREATE TABLE CLIENTES
(
	CODIGO	INT NOT NULL PRIMARY KEY,
	NOME		VARCHAR(100) COLLATE DE_DE,
	ENDERECO	VARCHAR(100) COLLATE DE_DE
)

Listagem 2: Definindo o collation na consulta

SELECT CODIGO, NOME COLLATE DE_DE, ENDERECO COLLATE DE_DE
FROM CLIENTES

Ent�o j� sabemos como contornar o problema de compatibilidade entre idiomas, resta agora aplicar um m�todo para garantir o bom desempenho da consulta. A seguir veremos como resolver isso em algumas vers�es do Firebird.

Solu��o para o Firebird 1.5

Precisamos de um �ndice para as colunas NOME e ENDERECO, mas a consulta n�o ser� feita diretamente pelo valor da coluna, pois este ser� convertido para mai�sculo. Como no Firebird 1.5 n�o � poss�vel definir um �ndice que funcione sobre uma fun��o, uma sa�da � criar colunas cujo valor ser� o conte�do do nome e endere�o j� convertidos para mai�sculo. Essas colunas podem ser preenchidas em um trigger que seja executado em inser��es e altera��es.

Os c�digos a seguir mostram como fazer isso.

Listagem 3: Criando a tabela com colunas auxiliares

CREATE TABLE CLIENTES
(
	CODIGO		INT NOT NULL PRIMARY KEY,
	NOME			VARCHAR(100) COLLATE DE_DE,
	NOME_MAIUSC	VARCHAR(100) COLLATE DE_DE,
	ENDERECO		VARCHAR(100) COLLATE DE_DE,
	ENDERECO_MAIUSC	VARCHAR(100) COLLATE DE_DE
)

Ter�amos ent�o o seguinte trigger para preencher as colunas auxiliares.

Listagem 4: Trigger para preencher as colunas auxiliares

CREATE TRIGGER TGR_CLIENTES_BIU FOR CLIENTES
ACTIVE
BEFORE INSERT OR UPDATE
AS
BEGIN
  NEW.NOME_MAIUSC = UPPER (NEW.NOME);
  NEW.ENDERECO_MAIUSC = UPPER (NEW.ENDERECO);
END

Agora sim podemos criar os �ndices sobre as colunas em mai�sculo, pois elas ser�o utilizadas para consulta.

Listagem 5: Criando �ndice sobre as colunas auxiliares

CREATE INDEX IDX_NOME ON CLIENTES (NOME_MAIUSC);
CREATE INDEX IDX_ENDERECO ON CLIENTES (ENDERECO_MAIUSC);

Na consulta, bastaria aplicar o collate no texto a ser buscado, pois a coluna j� est� devidamente configurada.

Listagem 6: Consulta pelas colunas auxiliares

SELECT * FROM CLIENTES WHERE NOME_MAIUSC = UPPER(:BUSCA COLLATE DE_DE)

SELECT * FROM CLIENTES WHERE ENDERECO_MAIUSC = UPPER(:BUSCA COLLATE DE_DE)

De fato essa solu��o � um tanto �trabalhosa� e requer v�rias linhas de c�digo adicionais. Na vers�o 2.0 isso pode ser resolvido mais facilmente, como veremos a seguir.

Solu��o para o Firebird 2.0

Nessa vers�o foi inserido um recurso que permite criar �ndices sobre express�es e n�o apenas sobre colunas �puras�. Nesse caso, podemos criar um �ndice que funcione sobre as colunas NOME e ENDERECO j� aplicadas na fun��o UPPER e com o collate.

Listagem 7: Cria��o de �ndices sobre a fun��o UPPER

CREATE INDEX IDX_NOME ON CLIENTES COMPUTED BY (UPPER (NOME COLLATE DE_DE));

CREATE INDEX IDX_ENDERECO ON CLIENTES COMPUTED BY (UPPER (ENDERECO COLLATE DE_DE));

Assim podemos fazer a consulta diretamente pelas colunas originais, utilizando a mesma express�o definida no �ndice.

Listagem 8: Consulta pelas colunas originais com �ndice

SELECT * FROM CLIENTES WHERE UPPER (NOME COLLATE DE_DE) = UPPER(:BUSCA COLLATE DE_DE)

SELECT * FROM CLIENTES WHERE UPPER (ENDERECO COLLATE DE_DE) = UPPER(:BUSCA COLLATE DE_DE)

Como vemos, a solu��o nessa vers�o do Firebird � bem mais pr�tica e simples de se aplicar. Por�m, veremos que na vers�o 2.1.2 � poss�vel fazer o mesmo utilizando ainda menos c�digo.

Solu��o a partir do Firebird 2.1.2

A partir da vers�o 2.1.2 � poss�vel utilizar um novo collation chamado UNICODE_CI que funciona para o conjunto de caracteres UTF8, um padr�o universal que busca eliminar incompatibilidades entre idiomas, reunindo v�rios tipos de s�mbolos gr�ficos (caracteres).

Para definir o charset do banco de dados, basta selecionar a op��o correta no momento da cria��o do mesmo. A figura a seguir mostra a tela de cria��o de um database no IBExpert, note que h� um campo �Charset� em destaque, nele deve ser selecionada a op��o �UTF8�.

Figura 2: Definindo o charset do banco

O �CI� no nome do collation significa exatamente CASE INSENSITIVE e faz com que na utiliza��o da coluna sejam desconsideradas diferen�as entre letras mai�sculas e min�sculas.

Assim, poder�amos alterar o c�digo da Listagem 1 para usar esse novo collation.

Listagem 9: Criando a tabela com o collation UNICODE_CI

CREATE TABLE CLIENTES
(
	CODIGO	INT NOT NULL PRIMARY KEY,
	NOME		VARCHAR(100) COLLATE UNICODE_CI,
	ENDERECO	VARCHAR(100) COLLATE UNICODE_CI
)

Com isso, a cria��o dos �ndices poderia ser feita da forma mais comum, como vemos a seguir.

Listagem 10: Cria��o dos �ndices normalmente

CREATE INDEX IDX_NOME ON CLIENTES(NOME);
CREATE INDEX IDX_ENDERECO ON CLIENTES(ENDERECO);

A consulta tamb�m n�o precisaria ter o collation ou a fun��o UPPER.

Listagem 11: Consulta usando o collation UNICODE_CI

SELECT * FROM CLIENTES WHERE NOME = :BUSCA

SELECT * FROM CLIENTES WHERE ENDERECO = :BUSCA

Conclus�o

Com a introdu��o do collation UNICODE_CI, a realiza��o de consultas case insensitive se tornou bem mais simples (vale lembrar que esse collation foi criado para o charset UTF8, caso esse n�o seja o charset do banco, essa solu��o n�o ir� funcionar). Por�m, nem sempre � poss�vel migrar a vers�o do banco, portanto, aqui foram apresentadas solu��es para tr�s diferentes vers�es do Firebird.

Espero que as informa��es apresentadas nesse artigo possam ser �teis. At� a pr�xima oportunidade.

Confira outros conte�dos:

Por Joel Em 2012

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Gladstone Matos

DevMedia

otimo!

há +1 ano

Joel Rodrigues

Valeu, Gladstone. Obrigado pelo coment�rio.

Abs