Expressões Regulares em Banco de Dados Oracle

Express�es regulares representam uma poderosa ferramenta para descri��o e busca de padr�es em diversos tipos de suporte de dados. Esses podem ser bases de dados, textos ou mesmo na pr�pria Internet, como podemos presumir a busca, com a utiliza��o de padr�es, � uma atividade bastante comum, em diversas �reas do conhecimento, e que j� possui um instrumental bastante variado em todos os tipos de sistemas, sejam eles tipicamente comerciais ou cient�ficos. Nesse contexto situa-se a import�ncia de ferramentas cada vez mais vers�teis, quer sejam de extra��o de conhecimento ou de identifica��o de dados. Nesse ponto introduzimos uma t�cnica que poder� servir perfeitamente aqueles que necessitam de mais ferramentas para realizar suas pesquisas em suas bases de dados: Express�es Regulares.

Express�es Regulares j� constam como recurso dispon�vel em diversos sistemas de informa��o h� muito tempo, para os aficionados por Unix/Linux o grep (�Global Regular Expression Print�) n�o � nenhuma novidade, assim como sua utiliza��o em editores de texto e linguagens de programa��o( tais como Java e Perl etc...), e tamb�m j� se encontra incorporado �oficialmente� aos Sistemas Gerenciadores de Bases de Dados(SGBDS) a partir dos SGBDS padr�o ANSI (American National Standards Institute - Instituto Nacional Americano de Padroniza��o) SQL99.

Para a Ci�ncia da Computa��o Express�es Regulares(ERs ou do ingl�s abreviado regex - regular expression) prov� uma forma eficiente de identificar e manusear cadeias de caracteres de interesse, como caracteres particulares, sequ�ncias alfanum�ricas, padr�es num�ricos, etc... Dessa forma podemos, por exemplo, utilizar ERs para:

Localizar um determinado trecho de texto que s� se tem ideia das varia��es poss�veis.
Procurar sequ�ncias alfanum�ricas que se iniciem ou terminem com caracteres conhecidos.
Realizar busca com padr�es complexos de combina��es alfanum�ricas.
Valida��o de formatos de texto
Filtragem de informa��o.

A base te�rica das ERs vem de estudos da neurolingu�stica na d�cada 40, assim como da matem�tica na d�cada de 50, temos como um nome importante Stephen Cole Kleene, que teve grande influ�ncia na Ci�ncia da Computa��o e na Matem�tica. Como recurso de SGBDs, as ERs, foram oficialmente adicionado pelo padr�o SQL:1999(ANSI), como j� mencionado, em conformidade com o padr�o POSIX (Acr�nimo para Portable Operating System Interface que pode ser traduzido como Interface Port�vel entre Sistemas Operacionais). Trata-se de uma fam�lia de normas definidas pelo IEEE (Institute of Electrical and Electronics Engineers - Instituto de Engenheiros Eletricistas e Eletr�nicos)e designada formalmente por IEEE 1003.

Na data em que esse artigo estava sendo redigido v�rios SGBDs j� ofereciam algum suporte a ERs, como o Microsoft SQL Server 2000, MySQL, PostgreSQL, Oracle10G entre outros. Infelizmente a falta de padroniza��o na implementa��o de recursos por parte dos fabricantes de SGBDs � muito sentida em termos de ERs.

Esse artigo cobre a utiliza��o de ERs no SGBD Oracle, vers�es 10G e 11G, com informa��es necess�rias aos usos mais recorrentes dessas fun��es. Caso esteja trabalhando com outro SGBD e queira utilizasse das informa��es aqui encontradas, por gentileza consulte a documenta��o do mesmo para verificar a compatibilidade.

Caracteres especiais utilizados nas Express�es Regulares

Para utiliza��o de Express�es Regulares, se faz necess�rio conhecer alguns metacaracteres (entenda por �curingas� ou �alias�) que s�o encontrados na utiliza��o de ERs, nesse instante apenas citarei algumas rela��es mais completas poder�o ser encontradas a partir das refer�ncias no final do artigo. Para utiliza��o de express�es regulares existem v�rios metacaracteres que devem ser conhecidos, entre eles:

Metacaracter	Fun��o	Exemplo
\	Escape	\\ corresponde a \
^	Posi��o inicial da Linha(String)	^A corresponde a que se deseje as strings que se iniciem com A
$	Posi��o final da Linha(String)	$B corresponde a que se deseje as strings que terminem com B
[ ]	Lista	[abc] a string deve conter qualquer dos caracteres da lista
.	Qualquer caractere	Funciona como um �coringa� trazendo qualquer resultado, por exemplo: n.o trar� qualquer resultado como n�o ou nao
{n}	N�mero de caracteres
\|	Alternativa (similar a ou)	Alternativa de padr�o de busca, por exemplo (�jo�o�\|�maria�)

O padr�o POSIX possui tamb�m classes pr�-definidas que podem ser utilizados com ([ ]) � brackets. Temos como exemplos: [[:lower]], [[:digit]] entre outros, veja rela��o a seguir:

Classe POSIX	Tratamento id�ntico	Significa
[:alnum:]	[A-Za-z0-9]	Caracteres Alfanum�ricos
[:alpha:]	[A-Z a-z]	Mai�sculas/Min�sculas
[:cntrl:]	-	Caracteres de controle
[:digit:]	[0-9]	N�meros
[:lower:]	[a-z]	Caracteres Min�sculos
[:punct:]	[.,!?:;]	Sinais de pontua��o
[:space:]	[\r\n\r\f\v]	Caracteres brancos
[:upper:]	[A-Z]	Caracteres Mai�sculos

Como j� foi colocado, os interessados em aprofundar seus conhecimentos nesse assunto podem utilizar as refer�ncias presentes no item 5 (Para saber mais ) desse artigo, l� encontraram informa��es de onde pesquisar as rela��es de completas de metacaracteres e classes dispon�veis.

Busca de Express�es Regulares no SGBD Oracle

O Oracle vers�o 10G , ou superior, possui as seguintes fun��es de busca baseada no uso de express�es regulares: REGEXP_LIKE(),REGEXP_REPLACE(),REGEXP_SUBSTR() e REGEXP_COUNT(), essa �ltima novidade da vers�o 11G.

REGEXP_LIKE(x, padr�o[,op��o_correspondente]) - Realiza a busca em x da express�o regular definida no par�metro padr�o. Op��o_correspondente pode ser definida com os seguintes valores:

�c� - Especifica correspond�ncia com diferencia��o de mai�sculas e min�sculas( Padr�o � case-Sensitive)
�i� - Especifica a busca sem diferencia��o de caracteres mai�sculos e min�sculos(case-Insensitive)
�n� - Que permite usar o operador de correspond�ncia com qualquer caractere.
�m� - Que trata x como uma linha m�ltipla.
�x� - ignora espa�os em branco.

A semelhan�a com o comando LIKE n�o � mera coincid�ncia, mas o leitor j� poder� notar a maior flexibilidade no uso de REGEXP_LIKE em rela��o ao operador LIKE.

Considerando que a melhor maneira de aprender � com a utiliza��o pr�tica, estarei ilustrando a utiliza��o com v�rios pequenos exemplos de uso, que poder�o ser estudados e adaptados a outras necessidades.

Nesse primeiro exemplo suponhamos a necessidade de achar em uma tabela de clientes todos os clientes com data de nascimento entre 1970 e 1975. Podemos realizar a busca, usando express�es regulares, da seguinte forma:

SELECT  nome, sobrenome, data_nascimento
 FROM clientes
 WHERE REGEXP_LIKE(TO_CHAR(data_nascimento, 'YYYY'), '^197[0-5]

Devemos ter em mente que ERs, ao contr�rio do operador LIKE, tem a tend�ncia de nos trazer tudo, sem a necessidade dos coringas (%), dessa forma precisamos estar atentos para restringir a informa��o de retorno ao desejado.

Para quem n�o tem ainda experi�ncia com express�es regulares, podemos definir, como exemplo, um conjunto num�rico de muitas formas, de forma que [0123456789] � igual � [0-9], esses detalhes podem tornar seu c�digo muito mais leg�vel e elegante, e economizar digita��o � claro. No exemplo anterior poder�amos ler a express�o da seguinte forma, retorne todos os clientes (nome, sobrenome, data de nascimento), cujo ano de nascimento se inicie com 197(�^197�) e termine (�$� ) com um elemento de 0 at� 5 (�[0-5]$�).

Outro exemplo de recupera��o de registros dos clientes, podemos ter a necessidade de recuperar em uma base qualquer os clientes cujo sobrenome se iniciem com �C� ou �c�, realmente um exemplo simples. Nesse caso podemos lan�ar m�o, por exemplo, do seguinte c�digo, onde observem o metacaractere �^� garante a busca no in�cio do campo e a op��o correspondente �i� uma busca case-insensitive:

SELECT  nome, sobrenome, data_nascimento
 FROM clientes
 WHERE REGEXP_LIKE(sobrenome, '^C�, �i�);

Para recuperar os registros dos clientes que se chamem Fl�vio ou Flavio, podemos usar o seguinte o c�digo:

SELECT  nome, sobrenome, data_nascimento
 FROM clientes
 WHERE REGEXP_LIKE(nome , '^FL[a�]�, �i�);

Note nesse caso que os elementos da lista �a ou �� n�o possuem separadores e que a busca � case-insentive. Nesse ponto muitos podem colocar que esse mesmo tipo de busca pode ser feita por meio de LIKE em SQL ou por meio de buscas textuais. Nesse instante devemos pensar que para cada caso existe uma solu��o mais adequada, e que para nesses exemplos a solu��o mais simples elegante � realmente lan�ar m�o das ERs, mas deixo bem claro que existir�o situa��es que a utiliza��o de solu��es textuais, fon�ticas, ou at� mesma a combina��o de v�rias dessas t�cnicas combinadas ainda com Ers, poder�o se mostrar �teis ou at� mesmo necess�rias.

Continuando com nossos exemplos, podemos trazer uma sele��o de linhas em que o nome possua exatamente cinco letras:

 SELECT  nome
  FROM clientes
  WHERE REGEXP_LIKE(nome , '^.....

Podemos observar que o n�mero de caracteres desejadas tamb�m poderia ser expresso da seguinte maneira, no bloco WHERE da nossa express�o:

REGEXP_LIKE(nome, '^.{5}

Nesse momento vamos supor que queremos procurar dois nomes ao mesmo tempo, ou �jo�o� ou �maria�:

SELECT  nome
 FROM clientes
 WHERE REGEXP_LIKE(nome , '(jo�o|maria)','i');

Estes exemplos simples tiveram como objetivo, demonstrar tanto a versatilidade quanto a simplicidade das ERS, e como sua utiliza��o pode se expandir para expandir para muito al�m do nosso conhecido comando LIKE.

N�o poder�amos deixar de citar que podemos lan�ar m�o de ERs nos SGBDs para outras fun��es que n�o somente a busca, podemos utiliza-los, por exemplo para restringir entradas nos SGBDs. Para tanto podemos utilizar tamb�m as ERs para constru��o de constraints, por exemplo, para definir o formato que o n�mero de telefones devem ser armazenados no SGBD, por exemplo (xxx) xxx-xxxxx, poder�amos lan�ar m�o do seguinte comando:

ALTER TABLE cliente    
ADD (CONSTRAINT formato_numero_telefone    
CHECK (REGEXP_LIKE(numero_telefone,  '^\([[:digit:]]{3}\) 
[[:digit:]]{3}-[[:digit:]]{4}

Al�m de REGEXP_LIKE o Oracle disponibiliza as seguintes fun��es com suporte a express�es regulares:

REGEXP_REPLACE() � O uso dessa fun��o � para procurar um padr�o e substitu�-lo por um string dada
REGEXP_SUBSTR() � Retorna parte de uma string com recursos avan�ados. estende as funcionalidades da fun��o SUBSTR, deixando voc� pesquisar uma string para uma express�o regular padr�o. Esta fun��o � �til se voc� precisar o conte�do de uma string, mas n�o corresponder a sua posi��o na string original. A fun��o retorna a string como VARCHAR2 ou CLOB.
REGEXP_COUNT() �Novidade do Oracle 11G - Usado para obter a quantidade de vezes que uma express�o regular ocorre em uma string.

As express�es regulares possuem v�rias vantagens sobre os tradicionais comandos SQLs (LIKE, INSTR, SUBSTR e REPLACE) desses apenas o operador LIKE possui facilidades de busca ( % e _ ), e mesmo assim n�o suporta mecanismos de busca de padr�es ou express�es complexas, sendo muito dif�cil reproduzir express�es regulares complexas com comandos SQL.

E quanto a �ndices?

Todos sabemos que os �ndices s�o um fator muito importante na busca de informa��es em fun��o do melhor desempenho que podem proporcionar as buscas. Assim como com a utiliza��o em SGBDs do comando LIKE , os �ndices padr�es criados em um determinado campo n�o s�o utilizados nas buscas por ERs, no entanto, isso � muito importante, voc� pode criar �ndices baseados em fun��o para implementar desempenho em suas consultas com ERs, caso contr�rio suas consultas com ERs far�o uma varredura completa na tabela(full table scan) o que poder� causar conten��o no banco de dados.

Saiba Mais

First Expressions, Jonathan Gennick
KLEENE, STEPHEN COLE, MATHEMATICAL LOGIC,DOVER SCIENCE,2002 1.Ed

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Edivaldo Em 2009

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Express�es Regulares em Banco de Dados Oracle

Esse artigo trata da utiliza��o de Express�es Regulares em bancos de dados, com o estudo sobre o SGBD Oracle