PostgreSQL x MySQL. Qual Escolher?

Kaui Aires Oliveira (e-mail) � Bacharelando em Sistemas de Informa��es. Possui larga Experi�ncia Profissional, cerca de 8 anos trabalhando com TI, � especialista em banco de dados e seguran�a da informa��o. Experi�ncias em Oracle, PostgreSQL, MsSQLServer, MySQL, DW, BI e etc. Tendo trabalhado em grandes corpora��es, como Microsoft (New York), TATA Consultancy Services do Brasil, IBM, Sebrae, FGV e, atualmente, no MEC. Tendo ainda bastante viv�ncia tamb�m na �rea acad�mica, publicando artigos e ministrando cursos/palestras sobre banco de dados, business intelligence, datawarehouse e seguran�a da informa��o. E tem um site de publica��es de mat�rias e trabalho pessoal (www.pinguinsdocerrado.com.br).

Ol� caros amigos. Mais um artigo que estou publicando e gostaria desta vez de falar sobre dois excelentes SGBDs, fazendo as devidas compara��es.

S�o dois SGBDs, ambos gratuitos. O MySQL est� dispon�vel sob a GPL (Licen�a P�blica GNU), al�m de possuir uma licen�a convencional, para quem n�o quiser estar limitado aos termos da GPL. J� o PostgreSQL est� dispon�vel sob a flex�vel licen�a BSD.

O MySQL � o mais utilizado no desenvolvimento de aplica��es onde a velocidade � importante (por�m isto tem mudado com vers�es mais recentes do PostgreSQL), enquanto que o PostgreSQL se destaca por ser mais robusto e possuir muito mais recursos que o MySQL. Esses recursos tornam o PostgreSQL um �banco de dados� no conceito de muita gente.

Nas �ltimas vers�es do MySQL, os desenvolvedores acrescentaram diversos recursos que j� existiam no PostgreSQL como transa��es (confirma��o e cancelamento de opera��es realizadas COMMIT e ROLLBACK), triggers (gatilhos), Stored Procedures (Procedimentos Armazenados), views (vis�es), lock line (bloqueio em n�vel de linha) e constraints (cl�usulas de integridade).

No entanto, o PostgreSQL continua sendo mais eficiente em v�rios aspectos. Possui um sofisticado mecanismo de bloqueio (MVCC veremos a seguir), suporta tamanhos ilimitados de linhas, bancos de dados e tabelas (at� 16TB), aceita v�rios tipos de sub-consultas, possui mais tipos de dados e conta com um bom mecanismo de FAILSAVE (Seguran�a contra falhas, por exemplo no desligamento repentino do sistema).

Como j� foi dito no in�cio deste artigo, a vantagem do MySQL ainda � a velocidade de acesso (que �s vezes nem � notada pois est� na escala de mil�simos de segundo). Para bases de dados muito grandes, complexas e que exige confiabilidade e escalabilidade vale a pena usar o PostgreSQL. Para base de dados menores, n�o h� diferen�a na velocidade ou pode se desconsiderar os mil�simos de segundos entre os dois SGBDs.

A T�cnica MVCC � PostgreSQL

Multi-Version Concurrency Control (MVCC) � uma t�cnica avan�ada do PostgreSQL que resolve aquele antigo problema de ambientes multiusu�rios de banco de dados, os LOCKs (bloqueios) que fazem o usu�rio ficar esperando.

Ao contr�rio de outros SGBDs que utilizam que utilizam LOCKs para controle de concorr�ncia, o PostgreSQL mant�m a consist�ncia dos dados usando um modelo multivers�o. Neste modelo, cada transa��o ter� sua vers�o do banco de dados, estando protegidas de acessar dados inconsistentes que poderiam ser gerados por outras transa��es. Portanto, o MVCC oferece o isolamento de transa��es, alem de garantir que leituras nunca aguardar�o escritas e vice-versa.

Isolamento das Transa��es

O Padr�o SQL ANSI/ISSO define quatro n�veis de isolamento de transa��es baseados nas seguintes situa��es:

Dirty Reads: ocorre quando uma transa��o l� dados escritos por uma transa��o corrente que ainda n�o foi confirmada (COMMIT).

Non-Repeatable Reads: uma transa��o l� um dado que ela j� havia lido anteriormente, e descobre que aqueles dados foram modificados por outra transa��o (confirmada ap�s a primeira leitura).

Phantom Read: uma transa��o l� um conjunto de linhas que satisfa�a algum crit�rio de pesquisa. Outra transa��o insere uma linha que satisfa�a o crit�rio da anterior. Se a primeira transa��o executar novamente o comando de pesquisa, ela receber� um conjunto diferente de linhas.

Os quadros de n�veis de isolamentos s�o descritos a seguir para voc� entender melhor.

N�vel	Descri��o
*Read Uncommitted*	Uma transa��o pode enxergar dados n�o confirmados por outra transa��o
*Read Committed*	Uma transa��o n�o pode enxergar dados n�o confirmados por outra transa��o, at� que estes dados sejam confirmados.
*Repeatable Read*	Uma transa��o neste n�vel garante que valores j� lidos n�o possam ser alterados por outra transa��o.
*Serializable*	Uma transa��o s� poder� interagir com outras transa��es concorrentes no sentido de produzir o mesmo efeito, como se cada transa��o estivesse sendo executada uma ap�s a outra.

A tabela a seguir mostra quais situa��es podem ocorrer em cada um dos n�veis de isolamento:

N�vel	Dirty Reads	Non-Repeatable Reads	Phantom Read
*Read Uncommitted*	Poss�vel	Poss�vel	Poss�vel
*Read Committed*	Imposs�vel	Poss�vel	Poss�vel
*Repeatable Read*	Imposs�vel	Imposs�vel	Poss�vel
*Serializable*	Imposs�vel	Imposs�vel	Imposs�vel

Obs.: No PostgreSQL est�o dispon�veis os n�veis de isolamento READ, COMMITTED e SERIALIZABLE.

Para Finalizar um Bate�bola r�pido...

Caracter�sticas do MySQL

Foco em facilidade de administra��o e baixo consumo de recursos do hardware. Tornou-se popular gra�as � Internet, pois os bancos tradicionais tinham tempos de conex�o extremamente elevados, inadequados para aplica��es CGI. Para atingir seus objetivos, n�o implementava fun��es com grande overhead como integridade referencial, commit, rollback e n�veis de isolamento de transa��o.

a. Servidor multithreaded:
b. Um �nico processo mysqld atende a todos os clientes.
c. Tabelas e �ndices correspondem � arquivos f�sicos e bancos de dados correspondem � diret�rios.
d. Distribui��o de dados em m�ltiplos discos deve ser feita manualmente, por meio de links simb�licos.
e. Seguran�a via SSL
f. Com suporte � transa��es
g. Recursos SQL mais sofisticados, como agregados, COMMIT e ROLLBACK, triggers (gatilhos), Stored Procedures (Procedimentos Armazenados), views (vis�es), lock line (bloqueio em n�vel de linha) e constraints (cl�usulas de integridade).
h. Maior compatibilidade com o padr�o ANSI.

Plataformas Plataformas Suportadas pelo MySQL

a. Servidor
b. Sistemas Unix-Like:
c. GNU/Linux, FreeBSD, Solaris, AIX, HP-UX,...
d. Win32: Windows 95/98/ME, Windows NT/2000/XP/NET
e. OS/2 (em desenvolvimento para BeOS e LynxOS)
f. Cliente: Drivers ODBC e dbExpress para Unix e Windows V�rias ofertas de drivers JDBC 2.0 100% Java.

Quando Usar o MySQL

a. Back-end para gera��o de conte�do de web sites
b. Aplica��o envolvendo basicamente consultas e adi��o de dados. Sugiro n�o usar para aplica��es com fortes demandas transacionais, especialmente se houverem atualiza��es concorrentes!
c. Empresas como o Yahoo Finance combinam o MySQL (aplica��es web) com um outro banco de dados (retaguarda financeira).

Caracter�sticas do PostgreSQL

O PostgreSQL � um sistema gerenciador de banco de dados objeto-relacional (SGBDOR), baseado no PostgreSQL desenvolvido pelo Departamento de Ci�ncia da Computa��o da Universidade da Calif�rnia em Berkeley. O POSTGRES foi pioneiro em v�rios conceitos que somente se tornaram dispon�veis muito mais tarde em alguns sistemas de banco de dados comerciais.

O PostgreSQL � um descendente de c�digo fonte aberto deste c�digo original de Berkeley. � suportada grande parte do padr�o SQL:2003, al�m de serem oferecidas muitas funcionalidades modernas, como:

. comandos complexos
. chaves estrangeiras
. gatilhos
. vis�es
. integridade transacional
. controle de simultaneidade multivers�o

Al�m disso, o PostgreSQL pode ser estendido pelo usu�rio de muitas maneiras como, por exemplo, adicionando novos:

. tipos de dado
. fun��es
. operadores
. fun��es de agrega��o
. m�todos de �ndice
. linguagens procedurais

Devido � sua licen�a liberal, o PostgreSQL pode ser utilizado, modificado e distribu�do por qualquer pessoa para qualquer finalidade, seja privada, comercial ou acad�mica, livre de encargos.

g. Implementa��o completa dos padr�es ANSI para o SQL, como selects aninhados, integridade referencial, views, triggers,...
h. Extens�es orientadas a objeto, como tipos abstratos de dados, heran�a, atributos multivaluados...
i. Fun��es definidas pelo usu�rio, mas que n�o podem retornar registros, portanto n�o tem ainda a mesma funcionalidade dos procedimentos armazenados em outros bancos
j. Servidor em m�ltiplos processos: um �nico processo postmaster recebe as conex�es de rede, e inicia um processo postgres para cada cliente
l. Uso intensivo de mem�ria compartilhada e sem�foros � pode ser necess�rio ajustar par�metros do kernel para melhorar o desempenho ou para atender a cargas de trabalho maiores
m. Tabelas e �ndices correspondem � arquivos f�sicos e bancos de dados correspondem � diret�rios. Podem ser configurados v�rios diret�rios diferentes para hospedar (arquivos de) bancos de dados
n. Seguran�a via Kerberos e/ou SSL
o. Views funcionais
p. Fun��es definidas pelo usu�rio em TCL, Perl, C,...
q. Outer joins
r. Postgres file system, para suporte a raw devices
s. M�quina Virtual Java integrada ao banco
t. Backups on-line r�pidos
u. Two-phase commit.

Plataformas Plataformas Suportadas Pelo PostgreSQL

a. Sistemas Unix-like
b. GNU/Linux, FreeBSD, Solaris, AIX, HP-UX,...
c. Windows NT/2000/XP/NET (Cygwin) e MacOS X
d. Cliente
e. Bibliotecas nativas C para Unix, Win95/NT e OS/2
f. Drivers ODBC (2.5) e dbExpress nativos para Unix e Windows Driver JDBC 1.0 (2.0 parcial) 100% Java

Quando Usar o PostgreSQL

Aplica��es com fortes componentes transacionais. Aplica��es que necessitem de tipos de dados especializados, como Sistemas de Informa��es Geogr�ficas (SIG) e reposit�rios de meta-dados Projetos baseados em metodologias Orientadas Objeto � perda de compatibilidade com o padr�o ANSI SQL Aplica��es OLAP �light�, que n�o necessitem do n�vel de sofistica��o de um DataWarehouse.

Agora � com voc�! Grande Abra�o!

Confira outros conte�dos:

Por Imaster1 Em 2006

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Ednilson Teixeira

Ol� boa noite. Estou tendo um problema com minha aplica��o que pelo que parece, "come�ou do nada". O problema que tem ocorrendo ao inserir novos registros no banco, vem ocorrendo o erro "23505: duplicate key value violates unique constraint PK_pdv_documentos_recebidos". Isso est� ocorrendo em diversas entidades diferentes. Estava tudo funcionando normalmente h� alguns dias. Estou usando o entity frameword core e postgresql. Voc�s conseguem me dar uma ajuda?? Grato.

há +1 ano

Ver coment�rios anteriores (2)

Romulo Sousa

Show! � isso ai
Qualquer coisa � s� chamar

há +1 ano

Luiz Filho

Eh poss�vel migrar do sql server 2000 pra pg sem muito risco ?

há +1 ano

Pablo Carvalho

Fala Luiz, tranquilo?

Cara, toda e qualquer migra��o vai existir risco! O que voc� pode fazer e eu acho super v�lido � verificar exatamente quais as features do SQL Server voc� utiliza nas aplica��es, e em seguida, conferir se elas existem da mesma forma ou possuim alguma adapta��o no Postgre.

Agora se voc� esta utilizando o SQL Server 2000, isso pode ter um pouco mais de complica��es porque � uma vers�o muito antiga, ent�o muita coisa pode ter mudado, entende?

Grande abra�o.

há +1 ano

Tiago

Gente de quando � este artigo ? n�o tem data .. OMG

Gostaria de saber se isso vale para o atual mercado... pois ambos tiverem muitas melhorias recentemente.

há +1 ano

Ver coment�rio anterior

Pablo Carvalho

Opa Tiago, complementando o que a Daniella falou, mesmo sendo um artigo mais antigo, e com as crescentes melhorias em ambos (MySQL e PostgreSQL), a ideia de "Quando utilizar" um ou outro, ainda � bem atual.

Tanto o MySQL quanto PostgreSQL podem ser facilmente utilizados em basicamente qualquer projeto, por�m, quando cen�rio � mais complexo, que envolva talvez grandes volumes de dados ou que tratem de informa��es cr�ticas, o PostgreSQL ainda � mais utilizado.

Agora para aplica��es WEB comuns, onde voc� precisa de agilidade, geralmente a escolha e feita pelo MySQL, at� mesmo pela facilidade de implementa��o em Hospedagens WEB.

Espero ter ajudado =]

há +1 ano

PostgreSQL x MySQL. Qual Escolher?

Veja neste artigo : PostgreSQL x MySQL. Qual Escolher?

PostgreSQL x MySQL. Qual Escolher?

Confira outros conte�dos: