Otimização de Banco de dados no MySQL

Este artigo tem como objetivo apresentar o processo de otimiza��o do banco de dados MySQL, bem como introduzir os aspectos que devem ser considerados durante o ajuste deste SGBD (Sistema Gerenciador de Banco de Dados). Este � o primeiro artigo de uma s�rie que discutir� possibilidades de otimiza��o do MySQL, abordando a otimiza��o de consultas, a otimiza��o do SGBD propriamente dito, e o ajuste do Sistema Operacional (SO) e do hardware que suportar�o o seu sistema como um todo. Os artigos seguintes apresentar�o os detalhes envolvidos em cada uma das partes apresentadas anteriormente.

Para a otimiza��o de um SGBD precisamos eliminar os poss�veis problemas de desempenho existentes em todos os n�veis do sistema, isto �, precisamos identificar as consultas lentas que eventualmente s�o submetidas ao banco. Precisamos ainda melhorar as configura��es do servidor de banco de dados, do sistema operacional, e finalmente o hardware que suportar� toda o sistema. Alguns aspectos da otimiza��o n�o se aplicam somente ao MySQL, e sim a todos os SGBDs, por isto algumas metodologias apresentadas aqui podem, em alguns casos, ser aplicadas tamb�m a outros SGBDs dispon�veis no mercado.

Antes de explorarmos os itens apresentados anteriormente � necess�rio ressaltar que o processo de otimiza��o n�o � trivial, visto que � preciso medir todos os aspectos do seu sistema para o entendimento preciso do funcionamento da sua aplica��o. Assim, pode-se obter o ajuste que seja mais adequado � sua necessidade, por exemplo, o ajuste do SGBD para aplica��es de leitura � diferente daquele onde prevalecer�o escritas. Al�m disto, as medi��es de desempenho do seu sistema s�o imprescind�veis dado que estas servir�o de refer�ncia para determinar se uma altera��o realizada no SGBD teve efeitos positivos ou n�o.

O primeiro ponto a ser discutido � a otimiza��o das consultas SQL. A interface da aplica��o com o SGBD � feita a partir de consultas SQL, ou seja, esta � a linguagem que permite a extra��o das informa��es armazenadas pelo SGBD. Portanto, durante o processo de projeto da sua base de dados, � preciso vislumbrar os tipos de consultas que ser�o mais comuns e criar a base de forma que o processo de extra��o de dados seja facilitado. Al�m disto, � preciso escrever as consultas de forma que as mesmas sejam executadas no menor tempo poss�vel. Mas, tamb�m � preciso monitorar as consultas lentas que eventualmente existam, e elimin�-las, seja pela reescrita da consulta ou at� mesmo atrav�s da altera��o da sua aplica��o de forma a fazer um acesso mais eficiente ao banco. Este deve ser um ponto de averigua��o constante, j� que em ambiente onde h� um n�mero elevado de consultas e estas consomem muito tempo de serem processadas, isto criar� uma defici�ncia consider�vel em termos de desempenho. Para a otimiza��o de consultas � preciso entender a forma como as mesmas s�o processadas pelo MySQL, e assim, deve-se tentar atuar em cada etapa visando a redu��o do tempo de processamento das mesmas, gerando um ganho global consider�vel. No pr�ximo ser�o discutidas as etapas de execu��o de uma consulta, bem como t�cnicas para o monitoramento destas consultas e da visualiza��o do plano de execu��o das mesmas.

Uma vez eliminados os problemas relativos �s consultas SQL, pode-se modificar as configura��es do MySQL de forma a fazer um uso mais apropriado dos recursos dispon�veis no SO, melhorando assim o desempenho do banco. Para isto � preciso entender como o MySQL funciona internamente, isto significa dizer que precisamos entender como o MySQL utiliza mem�ria e disco, bem como quais s�o os principais par�metros que podemos alterar para atingir este ganho. O MySQL apresenta um conjunto de ferramentas para o monitoramento do servidor de forma a detectar quais s�o os gargalos do seu sistema, e assim permitindo a elimina��o dos mesmos. Estes aspectos ser�o abordados em detalhes nos terceiro artigo referente � otimiza��o do MySQL.

Finalmente, precisamos aferir e monitorar o desempenho do SO que suportar� todo o sistema, al�m do hardware e suas configura��es. No sistema operacional podemos utilizar recursos mais apropriados para o banco, tais como sistema de arquivos mais eficientes, processos e threads nativas, al�m da escolha de um SO mais apropriado ao MySQL. Esta escolha pode, em alguns casos, gerar ganhos de desempenho em torno de 50%. Por �ltimo, mas n�o menos importante, � a escolha do hardware adequado. Por exemplo, ao utilizar-se de um processador de 64 bits � poss�vel a utiliza��o de arquivos grandes, al�m de permitir a aloca��o de uma quantidade maior de mem�ria. Isto, possibilita a configura��o de buffers de mem�ria maiores para o MySQL, melhorando consideravelmente o desempenho.

A seguir vamos conhecer o processo de execu��o de consultas no MySQL, visando assim possibilitar a elabora��o das consultas SQL de forma a serem executadas no menor tempo poss�vel.

O processo de execu��o de uma consulta no MySQL consiste de v�rias etapas que s�o o parser, otimiza��o, execu��o e retorno dos dados. A�Figura 1�apresenta uma vis�o geral deste processo.

Figura 1: Etapas da execu��o de consultas SQL

Durante o parser o MySQL faz a leitura do comando SQL enviado pelo cliente, converte o comando para um formato bin�rio interno e ent�o o envia ao otimizador. Neste caso, este processo ser� executado para cada consulta enviada ao servidor, portanto, � necess�rio reduzir este tempo para produzir um ganho de desempenho. Uma alternativa interessante � a utiliza��o dos Prepared Statements, dispon�veis a partir da vers�o 4.1. Este recurso permite a cria��o de um comando no qual ser� realizado o parser e o bin�rio dele ser� armazenado no servidor. Desta forma, este comando poder� ser executado v�rias vezes tendo sido feito apenas um procedimento de parser, o que certamente implicar� em redu��o no tempo de execu��o. Os Prepared Statements n�o ser�o abordados neste artigo, ficando fora do escopo deste texto.

A segunda etapa � a otimiza��o da consulta, onde o otimizador decide a ordem de leitura das tabelas, qual o �ndice ele ir� utilizar, caso exista o �ndice, e finalmente o tipo de leitura que ser� realizada na tabela, ou seja, o algoritmo de busca dos dados. As decis�es tomadas pelo otimizador s�o baseadas em estat�sticas que o pr�prio servidor armazena. Por exemplo, ele avalia a quantidade de registros por tabela, a quantidade de dados duplicados para cada chave existente, e assim optar� pelo plano de execu��o que gerar o menor custo e tempo para ser executado. Vale ressaltar, que o processo de otimiza��o se baseia em heur�sticas e nem sempre o caminho percorrido � o melhor. Por isto, existem dicas que podem ser dadas para o otimizador de forma a induzir o MySQL a escolher o plano de execu��o que voc� desejar. Por exemplo, se voc� sabe que as tabelas devem ser lidas na ordem A,B e n�o B,A, voc� pode utilizar o STRAIGHT_JOIN para for�ar a ordem de leitura. A mesma l�gica pode ser utilizada para os �ndices, voc� pode for�ar o MySQL a utilizar ou ignorar um determinado �ndice. Portanto, se voc� conhece qual a melhor forma de executar a sua consulta informe isto para o otimizador e desta forma voc� minimizar� o tempo para a gera��o do plano de execu��o, j� que nenhuma decis�o ser� delegada para o otimizador, isto novamente acarretar� um ganho no tempo de resposta.

Uma vez determinado o plano de execu��o, o MySQL dever� extrair os dados armazenados no disco. Portanto, se voc� possui �reas de mem�ria grandes, os dados poder�o ser mantidos nestes buffers e o acesso aos discos, que em geral � mais lento, ser� evitado e o tempo para a busca da informa��o ser� reduzido. Vale lembrar que o MySQL trabalha com o esquema de Storage Engines (Tipos de tabelas), e para cada tabela utilizada caber�o otimiza��es espec�ficas. Estas configura��es ser�o abordadas com mais detalhes em outro artigo.

Finalmente, uma vez que os dados foram recuperados da mem�ria ou disco, estes devem ser enviados para o cliente atrav�s da conex�o que foi estabelecida entre ele e o servidor. Neste caso, quanto maior o seu resultado maior ser� o tempo para envio dos dados. Assim, algumas pr�ticas podem ajudar a minimizar este tempo, por exemplo, evitar o uso de SELECT *. Liste somente os dados necess�rios, caso voc� precise de duas colunas especifique-as em seu comando, assim nenhuma informa��o desnecess�ria ser� enviada. Al�m disto, voc� poder� reduzir o tamanho dos dados atrav�s do uso do LIMIT, que permite obter apenas as primeiras linhas de dados ou at� mesmo deslocamentos no resultado. Por exemplo, um SELECT ... LIMIT 10, 20 retornar� 20 registros a partir do d�cimo primeiro registro do seu conjunto resultante. Por �ltimo, no MySQL 4.1 voc� poder� fazer uso do protocolo bin�rio, que permite o tr�fego de informa��es compactadas entre o cliente e o servidor, reduzindo o volume a ser transmitido atrav�s desta conex�o, reduzindo assim o tempo para envio do resultado e por conseq��ncia o tempo de execu��o do comando.

Veremos agora t�cnicas para a detec��o das consultas lentas e m�todos para a avalia��o do plano de execu��o de uma consulta.

O MySQL possui um log chamado �slow log�, onde s�o armazenadas todas as consultas cujo tempo de execu��o seja maior que o par�metro long-query-time, que por padr�o � 10 segundos. Al�m disto, pode-se configurar este log para armazenar tamb�m as consultas que n�o utilizam �ndices ou que realizam um SELECT *. Por padr�o este log vem desabilitado, e pode ser ativado atrav�s do par�metro log-slow-queries. Ao executar o comando STATUS, o MySQL ir� exibir dentre outras informa��es o SLOW QUERIES, que � o n�mero de consultas lentas recebidas pelo servidor, contado desde um o in�cio da execu��o do MySQL, ou desde o �ltimo FLUSH STATUS. Caso o slow log esteja ativo, o que � recomendado, estas consultas ser�o gravadas neste arquivo e possibilitar�o a identifica��o dos comandos que s�o os gargalos do seu sistema.

Uma vez detectadas as consultas lentas � preciso avaliar como o MySQL est� executando estes comandos. Para isto faz-se uso do comando EXPLAIN, que deve ser colocado antes do comando SELECT a ser estudado. Este comando ir� exibir o plano de execu��o escolhido pelo otimizador. O exemplo da�Listagem 1�ilustra este recurso para avaliar uma consulta que lista os pa�ses da regi�o N�rdica e suas respectivas capitais.

Listagem 1: EXPLAIN de uma consulta feita no MySQL

mysql> EXPLAIN SELECT co.name, ci.name FROM City AS ci, Country AS co WHERE ci.id = co.capital
-> AND co.region LIKE 'Nordic%'\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: co
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 239
Extra: Using where
*************************** 2. row ***************************
id: 1
select_type: SIMPLE
table: ci
type: eq_ref
possible_keys: PRIMARY
key: PRIMARY
key_len: 4
ref: world.co.Capital
rows: 1
Extra:
2 rows in set (0.01 sec)

As tabelas s�o lidas pelo otimizador na ordem em que elas aparecem no retorno do EXPLAIN. No exemplo da�Listagem 1, o MySQL optou por ler primeiro a tabela Country e depois a tabela City, perceba que a ordem em que as tabelas aparecem no FROM n�o foi seguida pelo otimizador. Por isto, quando for desejado que a ordem do FROM seja preservada, � preciso utilizar-se o STRAIGHT_JOIN para induzir o otimizador neste sentido.

Existem diversas informa��es apresentadas pelo EXPLAIN, a primeira delas � o SELECT_TYPE que mostra o tipo de consulta que est� sendo processada. Estas podem ser consultas simples ou sem sub-consultas (SIMPLE) e SUB_QUERY ou UNION para comando que possuem consultas aninhadas. Al�m disto, o EXPLAIN fornece quais os �ndices est�o dispon�veis para a execu��o do comando (coluna POSSIBLE_KEYS), e o �ndice que ele est� utilizando para a leitura do dados aparece na coluna KEY (NULL, caso n�o esteja fazendo uso de �ndices).

Vale destacar, que ser� utilizado apenas um �ndice para cada tabela lida pelo MySQL, por isto a cria��o do �ndice deve ser feita com crit�rio, isto �, sempre compondo as colunas que ser�o empregadas no WHERE.

A coluna ROWS fornece o n�mero de linhas lidas pelo MySQL para buscar o resultado, idealmente este n�mero deve ser igual ao n�mero de linhas retornadas pelo comando. A coluna REF indica a coluna utilizada para referenciar tabelas em JOIN (perceba a tabela City), e o EXTRA fornece informa��es adicionais sobre a execu��o, tais como, o uso de tabelas tempor�rias, ordena��o, dentre outros.

A coluna TYPE exibe o algoritmo de busca utilizado para a leitura dos dados, a�Tabela 1�apresenta os valores poss�veis para esta coluna, indo do melhor para o pior tipo.

Type	Significado
System	Tabela apresenta apenas 1 registro.
Const	Leitura de apenas um registro da tabela (busca pela chave prim�ria).
Eq_ref	Apenas uma linha desta tabela ser� lida para cada linha da tabela anterior (JOIN de tabelas 1:1).
Ref ou Ref_or_null	Leitura de v�rios registros desta tabela para cada registro lido da tabela anterior (JOIN 1:N), ou pesquisas por faixas de dados utilizando a chave prim�ria.
Unique_subquery	Sub-consulta utilizada dentro do IN e esta retorna apenas valores �nicos na tabela externa.
Index_subquery	Mesmo que o anterior, mas os valores retornados n�o s�o �nicos na tabela externa.
Range	Leitura de faixas de dados (>, <, BETWEEN, etc.).
Index	Leitura completa nos �ndices.
ALL	Leitura completa dos dados da tabela.

Tabela 1: Valores poss�veis para a coluna TYPE

Percebe-se que no exemplo da�Listagem 1, o MySQL est� fazendo um ALL (leitura completa) na tabela de pa�ses, e ent�o faz um EQ_REF com a tabela de cidades, indicando um relacionamento 1:1. Precisamos evitar sempre o ALL, j� que a leitura completa na tabela pode ser muito lento e oneroso, especialmente se a tabela cont�m muitos registros. Al�m disto, se queremos apenas os pa�ses de uma regi�o temos que ler apenas estes dados e n�o a tabela inteira. Na verdade o ALL ocorre por que n�o h� um �ndice na coluna region da tabela de pa�ses, assim para resolver o problema desta consulta seria necess�rio criar um �ndice nesta coluna, fazendo com que o MySQL fa�a um RANGE, o que seria mais r�pido.

Abaixo est�o algumas dicas de otimiza��o que devem estar sempre � mente durante um processo de melhoria de planos de execu��o de consultas:

Reescreva a sua consulta de forma a percorrer um menor caminho, por exemplo, utilize as dicas para o otimizador ou sempre utilize campos indexados na cl�usula WHERE, ou ainda evite SELECT *;
Altere a ordem de leitura das tabelas de forma a ler sempre a tabela com menos registros;
Induza o MySQL a sempre utilizar um �ndice;
Indexe novos campos se necess�rio;
Compare sempre as colunas indexadas com valores constantes e nunca aplique fun��es ou express�es ao �ndice, pois desta forma ele n�o ser� utilizado.

Esta foi uma vis�o geral do mecanismo de otimiza��o de consultas do MySQL, maiores informa��es a respeito do comando EXPLAIN e do uso de �ndices podem ser encontradas em�www.mysql.com/documentation.

Este � o processo de execu��o do MySQL, podemos ver que � poss�vel reduzir o tempo de execu��o atrav�s de pequenas altera��es em nosso processo de elabora��o de consultas.

Abra�os e at� breve!

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Eber Em 2005

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Cesar Murilo

N�vel 107

Tenho que gerenciar um banco MySQL Zabbix, com tabelas InnoDB. Minha d�vida �: o sistema utiliza do recurso Housekeeper para limpar hist�ricos e outros dados conforme o tempo que eu definir para itens e configura��es. S� que pelo que eu li at� agora, s� este recurso n�o liberar� espa�o em disco. Para liberar espa�o em disco eu tenho que rodar o comando OPTIMIZE? H� algum artigo que trata desse assunto aqui na DevMedia?

há +1 ano

Ver coment�rios anteriores (9)

Cesar Murilo

N�vel 107

Fiz o OPTIMIZE novamente, pelo adminer, e tive os resultados:

Tabela history

Come�ou as: 09:56
Tamanho de dados: 44 353 716 224
Registros: 843 057 854
Tamanho de history.idb: 139G

Finalizou as: 16:44
Tamanho de dados: 77 268 484 096
Registros: 1 466 136 985
Tamanho de history.ibd: 107G

EU n�o entendi foi como o tamanho do arquivo da tabela diminui 32G mas o n�mero de registros e o espa�o em disco, mostrados pelo adminer, aumentaram.

há +1 ano

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Otimiza��o de Banco de dados no MySQL

Esse artigo mostra o processo de otimiza��o do banco de dados MySQL. Aprenda com abordagens � otimiza��o de consultas, SGBD e ajustes de Sistema Operacional.