Problemas no java.io

Problemas no java.io

Uma das principais preocupaç�es dos desenvolvedores de aplicaç�es que precisam fazer muito IO (tamb�m chamadas de IO Bound) � o desempenho. Os desenvolvedores passam horas projetando as aplicaç�es para otimizar a realizaç�o de IO e depois, quase nunca satisfeitos, ainda dedicam outras tantas fazendo ajustes. Utilizando java.io, os desenvolvedores Java contam com uma API limitada, com abstraç�es distantes das oferecidas pelo sistema operacional e que tem muitos problemas em sua implementaç�o. Como resultado os programadores precisavam fazer malabarismos no projeto e na implementaç�o das aplicaç�es para alcançar um bom desempenho.

Abstraç�es

Um dos carros chefes da API java.io s�o os IO Streams. Oferencendo abstraç�es de alto n�vel baseadas em composiç�o, eles facilitam a realizaç�o de tarefas simples. Em contrapartida, dificultam a realizaç�o de tarefas mais complexas, pois o programador precisa ter um conhecimento detalhado de toda a API para saber quais objetos e em que ordem estes devem ser compostos. Para ilustrar, citamos um exemplo bem simples: ler um arquivo que cont�m dados do tipo long. N�o esquecendo do desempenho, uma das formas de solucionar este problema seria:

...

DataInputStream inputStream = new DataInputStream( new BufferedInputStream( new FileInputStream( fileName )));

long aLong = inputStream.readLong();

...

O problema com essa implementaç�o � que o ganho de desempenho na utilizaç�o do BufferedInputStream � perdido (em parte), pois o DataInputStream l� apenas um byte por vez. Logo, para ler cada long do arquivo precisar�amos fazer oito chamadas ao m�todo read do BufferedInputStream.

Distante das abstraç�es oferecidas pelo sistema operacional, as abstraç�es oferecidas pelos IO Streams limitam o poder do desenvolvedor, n�o permitindo, por exemplo, o uso de Direct Memory Access (DMA). Esta caracter�stica (essencial nos computadores modernos) permite que o sistema operacional transfira dados entre dispositivos e a mem�ria sem utilizaç�o do barramento da CPU, conseguindo assim diminuir bastante o tempo de execuç�o de certas operaç�es.

Sincronizaç�o

Criada para permitir a construç�o segura e f�cil de sistemas computacionais distribu�dos, a linguagem Java apresenta uma API repleta de m�todos p�blicos sincronizados e o pacote java.io n�o � diferente. A maioria dos IO Streams possuem seus m�todos p�blicos sincronizados, dentre eles os m�todos para leitura e escrita. Esta decis�o de implementaç�o n�o permite ao programador evitar a aquisiç�o destes locks, que podem muitas vezes ser desnecess�rios.

Ainda nesse contexto, outro caso que merece destaque � o dos StringBuffers. Todos os m�todos p�blicos (com exceç�o dos construtores) s�o sincronizados. Sendo esta classe usada para implementaç�o do operador de concatenaç�o de Strings em Java, para executar:

String hello = �Hello � + � New IO � + � users�;

A JVM executa:

String hello = new StringBuffer.append(�Hello �).append(� New IO �).append(� users �).toString();

O que implica na aquisiç�o de quatro locks. � importante notar que essa aquisiç�o pode ser completamente desnecess�ria caso essa linha seja executada por apenas uma Thread.

IO sempre bloqueante

Supondo que temos a seguinte situaç�o: Uma aplicaç�o que suporte v�rias requisiç�es simult�neas (Um servidor Web, por exemplo). A forma mais conhecida de se fazer isso � criando uma Thread para atender cada requisiç�o.

Essa forma de solucionar o problema s� existe por que a API oferecia apenas a opç�o de realizar IO de forma bloqueante (ou s�ncrona). Isso deixou de fazer sentido quando os sistemas operacionais começaram a suportar operaç�es de IO de forma n�o bloqueante (ou ass�ncrona). Em poucas palavras, uma operaç�o n�o bloqueante ocorre da seguinte forma: Uma Thread inicia a operaç�o de IO e devido a natureza n�o bloqueante da operaç�o ela seria imediatamente liberada. A partir da� ela poderia ficar checando se a operaç�o acabou ou ent�o se registar como interessada no final da operaç�o.

Note que essa funcionalidade torna a realizaç�o de IO muito mais eficiente, dado que o servidor n�o precisa arcar com o custo de criaç�o e destruiç�o de Threads de aplicaç�o. O desenvolvedor tamb�m deixa de se preocupar com detalhes t�picos do modo s�ncrono, entre eles, que nenhuma Thread execute por um intervalo muito grande de tempo, o que poderia levar a um estouro no n�mero de Threads criadas pela JVM.

Em http://www.ddj.com/dept/java/184406242 podemos ver como um servidor pode ter seu desempenho melhorado com a utilizaç�o do modo n�o bloqueante. Na Figura 1, expomos na primeira coluna o tempo (em minutos) e nas colunas seguintes o n�mero de transaç�es processadas utilizando as duas formas de fazer IO.

Figura 1: Avaliaç�o de desempenho entre as duas formas de fazer IO

Conclus�es

Nesse artigo mostramos os problemas que existem com a API java.io. Com isso queremos motivar o leitor a pensar sobre um problema muito comum para muitos desenvolvedores Java: o bom desempenho das aplicaç�es que realizam muitas operaç�es de IO. Este, pode ser imposs�vel de ser obtido se n�o mudar-mos a forma que pensamos e implementamos nossas aplicaç�es. Um bom ferramental pode ser encontrado (a partir da JDK 1.4) na API New IO. � sobre essa API, t�o rica em novidades, que tratarei nos pr�ximos artigos.

Refer�ncias

lhttp://java.sun.com/j2se/1.5.0/docs/api/java/io/InputStream.html

lhttp://java.sun.com/j2se/1.4.2/docs/api/java/io/DataInputStream.html

lhttp://java.sun.com/j2se/1.4.2/docs/api/java/io/RandomAccessFile.html

lhttp://en.wikipedia.org/wiki/Direct_memory_access

lhttp://en.wikipedia.org/wiki/Non-blocking_IO

lhttp://www.javapractices.com/Topic4.cjp

lhttp://www.ddj.com/dept/java/184406242

lhttp://www.conexaojava.com.br/conexaojava04/download/palestras/Java.nio-a.nova.entrada.e.saida.do.Java-Conexao.Java.2004.pdf#search=%22conex%C3%A3o%20java%20nio%22

Problemas no java.io

Uma das principais preocupações dos desenvolvedores de aplicações que precisam fazer muito IO (também chamadas de IO Bound) é o desempenho...

Artigos relacionados