Dissecando a Java Collections - Revista Java Magazine 96

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Aten��o: esse artigo tem um v�deo complementar. Clique e assista!

De que se trata o artigo:

� exposto o funcionamento interno das principais implementa��es da interface Collection: ArrayList, LinkedList, HashSet, TreeSet, HashMap e TreeMap. Neste artigo � detalhado principalmente sobre quais estruturas de dados cada uma dessas classes foi desenvolvida. Al�m disso, outros detalhes de implementa��o (bem como conceitos de computa��o) v�m � tona.

Em que situa��o o tema � �til:

No mundo da tecnologia, a demanda por softwares melhores e inovadores exige que os desenvolvedores de software n�o apenas conhe�am bem as estruturas de dados mais usadas, mas tamb�m que sejam vers�teis o suficiente para saber implementar novas estruturas ou estender estruturas existentes de acordo com a necessidade do projeto. Nessas situa��es, para as quais devemos estar sempre preparados, o conhecimento exato sobre as estruturas e classes existentes passa a ser b�sico.

Resumo DevMan:

Entre as interfaces do Java Collections Framework, as mais usadas s�o List, Set e Map. Suas implementa��es principais, no entanto, merecem aten��o especial em seus detalhes.

Por exemplo, ArrayList e LinkedList s�o classes estruturalmente diferentes, visto que ArrayList � constru�da sobre um array e usa m�todos internos para redimension�-lo quando necess�rio, enquanto LinkedList representa uma lista duplamente encadeada, onde cada elemento aponta para o pr�ximo e para o anterior.

HashSet e TreeSet, por sua vez, possuem uma similaridade: ambas as classes foram constru�das utilizando suas similares, respectivamente HashMap e TreeMap. Sendo assim, HashSet prov� opera��es com acesso direto aos seus itens (complexidade de tempo linear), mas n�o guarda uma ordem espec�fica deles. TreeSet, por outro lado, guarda seus elementos de forma ordenada, n�o oferecendo, no entanto, opera��es t�o eficientes quanto HashSet. A classe HashMap foi desenvolvida com base em tabelas hash, utilizando o hashCode() dos objetos inseridos e fazendo um rehash muito interessante desse c�digo de modo a se proteger contra colis�es. J� objetos do tipo TreeMap t�m como base �rvores rubro-negras, que possuem um forte mecanismo de auto balanceamento, impedindo que a estrutura degenere e garantindo buscas em tempo logar�tmico mesmo no pior caso.

Uma cole��o � dito de forma simples, uma estrutura que agrupa v�rios objetos em um �nico. Todas as linguagens de programa��o possuem uma forma de expressar essa abstra��o t�o necess�ria ao desenvolver sistemas, e em Java n�o seria diferente: temos o Collections Framework, introduzido desde a vers�o 1.2 da plataforma. Neste contexto, vamos abordar aqui alguns t�picos relativos ao funcionamento interno das classes que fazem parte das interfaces-chave da API: List, Set e Map.

Voc� j� se perguntou quando usar um ArrayList ao inv�s de um LinkedList? Um HashMap ao inv�s de TreeMap? Qual a diferen�a fundamental entre as diferentes implementa��es?

Al�m de analisar o desempenho das classes mais conhecidas de cada uma dessas interfaces, iremos compreender as estruturas de dados que as caracterizam e que funcionam realmente como �esqueleto� delas.

Com um conhecimento mais profundo da implementa��o das classes, o leitor poder� se beneficiar quando for necess�rio tomar decis�es t�cnicas em seu projeto de software, levando em conta os tradeoffs existentes entre as classes. Principalmente em projetos onde desempenho � crucial, conhecer a anatomia das classes pode salvar a sua pele e a de sua equipe.

List

Assim que voc� come�a a ter um pouco mais de pr�tica com programa��o, voc� logo para de usar array para guardar objetos e come�a a utilizar algo mais f�cil de manipular, listas por exemplo. No caso de Java, listas s�o representadas pela interface java.util.List, que �, com certeza, uma das interfaces mais utilizadas na linguagem. Mas, como essa interface funciona como uma abstra��o do conceito de listas? Responderemos essa pergunta a seguir e aprenderemos o mecanismo por tr�s das duas implementa��es mais conhecidas de List.

Representa��o

Como o pr�prio nome j� diz, a interface java.util.List representa uma lista de elementos. Assim como uma lista de filmes prediletos ou uma lista de compras, listas possuem um primeiro elemento e um �ltimo, tendo assim, uma ordem definida. Uma lista pode possuir elementos repetidos e tamb�m aumentar de tamanho. Elas funcionam basicamente como vetores (ou arrays), adicionando, acessando e removendo elementos, no entanto, mais flex�veis, dado que podem aumentar ou diminuir de tamanho. O conceito dessa estrutura � realmente bem simples, por isso, vamos logo explicar os detalhes sobre suas implementa��es principais: ArrayList e LinkedList.

ArrayList

ArrayList � uma implementa��o de List que usa um array para guardar os elementos, onde executa opera��es de redimensionamento sempre que necess�rio. Toda vez que o construtor de ArrayList � chamado passando initialCapacity como par�metro, um array com esse tamanho � criado. Caso nenhum valor seja informado, a capacidade inicial do array � 10, sendo este o valor default.

Observando os seus principais m�todos de manipula��o de elementos: get(), set() e add() (em suas duas vers�es), � f�cil perceber porque esses m�todos possuem complexidade de tempo constante, ou O(1). Todos eles passam como par�metro o �ndice do elemento desejado, por isso o acesso � direto. Para entender melhor essa quest�o, vamos ver um exemplo de m�todo dessa classe. Primeiramente, iremos destrinchar o m�todo ensureCapacity(), que � utilizado pelo add(), que ser� visto em seguida.

ensureCapacity() � um dos m�todos de ArrayList que serve para redimensionar o array de elementos. O m�todo recebe como par�metro um inteiro que representa a capacidade m�nima que o array deve ter. Um erro comum � confundir capacidade do ArrayList com o seu tamanho, representado pelo atributo size. O tamanho do ArrayList refere-se a quantos elementos ele possui no momento. Veja a implementa��o de ensureCapacity() na Listagem 1. Note que utilizamos coment�rios como �\\ Linha n�, o que significa que essa linha espec�fica de c�digo ser� detalhada posteriormente. Usaremos essa nota��o em outras listagens no artigo.

Listagem 1. M�todo ensureCapacity() de ArrayList.

public void ensureCapacity(int minCapacity) {
    modCount++;
    int oldCapacity = elementData.length;
    if (minCapacity > oldCapacity) { \\ Linha 1
      Object oldData[] = elementData;
      int newCapacity = (oldCapacity * 3)/2 + 1; \\ Linha 2
      if (newCapacity < minCapacity) \\ Linha 3
        newCapacity = minCapacity;
      elementData = Arrays.copyOf(elementData, newCapacity); \\ Linha 4
    }
  }

Linha 1: � primeiramente verificado se o tamanho do array � maior do que minCapacity. Se for, nada acontece, afinal, o array tem bastante espa�o para confortar mais elementos. Caso contr�rio, haver� um redimensionamento do array.

Linha 2: A quest�o agora �: de quanto ser� o redimensionamento? Mais um? Mais dois? Isso seria pouco eficiente caso voc� estivesse adicionando milhares de elementos, n�o acha? Seria necess�rio redimensionar o array milhares de vezes (uma vez a cada chamada). Igualmente, redimensionar em 5.000 seria um desperd�cio de espa�o se o array guardasse poucos elementos. Portanto, nessa linha podemos ver que o redimensionamento � exponencial: o array cresce 1.5x a cada chamada. Quer o cliente adicione muitos ou poucos elementos, o ArrayList se adapta proporcionalmente. No pequeno c�lculo feito nesta linha, pode notar que � somado 1 ao resultado da divis�o. Caso esteja curioso, esse �+1� � para os casos de o array ser vazio ou de tamanho 1. Assim, o valor da vari�vel newCapacity sempre ser� maior que o valor de oldCapacity. Se, por exemplo, oldCapacity fosse 1 e n�o houvesse o �+1� na equa��o, newCapacity nunca passaria de 1 (pois a parte inteira de 1*1.5=1), ou seja, o array na verdade n�o estaria se expandindo!

Linha 3: O array cresce 150%, exceto se o par�metro minCapacity for ainda maior que essa nova capacidade calculada. Nesse caso, o array toma o valor de minCapacity.

Linha 4: � criado um novo array com capacidade maior e seus elementos s�o todos copiados do array �antigo�. O m�todo usado para copiar os elementos � Arrays.copyOf(), que por sua vez, usa System.arraycopy() em sua implementa��o. Veremos mais sobre esse �ltimo adiante.

Observe agora a implementa��o do m�todo add(int index, E element), que insere um elemento na posi��o indicada por index (veja a Listagem 2). Note tamb�m que, apesar de esse m�todo ser executado em tempo constante O(1), caso o array necessite ser expandido, o custo torna-se linear.

Listagem 2. M�todo add() de ArrayList.

public void add(int index, E element) {
      if (index > size || index < 0)
          throw new IndexOutOfBoundsException("Index: "+index+", Size: "+size);
      ensureCapacity(size+1);  // Linha 1
      System.arraycopy(elementData, index, elementData, index + 1,size - index); //Linha 2
      elementData[index] = element;
      size++;
  } ...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conte�dos:

Por Tiago Em 2011

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Marco Maria

Parab�ns pelo artigo!! Muito interessante e �til!! Devemos sempre procurar entender as estruturas que estamos utilizando, para obter melhor desempenho em nossos sistemas. O artigo apronfundou sobre a implementa��o das cole��es mais importantes de forma bem esclarecedora!

há +1 ano

M�todo para iniciantes

sem base nenhuma

Mentorias individuais

quando voc� travar

+40 projetos reais

para o seu portf�lio

+5000 exerc�cios

para fixar o conte�do

Suporte IA

que te ensina

No code e automa��es

pra entregar mais r�pido

Veja os resultado dos nossos alunos

Conquistas reais de quem est� aplicando o m�todo

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Dissecando a Java Collections - Revista Java Magazine 96

Neste artigo � detalhado principalmente sobre quais estruturas de dados cada uma dessas classes foi desenvolvida. Al�m disso, outros detalhes de implementa��o (bem como conceitos de computa��o) v�m � tona.

Confira outros conte�dos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para come�ar a atuar como programador?

Por que a programa��o se tornou a profiss�o mais promissora da atualidade?

Quais s�o os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programa��o atrav�s da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem hor�rio para as aulas?

Por que a DevMedia n�o usa videoaulas em sua did�tica?

Preciso de um computador espec�fico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais s�o os planos de assinatura dispon�veis?

Adquirindo o plano, terei acesso a todo o conte�do?

A plataforma tem planos vital�cios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

Como excluir meus dados da plataforma?