Diferen�as entre TreeSet, HashSet e LinkedHashSet em Java

H� uma enorme confus�o entre esses 3 tipos, e muito das vezes n�o sabemos qual usar em que situa��o, e � �bvio que ambas tem suas especificidades, caso contr�rio n�o existiram estruturas distintas.

Explicaremos o uso de cada estrutura citada acima, al�m de mostrar quando cada uma deve ser usada em qual situa��o, por quest�es como: performance, utilidade e outras.

Entendendo o SET

Estruturas de dado do tipo �Set� s�o conhecidas por aceitar apenas valores �nicos, ou seja, qualquer valor duplicado inserido em um �Set� ser� automaticamente exclu�do, por isso muito cuidado ao escolher uma List ou Set.

O HashSet � o mais r�pido de todos, este usa HashTable e seus elementos n�o s�o ordenados, a complexidade desta estrutura � O(1), em outras palavras, n�o importa o quanto voc� adicione, remova, retire, o tempo de execu��o sempre ser� o mesmo. E isso � extremamente cr�tico em processos onde temos uma situa��o cr�tica com milh�es de dados a serem inseridos em um Set. Por outro lado, a garantia de continuidade na ordem dos elementos inseridos � zero, ou seja, esse tipo de estrutura � indicada se voc� precisa apenas garantir a alta performance sem se importar com a ordem com que os elementos est�o ordenados.

� importante notar que TreeSet, HashSet e LinkedHashSet implementam a interface �Set�, ou seja, temos os mesmos m�todos para as 3 estruturas, o que difere cada uma � a forma com que � implementado o algoritmo, por exemplo, na HashSet j� falamos que ela usa HashTable em sua implementa��o, que por sinal � muito r�pido mas n�o garante a ordena��o dos seus elementos. Veja no exemplo da listagem 1 uma implementa��o do HashSet.

Listagem 1: Usando HashSet


HashSet<Dog> dset = new HashSet<Dog>();
	dset.add(new Dog(2));
	dset.add(new Dog(1));
	dset.add(new Dog(3));
	dset.add(new Dog(5));
	dset.add(new Dog(4));
	Iterator<Dog> iterator = dset.iterator();
	while (iterator.hasNext()) {
		System.out.print(iterator.next() + " ");

Sa�da: 5 3 2 1 4

O TreeSet implementa um algoritmo conhecido por red-black tree ou �rvore rubro-negra. Sua principal caracter�stica � que ele � o �nico Set que implementa a interface SortedSet em vez de Set diretamente, mas de qualquer forma SortedSet implementa Set, assim continuamos tendo os mesmo m�todos no TreeSet. Pelo fato de ele implementar SortedSet ele possui elementos ordenados automaticamente, ou seja, independente da ordem que voc� inserir os elementos, eles ser�o ordenados. Mas isso tem um custo, a complexidade para os m�todos add, remove e contains s�o bem maiores que do HashSet, s�o elas O(log (n)), n�o � bem uma complexidade exponencial mas � bem maior que O(1) que tem seu tempo inalterado.

Por implementar SortedSet o TreeSet oferece mais alguns m�todos como: first(), last(), headSet(), tailSet() e etc. Veja no c�digo abaixo um exemplo do TreeSet e sua sa�da.

Listagem 2: Usando TreeSet


TreeSet<Integer> tree = new TreeSet<Integer>();
	tree.add(12);
	tree.add(63);
	tree.add(34);
	tree.add(45);
	 
	Iterator<Integer> iterator = tree.iterator();
	System.out.print("Tree set data: ");
	while (iterator.hasNext()) {
	    System.out.print(iterator.next() + " ");
	}

Sa�da: 12 34 45 63

Temos ainda uma caracter�stica a discutir sobre o TreeSet. Veja que funciona normalmente para valores primitivos, como � o caso dos inteiros. Mas se tiv�ssemos trabalhando com Objetos, como ele saberia como ordenar esses objetos ? Por qual propriedade ele iria ordenar ? N�o pense que � a ID, pois nem todo objeto tem a propriedade ID, at� mesmo porque ID pode se chamar identificacao, codigo, unique_id, e muitos outros nomes que vem na cabe�a do programador.

Listagem 3: Classe Dog


class Dog {
	int size;
 
	public Dog(int s) {
		size = s;
	}
 
	public String toString() {
		return size + "";
	}
}

Suponha a classe Dog acima, e agora vamos tentar aplicar o TreeSet nela.

Listagem 4: Aplicando TreeSet na classe Dog


public class TestTreeSet {
	public static void main(String[] args) {
		TreeSet<Dog> dset = new TreeSet<Dog>();
		dset.add(new Dog(2));
		dset.add(new Dog(1));
		dset.add(new Dog(3));
 
		Iterator<Dog> iterator = dset.iterator();
 
		while (iterator.hasNext()) {
			System.out.print(iterator.next() + " ");
		}
	}
}

Para sua surpresa voc� receber� um erro em tempo de execu��o: Exception in thread �main� java.lang.ClassCastException: collection.Dog cannot be cast to java.lang.Comparable.

Este erro ocorre por um fato simples: Como o TreeSet vai ordenar uma lista de Dog's se n�o dissermos a ele por onde ordenar ? Temos ent�o que implementar a interface Comparable, que obrigatoriamente nos fara implementar o m�todo �compareTo�. � atrav�s deste m�todo que diremos como o TreeSet deve ordenar nosso Objeto em quest�o.

Listagem 5: Classe Dog implementando Comparable


class Dog implements Comparable<Dog>{
	int size;
 
	public Dog(int s) {
		size = s;
	}
 
	public String toString() {
		return size + "";
	}
 
	@Override
	public int compareTo(Dog o) {
	        return size - o.size;
	}
}

Agora sim, podemos usar o TreeSet que duro ser� ordenado automaticamente, e a sa�da da listagem 4 ser�: 1 2 3.

Enfim, temos a LinkedHashSet que � um meio termo entre HashSet e TreeSet, ou seja, ela nos proporciona um pouco da performance do HashSet e um pouco do poder de ordena��o do TreeSet. O LinkedHashSet faz uso tamb�m do HashTable com linked list, ou seja, temos aqui a seguinte situa��o: Os elementos continuam na ordem que s�o inseridos, diferente do HashSet que �embaralha� tudo. E a complexidade do LinkedHashSet � O(1) para opera��es b�sicas.

Listagem 6: Usando LinkedHashSet


LinkedHashSet<Dog> dset = new LinkedHashSet<Dog>();
dset.add(new Dog(2));
dset.add(new Dog(1));
dset.add(new Dog(3));
dset.add(new Dog(5));
dset.add(new Dog(4));
Iterator<Dog> iterator = dset.iterator();
while (iterator.hasNext()) {
	System.out.print(iterator.next() + " ");
}

Sa�da: 2 1 3 5 4

Vimos ent�o que a principal diferen�a entre as implementos da interface Set est� na velocidade e ordena��o que elas proporcionam, vamos agora testar a performance de cada um para provar na pr�tica o que explanamos aqui.

Listagem 7: Teste de Performance no TreeSet, HashSet e LinkedHashSet


public static void main(String[] args) {
	 
	Random r = new Random();
 
	HashSet<Dog> hashSet = new HashSet<Dog>();
	TreeSet<Dog> treeSet = new TreeSet<Dog>();
	LinkedHashSet<Dog> linkedSet = new LinkedHashSet<Dog>();
 
	// start time
	long startTime = System.nanoTime();
 
	for (int i = 0; i < 1000; i++) {
		int x = r.nextInt(1000 - 10) + 10;
		hashSet.add(new Dog(x));
	}
	// end time
	long endTime = System.nanoTime();
	long duration = endTime - startTime;
	System.out.println("HashSet: " + duration);
 
 
 
 
	// start time
	startTime = System.nanoTime();
 
	for (int i = 0; i < 1000; i++) {
		int x = r.nextInt(1000 - 10) + 10;
		treeSet.add(new Dog(x));
	}
	// end time
	endTime = System.nanoTime();
	duration = endTime - startTime;
	System.out.println("TreeSet: " + duration);
 
 
 
 
	// start time
	startTime = System.nanoTime();
 
	for (int i = 0; i < 1000; i++) {
		int x = r.nextInt(1000 - 10) + 10;
		linkedSet.add(new Dog(x));
	}
	// end time
	endTime = System.nanoTime();
	duration = endTime - startTime;
	System.out.println("LinkedHashSet: " + duration);
 
}

Sa�da:

Primeiro Lugar: HashSet (como esperado) com tempo de 2244768.
Segundo Lugar: LinkedHashSe com tempo de 2263320 (muito pr�ximo ao HashSet).
Terceiro Lugar: TreeSet com tempo de 3549314 (bem mais lento que os outros por sua ordena��o).

� importante salientar uma quest�o muito importante, nenhuma das implementa��es da interface Set s�o thread-safe, ou seja, se voc� est� usando m�ltiplas threads para acessar o mesmo Set voc� deve sincronizar esses acessos externamente, pois como dissemos, o Set n�o o far�. Esse � um ponto fraco para aplica��es que trabalham com frequ�ncia com m�ltiplas threads, pois voc� teria que ficar sincronizando os acessos ao seu Set para garantir a consist�ncia dos dados, por�m levando em considera��o a rapidez do HashSet ou mesmo a unicidade de elementos do Set como um todo, voc� deve ponderar se vale a pena deixar de usar o Set por falta de sincronismo nativo.

Conclus�o

Esperamos que com este artigo voc� esteja h�bil para escolher entre essas 3 estruturas em situa��es no qual elas forem adequadas. Podemos ver por exemplo o uso constante do HashSet em mapeamentos OneToMany do Hibernate para garantir uma agilidade na inser��o de elementos, que faz-se necess�rio em aplica��es com uma grande quantidade de dados.

Enfim, o uso de ambos deve ser ponderado conforme a necessidade da sua aplica��o, ou mesmo deixar de lado o Set e usar outras estruturas como List ou Queue, que tamb�m tem suas especificidades para cada situa��o. Caso deseje entender mais sobre a estrutura interna de cada Set aconselhamos o estudo aprofundado de cada algoritmo usado por estes, por exemplo, como citamos anteriormente o TreeSet usa o algoritmo da �rvore rubro-negra.

Confira outros conte�dos:

Por Ronaldo Em 2013

Coment�rios nesta publica��o Escrever um coment�rio sobre conte�do

Rafael Silva

Na listagem 3 e 4 utiliza a implementação Comparable para ordenar. Tem como utilizar o Comparator? O somente dá pra ordenar com o Comparable?

há +1 ano

Ver coment�rios anteriores (3)

Marcio Souza

Por nada Rafael.

t+

há +1 ano

Rodrigo Vasconcelos

Seguem exemplos de sa�da da listagem 7:
HashSet: 2093985
TreeSet: 1824829
LinkedHashSet: 742909
---------------------------
HashSet: 2256870
TreeSet: 1805628
LinkedHashSet: 688615
---------------------------
HashSet: 2148942
TreeSet: 1767555
LinkedHashSet: 694243
---------------------------
Ou seja, de acordo com os resultados acima, o LinkedHashSet � o mais r�pido na inser��o; depois vem o TreeSet e por �ltimo o HashSet.

há +1 ano

Ver coment�rios anteriores (4)