Distribuição Binomial em Java

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

1. Introdu��o

Imagine que um programador esteja criando um joguinho para telefone celular em que o objetivo seja comandar um foguete em uma viagem at� Marte, sendo necess�rio para isso ultrapassar uma sequ�ncia de n naves espaciais que se encontram a sua frente (ex: 30 naves). Cada nave a ser ultrapassada pode ser de apenas um dos seguintes dois tipos:

nave marciana (M): � a nave inimiga. Quando o foguete do jogador se deparar com esse tipo de nave, ser� preciso duelar. A nave marciana vai atirar e tentar� derrub�-lo; por isso, o foguete s� poder� ultrapass�-la, se contra-atacar e conseguir derrub�-la.
nave neutra (~M): neste caso, n�o se trata de uma nave inimiga e o jogador dever� apenas ultrapass�-la. Caso o jogador se confunda e atire em uma nave neutra, perder� o jogo! (obs: a representa��o ~M escolhida para a nave neutra significa �n�o marciana�).

Considere que o programador deste joguinho tenha decidido que na primeira fase, o objetivo seja ultrapassar uma sequ�ncia de 30 naves. Para dar mais dificuldade ao jogo, ele quer que cada nave que surja na sequ�ncia tenha 80% de chance de ser uma nave marciana e apenas 20% de chance de ser uma nave neutra.

Nesse caso, como ele poderia criar um procedimento para produzir diferentes sequ�ncias aleat�rias com essas caracter�sticas? Ou seja: como desenvolver um gerador de sequ�ncias n�o fixas de naves que sejam compostas por aproximadamente 80% de naves M e 20% de naves ~M? Felizmente (para o programador do joguinho!), o problema acima pode ser resolvido de maneira simples, pois a sequ�ncia de naves espaciais que ser� produzida possui distribui��o binomial probabilidades. Trata-se de uma das mais conhecidas distribui��es de probabilidade e uma das que possui o maior n�mero de aplica��es pr�ticas. Este artigo tem dois objetivos: introduzir os conceitos b�sicos sobre distribui��o binomial de probabilidades e apresentar uma t�cnica para trabalhar com este tipo de distribui��o na linguagem Java.

2. A Distribui��o Binomial

Antes de abordarmos a implementa��o Java, apresentamos nesta se��o uma breve defini��o formal para distribui��o binomial de probabilidades, para que o leitor fique familiarizado com os seus principais conceitos e caracter�sticas.

Considere um experimento E e seja M um evento associado a E.
Seja P(M) = p (a probabilidade de ocorr�ncia do evento M � p). Sendo assim, temos P(~M) = 1 � p (probabilidade de n�o ocorrer o evento M).
Considere que sejam realizadas n repeti��es do experimento. Dessa forma, o conjunto de todos os resultados poss�veis para o experimento (espa�o amostral) ser� formado por todas as sequ�ncias poss�veis {m1, m2, ..., Mn}, onde cada elemento dentro da sequ�ncia � M ou ~M. Por exemplo, considerando n=3, o conjunto com todos os resultados poss�veis � dado por:
{M,M,M}
{M,M,~M}
{M,~M,M}
{M,~M,~M}
{~M,M,M}
{~M,M,~M}
{~M,~M,M}
{~M,~M,~M}
Suponha que P(M) = p seja sempre a mesma para todas as repeti��es.
Seja a vari�vel (aleat�ria) X = {n�mero de vezes que o evento M tenha ocorrido na sequ�ncia de n repeti��es}. Dizemos que X possui distribui��o binomial com par�metros n e p.

O exemplo do joguinho da sequ�ncia de 30 naves marcianas e naves neutras apresentado na se��o anterior se enquadra exatamente nesse caso. Neste caso, estamos lidando com o seguinte fen�meno (vari�vel aleat�ria): X = �n�mero de vezes em que a nave marciana aparece em uma sequ�ncia�. Veja que X � claramente uma vari�vel com distribui��o binomial, cujos par�metros s�o n=30 (tamanho da sequ�ncia) e p = 0,80 (probabilidade de uma nave ser marciana).

3. Implementa��o Java

A Listagem 1 mostra o c�digo Java com a defini��o da classe �DistribuicaoBinomial�. Esta classe possui um m�todo est�tico chamado �gerarSequencia� respons�vel por gerar uma sequencia com distribui��o binomial a partir dos par�metros n e p. A sequ�ncia produzida � armazenada em um vetor bin�rio e retornada ao usu�rio. A explica��o detalhada � apresentada em seguida ao c�digo.

Listagem 1: Classe �DistribuicaoBinomial�


public class DistribuicaoBinomial {

	/**
	 * gera uma sequ�ncia com distribui��o binomial com par�metros n e p
	 * @param n n�mero de repeti��es
	 * @param p probabilidade de sucesso do evento
	 * @return vetor bin�rio contendo a sequ�ncia gerada
	 */
	 public static int [] gerarSequencia(int n, double p) {
	        
		 //PASSO 1. reserva mem�ria para o vetor que ser� retornado 
		 int [] vet = new int[n]; 
		 
		 //PASSO 2. loop que preenche cada posi��o do vetor
		 for(int i = 0; i < n; i++) {
			 vet[i] = (Math.random() < p) ? 1 : 0;
		 }
         
		 //PASSO 3. retorna o vetor
		 return vet;
	 }
  
}

O m�todo �gerarSequencia� produzir� como sa�da sempre um vetor bin�rio de tamanho n. Por exemplo, considerando n=30 e p=0,80, um exemplo de vetor que poderia ser produzido pelo m�todo � dado abaixo:

111111111001111111111001011111

Os valores �1� representam a ocorr�ncia do evento M (neste caso, associado a probabilidade p=0,80) enquanto os valores �0� representam a n�o ocorr�ncia de M (ou ~M). Retornando ao exemplo das naves espaciais, a sequ�ncia acima estaria representando a seguinte situa��o:

Primeiro, o foguete do jogador enfrentaria 9 naves marcianas em sequ�ncia.
Depois viriam 2 naves neutras para ultrapassar.
Depois mais 10 naves marcianas a serem enfrentadas.
Finalizando a sequ�ncia: 2 neutras, 1 marciana, 1 neutra e 5 marcianas.

� importante destacar que as sequ�ncias s�o produzidas sempre de maneira aleat�ria, considerando os par�metros n e p. A explica��o sobre o programa � dada a seguir.

Inicialmente, o programa aloca em mem�ria um vetor de inteiros de tamanho n (PASSO 1). Depois, temos o PASSO 2 que � o principal do m�todo. Nele, � realizado um loop que sorteia o valor de cada posi��o do vetor (sempre 1 ou 0). Este sorteio � feito levando em considera��o o valor de p, ou seja, levando em considera��o a probabilidade de que o valor 1 seja sorteado. Para conseguir que isso fosse poss�vel, o artif�cio empregado foi utilizar o m�todo �random()� da classe �Math�:

vet[i] = (Math.random() < p) ? 1 : 0;

�Math.random()� sorteia um n�mero entre 0 e 1, considerando uma distribui��o uniforme nesse intervalo. Isso quer dizer que qualquer n�mero real (double) maior ou igual a 0.0 e menor que 1.0 pode ser sorteado com a mesma probabilidade. Desta forma, basta chamar �Math.random()� dentro de cada itera��o i do loop e verificar se o n�mero sorteado � menor do que o par�metro p (ex: menor do que 0,80). Se isto for verdade, v[i] receber� 1. Se for falso, v[i] receber� 0. Ap�s o loop se encerrar, um ponteiro para o vetor �v� � retornado pelo m�todo (PASSO 3).

Para testar o programa, voc� pode utilizar o programa da Listagem 2. Neste exemplo, s�o geradas tr�s sequ�ncias, representadas nos vetores v1, v2 e v3, respectivamente. Para v1, usamos os par�metros n=3 e p=0,66. Para v2, temos n=10 e p=0,25. E finalmente para v3, temos a situa��o que representa o exemplo do jogo das naves espaciais, onde n=30 (sequ�ncia de 30 naves espaciais) e p = 0,80 (probabilidade de uma nave ser marciana).

Listagem 2: Testando a Classe �DistribuicaoBinomial�


public class TestaDistribuicaoBinomial {

	public static void main(String[] args) {
		
		int v1[], v2[], v3[];
		
		//gera sequ�ncia com n = 3 e p = 0,66. Armazena em v1
		v1 = DistribuicaoBinomial.gerarSequencia(3, 0.66);
		
		for (int i=0; i < 3; i++) System.out.print(v1[i]); //imprime v1
		System.out.println();

		
		//gera sequ�ncia com n = 10 e p = 0,25. Armazena em v2
		v2 = DistribuicaoBinomial.gerarSequencia(10, 0.25);
		
		for (int i=0; i < 10; i++) System.out.print(v2[i]); //imprime v2
		System.out.println();

		//gera sequ�ncia com n = 30 e p = 0,80. Armazena em v3
		v3 = DistribuicaoBinomial.gerarSequencia(30, 0.80);
		
		for (int i=0; i < 30; i++) System.out.print(v3[i]); //imprime v3
		System.out.println();
		
	}
	
}

Um exemplo de resultado poss�vel � apresentado na Figura 1.

Figura 1: Execu��o do programa da Listagem 2

� importante deixar claro que as sequ�ncias s�o sempre geradas de forma aleat�ria, por�m de acordo com uma distribui��o binomial com par�metros n e p. A cada execu��o do programa, uma diferente sequ�ncia dever� ser gerada. Se o valor de p for alto, a tend�ncia � que a sequ�ncia possua muitos 1�s (como � o caso de v3) e se for baixo, a tend�ncia � que existam mais zeros (caso de v2).

Quando, por exemplo, especificamos p=0,80 e n=30 isso n�o significa que exatamente 80% dos valores do vetor gerado ter�o o valor 1 (24 posi��es). Na verdade, o que ocorre � que para cada posi��o do vetor, a chance de 1 ser sorteado estar� associada a uma probabilidade de 80%. Tipicamente, o total de 1�s das sequ�ncias variar� nas diferentes chamadas do m�todo �gerarSequencia�. No entanto, se executarmos um grande n�mero de chamadas ao m�todo, poderemos verificar que, em m�dia, o total de 1�s estar� pr�ximo de 24 (embora cada sequ�ncia individual n�o possua sempre 24 valores 1).