F�rum Consulta de Questionario WEB #7426

08/07/2009

Boa Tarde,
Essa � minha primeira vez aqui no suporte. Nao sei se estou na sala correta para esta duvida.

Uso Java 5 + Jboss 4.23 + JSF.

Essa � minha aplica��o.
http://150.162.1.32:8080/resultadosead

login: saad
senha: avaliacao

A aplica��o � a consulta de respostas de um question�rio web.

O arquivo .war e o c�digo workspace do sistema estao aqui: http://files.getdropbox.com/u/745338/consultaead.rar

Estou com um gargalo de desempenho no sistema que n�o consigo resolver, � em apenas um m�todo. N�o existe an�lise de c�digo de grande complexidade. A classe � DBData, m�todo getAlternativa.

O problema est� nas consultas que usam os parametros "Todos os P�los" ou " Todas as Disciplinas"
O problema � que preciso fazer v�rias varreduras no BD para ir buscando os dados.

Nesta consulta o que estou fazendo � montar SQLs dentro do m�todo e ir buscando as coisas que preciso.

No exemplo desta imagem para a alternativa "Utilizei bastante" busco os respondentes totais em todos os p�los(50), busco os respondentes de cada p�lo, Pr-Ibati(13), e um grande problema � que tamb�m preciso saber o total de respondentes da quest�o em cada coluna, para fazer a porcentagem e as colunas fecharem em 100%.

Bom, estou dispon�vel para fazer qualquer tipo de modifica��o. Esse sistema est� no ar. Ent�o estou tendo muitos problemas.

Aguardo ansiosamente e estou dispon�vel para qualquer d�vida.
Lucas

lucaszago@gmail.com, lucaszag@hotmail.com
48 96176763

Lucas Zago

Curtir t�pico

+ 0

Responder

Posts

08/07/2009

Henrique Weissmann

Lucas,

ainda n�o acessei o seu c�digo fonte, mas com base na sua descri��o j� � poss�vel dar algumas id�ias:

Voc� diz: "O problema � que preciso fazer v�rias varreduras no BD para ir buscando os dados."

Neste caso, ser� que n�o seria interessante a utiliza��o de uma estrat�gia de cache?

Explicando melhor: h� algumas informa��es no seu banco de dados que n�o ser�o atualizadas constantemente. Neste caso, � mais interessante ao inv�s de voc� as consultar diretamente no banco de dados, as consultar primeiro em um cache interno da sua aplica��o e, somente caso as mesmas n�o se encontrem presentes no mesmo, fazer a consulta no banco de dados e, posteriormente, armazen�-las no cache para que em uma busca posterior voc� n�o precise repetir a consulta no BD.

Esta t�cnica melhora ao extremo a performance do sistema, pois todas as informa��es que voc� ir� necessitar j� se encontrar�o em mem�ria para voc�.

H� atualmente diversas bibliotecas de cacheamento que voc� pode usar. Lhe recomendo duas alternativas:

OSCache: http://www.opensymphony.com/oscache/

EHCache: http://ehcache.sourceforge.net/

Ambas s�o igualmente boas e permitem inclusive o cacheamento de p�ginas JSP tamb�m. Como consequ�ncia, a sua camada de visualiza��o em alguns casos nem sequer precisar� acessar a camada de modelo da sua aplica��o, melhorando significativamente a sua performance.

No caso de ambas as bibliotecas, � poss�vel definir tamb�m o tempo de expira��o do cache, assim como a pol�tica de armazenamento (LRU, MRU ou outras) garantindo que assim as informa��oes presentes no mesmo sejam o mais atualizadas poss�vel.

Qualquer coisa, estou a sua disposi��o.

Responder

Gostei + 0

08/07/2009

Lucas Zago

Oi Henrique,

Por um momento achei bem vi�vel, visto que esses dados n�o s�o t�o din�micos, mas se for para pra pensar no n�mero de consultas poss�veis isso gera alguma duvidas por eu nao conhecer como funciona essas bibliotecas.

Mas pensando em consultas, os parametros sao:
Semestre (n) * Curso * (n) * P�los (n) * Disciplinas(n) * Dimensao(n)

A combina��o � grande e nao sei como ficaria armazenada todas essas consultas.
Elas estao demorando bastante apenas quando se trata dos parametros "todos os polos" ou "todas as disciplinas". Mas mesmo assim a combinacao de consultas usando esses parametros ainda nao � pequena.

Portanto, qual caminho seguir?

Tentar otimizar isso de alguma forma ou estrat�gia de cache?

Muito Obrigado Henrique,

Lucas

Responder

Gostei + 0

08/07/2009

Henrique Weissmann

Ol� Lucas,

prov�velmente as suas consultas ficam mais lentas quando se seleciona todos os polos ou disciplinas porque uma destas duas vari�veis (ou as duas) apresenta um maior n�mero de possibilidades.

Com rela��o a qual das abordagens adotar: alguma otimiza��o no banco de dados ou biblioteca de cache?

As duas possibilidades:

no seu banco de dados, verifique se h� �ndices para as colunas chave da sua tabela. Caso n�o exista, crie-os. S� isto j� ir� otimizar em muito o acesso �s informa��es.

Outra dica importante com rela��o a bancos de dados diz respeito ao tipo das colunas chave (como chaves prim�rias ou estrangeiras, ou mesmo consultas que sejam fundamentais para a consulta): j� vi diversas vezes utilizarem o tipo varchar neste tipo de campo. No caso, mude para char mesmo, pois o varchar sempre ter� um certo overhead relativo � descoberta do n�mero de caracteres armazenados no campo. � um tempo desprez�vel para poucos registros, mas que pode se tornar significativo para consultas maiores.

Com rela��o � utiliza��o de caches, sempre � uma boa alternativa. O racioc�nio b�sico aqui �: se j� foi computado uma vez (no caso, se voc� j� buscou um registro no bd (e consutlas no bd s�o caras), e o registro n�o sofre tantas altera��es), porque ficar computando diversas outras vezes quando voc� pode possuir o resultado pronto uma �nica vez? Esta � a id�ia b�sica por tr�s do cache.

Responder

Gostei + 0

08/07/2009

Lucas Zago

Pois � Henrique, voc� disse uma coisa agora que vai me ajudar a explicar o que realmente est� acontecendo.

Voc� disse: "provavelmente as suas consultas ficam mais lentas quando se seleciona todos os polos ou disciplinas porque uma destas duas vari�veis (ou as duas) apresenta um maior n�mero de possibilidades."

A consulta est� lenta nao somente pela busca de possiblidades, mas pela maneira que eu tenho de "monta-las" para exibir na tela.

Quando eu busco "Todos os Polos" E "Todas as Disciplinas" a consulta � rapida! Pois eu s� exibo uma coluna, que mostra o total de respostas de todos os p�los e todas as disciplinas.

Olhe a imagem no primeiro post.
Usando um exemplo de Todos os Polos e uma disciplina qualquer, que foi o exemplo do primeiro Post, no sistema � preciso montar uma coluna para cada p�lo. E nessa montagem est� o baixo desempenho pois al�m de eu achar os 25 respondentes da primeira alternativa em Pato Branco, eu tenho de saber que nessa questao existem 27 respondentes no total, para poder calcular a porcentagem de 92,59%.

Por isso acho que o desempenho nao est� de todo mal, mas nessas consultas de v�rias colunas talvez eu esteja pecando em alguma coisa.

Nao sou eu quem toma conta do BD, mas vou conversar com o analista hoje e sugerir alguma consulta que possa exibir isso de maneira que possa trazer pra aplicacao com uma varredura simples.

Me disseste "ainda n�o acessei o seu c�digo fonte". Poderia dar uma olhada nesse m�todo getAlternativa dentro da classe DBData quando puderes? Temo estar pecando em algo simples.

Obrigado Henrique

Lucas

Responder

Gostei + 0

13/07/2009

Henrique Weissmann

Lucas, verifiquei o seu c�digo e n�o encontrei nenhuma anomalia.

Tente a dobradinha cacheamento + otimiza��o do banco e me d� seu retorno ok?

Responder

Gostei + 0

14/07/2009

Devmedia

Lucas,
precisamos de um retorno seu para que possamos resolver suas d�vidas.

Responder

Gostei + 0

16/07/2009

Devmedia

Lucas,
precisamos de um retorno seu, a fim de solucionar o chamado. No aguardo.

Responder

Gostei + 0

17/07/2009

Lucas Zago

Ola,

Bom... a realidade eh que o cacheamento vai melhorar, mas eu nunca trabalhei com isso e teria de aprender uma coisa que talvez nao seja necessaria, pois tenho certeza que melhorando a maneira como foi implementado aquele metodo, concerteza vai resolver o problema, por isso pedi pra dar uma olhada no codigo. Anomalias nao tem mesmo porque esta funcionando, mas de uma maneira ruim, o ideal seria otimizar o codigo acredito.
E, pra algo estar na cache a consulta precisa ser feita, e como a combinacao de consultas nao eh pequena, teria de ser feita cada consulta daquela, demorando uns 10 minutos cada uma, para depois sim ficar em cache. Vou procurar como fazer isso usando ferramentas pra cache, mas..

Eu coloquei um problema em discussao com varios detalhes, mas recebi uma resposta bem generalizada que serviria pra qualquer aplicacao.

Responder

Gostei + 0

17/07/2009

Henrique Weissmann

Lucas,

neste caso, as solu��es s�o realmente gen�ricas, mas � que s�o as normalmente aplicadas em casos como o seu.

Se quiser, podemos a partir daqui ir trabalhando de duas maneiras:

* Vendo como funcionam as principais ferramentas de cache utilizadas atualmente

* Procurar alternativas para a execu��o de suas consultas. Percebi por exemplo que h� mais de um caso de pesquisa, a partir das quais voc� vai construindo o sql a ser gerado.

No caso, poderiamos discutir uma abordagem alternativa para este problema. Talvez remodelando o c�digo para cada caso, o que me diz?

Estou a sua disposi��o.

Responder

Gostei + 0

20/07/2009

Devmedia

Lucas,
precisamos de um retorno seu para podermos resolver o seu problema. O suporte DevMedia tira suas d�vidas, � s� expor que a gent tenta te ajudar da maneira mais f�cil e r�pida poss�vel.

Responder

Gostei + 0

23/07/2009

Lucas Zago

Oi Henrique,

Estava viajando, por isso a demora na resposta.

Voce disse duas coisas que a gente pode trabalhar.
Eu digo que se me ajudar a resolver tirando algumas duvidas no que diz respeito a implementacao, eu poderia abrir outro chamado s� para nos dedicarmos a caches. O que me diz?

O problema dos loops � o seguinte.
Quando ele entra nesse M�todo ele trabalha da seguinte forma

Para cada alternativa
- Faz muita coisa para achar resultados de somente uma alternativa

Voce disse que existe muitos casos, onde posso separar cada um deles, se eu resolver esse o resto � batata.
Montei um exemplo de cosulta sql onde isso esta tudo junto.

Agora a solucao caiu em como exibir isso na tela.
Por�m, dois problemas que preciso de sua ajuda.

1. Antes eu usava um HASHMAP, onde o c�digo do P�lo era a chave e um Objeto Respostas continha o N e a Porcentagem. E o porque de eu usar HASHMAP � que como pode observar os dados nao estao certinhos para simplemente botar na tela, tenho de trabalhar com eles, por exemplo no alternativa 101, teve apenas 1 respondente no Polo 'SC016' e nenhum dos outros respondeu essa alternativa nos outros Polos. Teria de estar como zero, mas eu nem posso usar o comando isNull no sql pois se a questao nao foi respondida nem sequer existe uma entrada com o campo null.
Resumindo, como nao da pra montar uma sql perfeita, preciso de uma chave de hash que utilize dois parametros.
O HashMap atual �:
HashMap<String, Respostas> v = new HashMap<String, Respostas>();
onde String � o c�digo do Polo.
Ou qualquer outra alternativa.

2. O que gerou essa confusao, � que estou gerando a tabela linha a linha.
E o interssante se eu conseguir fazer o que disse acima, seria gerar colunas de respostas por questao
Olhe como esta feito o trecho das alternativas, para cada questao ele executa isso no jsp.

<rich:subTable var="alternativa" value="#{questao.alternativaQuestao}"
                                <rich:column>
                                    <h:outputText value="#{alternativa.descricao}"/>
                                </rich:column>
                                <rich:columns value="#{listagem.cabecalho}" var="col" index="index">
                                    <h:panelGrid columns="2" width="100%">
                                    <h:outputText value="#{alternativa.respostas[index].NRespondentes}" />
                                        <h:outputText value="#{alternativa.respostas[index].porcentagem}" />
                                    </h:panelGrid>
                                </rich:columns>
</rich:subTable>

Estarei sempre por perto agora.
Grato.

Responder

Gostei + 0

23/07/2009

Henrique Weissmann

Ol� Lucas,

bem: vamos por partes ok?

> Voce disse duas coisas que a gente pode trabalhar.
> Eu digo que se me ajudar a resolver tirando algumas duvidas no que diz respeito a implementacao, eu poderia > abrir outro chamado s� para nos dedicarmos a caches. O que me diz?

O que for melhor pra voc� Lucas. :)

Antes de trabalharmos com as views, dei mais uma revisada no c�digo fonte. No caso, o m�todo que voc� havia mencionado anteriormente: fun��o getAlternativas da classe DBData.

Tenho algumas observa��es com rela��o a este m�todo. Para come�ar, o fato dele ser est�tico n�o � uma boa pr�tica. Lembre-se de que voc� est� trabalhando com uma aplica��o web que ser� acessada por diversas pessoas ao mesmo tempo. Ao definir este m�todo desta forma, voc� estar� criando um gargalo consider�vel na sua aplica��o, pois o m�todo ficar� "preso" para cada requisi��o feita.

O ideal consiste em voc� criar novas inst�ncias da classe DBData conforme se fa�a necess�rio.

Bom: agora, com rela��o ao conte�do do m�todo:

Observei algumas condi��es que talvez sejam perigosas com rela��o ao c�lculo dos "N respondentes".

Veja este trecho:

                String sql2 = "select count(*) as nRespondentes ";
                String sql2test = "";

                if (isTodosPolos() && !isTodosDisciplinas()) {
                    sql2 += ", cd_polo_pol ";
                }
                if (!isTodosPolos() && isTodosDisciplinas()) {
                    sql2 += ", cd_disciplina_dis ";
                }

Pergunta: voc� est� criando o seu c�digo SQL em tempo de execu��o. O que ocorreria se a fun��o isTodosPolos() retornar verdadeiro E isTodosDisciplinas() tamb�m? Outra situa��o: e se ambas as fun��es retornarem falso? Isto pode ocorrer? Os campos cd_polo_pol e cd_disciplina_dis n�o s�o utilizados no transcorrer do seu m�todo, reparou isto? Dependendo do SGBD utilizado, isto poderia tornar a sua consulta mais lenta.

(Saindo um pouco deste m�todo e caminhando em dire��o ao banco de dados, tenho uma sugest�o para voc� que aprendi analisando o c�digo do phpBB. Neste sistema h� uma situa��o similar � sua: l� � preciso expor quantos replies foram dados a determinado post no f�rum. H� dois caminhos aqui: eles poderiam simplesmente a cada execu��o chamar uma consulta do tipo "select count(*) from..." ou poderiam criar um campo a mais no post indicando qual o n�mero de replies, que seria atualizado conforme novas mensagens foram postadas. Optaram pela segunda alternativa. Talvez, voc� possa utilizar abordagem semelhante na sua base de dados, o que tornaria esta busca por n�mero de correspondentes desnecess�ria (pense nisto).

um trigger simples no banco de dados faria isto para voc�)

Outra sugest�o que fiz anteriormente: consultas SQL que s�o compostas por concatena��o de strings normalmente s�o sinal de problema a curto prazo. Pense novamente na utiliza��o de uma ferramenta de ORM para fazer suas consultas. O uso deste tipo de ferramenta diminui significativamente a complexidade do seu c�digo.

Vamos agora para a sua camada de visualiza��o:

Voc� menciona no seu �ltimo post que est� gerando as tabelas contendo o n�mero de respostas linha a linha. como consequ�ncia, teremos uma s�rie de tags <table> aninhadas. Pode ser (n�o garanto) que o seu servidor esteja inclusive gerando a resposta rapidamente para voc�, por�m o navegador esteja demorando na renderiza��o da sua p�gina. J� vi isto acontecer in�meras vezes. Minha sugest�o para este tipo de situa��o consiste em, visto que o aninhamento de tabelas se mostra necess�rio, optar por renderizar as tabelas aninhadas gerando a menor quantidade poss�vel de c�digo HTML ou, com o m�nimo poss�vel de estilos.

Talvez uma alternativa interessante seja a exposi��o dos seus dados n�o como tabelas, mas sim como listas. O que me diz? Al�m de ser gerado menos c�digo html, a renderiza��o seria mais r�pida (supondo que seja um problema de demora na renderiza��o).

Agora, com rela��o ao seu post:

>> Voce disse que existe muitos casos, onde posso separar cada um deles, se eu resolver esse o resto � batata.
>> Montei um exemplo de cosulta sql onde isso esta tudo junto.

Que caso voc� est� se referindo especificamente? Realmente n�o ficou claro para mim.

Aguardo seu retorno.

PS:

Uma dica interessante: para avaliar o desempenho dos seus m�todos, crie testes unit�rios para eles. Assim voc� poder� comparar o tempo de execu��o dos testes para ter uma no��o de onde seu c�digo est� ficando preso ou n�o.

Outra dica de ferramenta interessante � o profilador do Netbeans (o melhor que conhe�o). Pelo que vi, voc� est� trabalhando com o Eclipse. No entanto, voc� pode importar o seu projeto para o Netbeans e execut�-lo pelo Netbeans s� para usar seu profilador, que costuma ser uma m�o na roda em situa��es como as suas.

Responder

Gostei + 0

24/07/2009

Lucas Zago

>Pergunta: voc� est� criando o seu c�digo SQL em tempo de execu��o. O que ocorreria se a fun��o >isTodosPolos() retornar verdadeiro E isTodosDisciplinas() tamb�m? Outra situa��o: e se ambas as fun��es >retornarem falso?

Tipos de Consulta:
    if (!isTodosPolos() && !isTodosDisciplinas())
Eficiente!

    if (isTodosPolos() && isTodosDisciplinas())
Eficiente, pois so precisa gerar um total(uma coluna)

Os outros dois casos sao:

    if (isTodosPolos() && !isTodosDisciplinas())
    if (!isTodosPolos() && isTodosDisciplinas())

Ou seja se sao "todos os polos" OU "todas as disciplinas". Estes sao demorados porque geram uma tabela com varias colunas.

---------------------------------------

>Os campos cd_polo_pol e cd_disciplina_dis n�o s�o utilizados no transcorrer do seu m�todo, reparou isto? >Dependendo do SGBD utilizado, isto poderia tornar a sua consulta mais lenta.

Os campos cd_polo_pol e cd_disciplina_dis sao seguidos no final por um group by, mas somente nesses casos. As outras situacoes so e retornado um N pelo count.

>Pode ser (n�o garanto) que o seu servidor esteja inclusive gerando a resposta rapidamente para voc�, por�m o >navegador esteja demorando na renderiza��o da sua p�gina

Tambem nao garanto, mas apostaria 90% que nao, pelo que ja vi anteriormente.
---------

Agora sobre os casos que especifiquei, � um dos dois casos que geram problemas, me referi quando � todos os polos e !todas as disciplinas.
Por favor, de uma olhada no meu primeiro post, la eu explico exatamente o que e o "Meu grande problema"

---------

PS: Pode ter certeza que todas as dicas que deu sao validas e pretendo analisar e ver todas elas, mas preciso que isso tenha ao menos uma melhora significativa para depois poder trablhar nas outras coisas. Tenho certeza que o problema e o desempenho neste metodo. E e nisso que estou trabalhando no momento.

Obrigado Henrique.

Responder

Gostei + 0

24/07/2009

Lucas Zago

Oi Henrique,

Estou tentando montar uma consulta que vai ter todos os dados que eu preciso. Se eu conseguir monta-la.
Tudo � uma questao de manipular os dados depois, mas o importante � que ele ir� fazer muito menos varreduras no BD.

Esse � um exemplo de consulta:

select distinct cd_polo_pol, count(*) as nRespondentes, nu_alternativa_tpa
from capa..respostaQuestaoAcad_rqa
where cd_pesquisa_pes=101
and nu_sem_trm=20081
and cd_dimensao_dim=1
and cd_grupoQuestao_grq=1
and cd_questao_qto=1
and cd_curso_rqa=709
and cd_disciplina_dis='FIL9600'
and nu_alternativa_tpa In(101,102,103,104)
group by cd_polo_pol, nu_alternativa_tpa

Esses numeros dentro de nu_alternativa_tpa precisam ser gen�ricos.
Eu pego eles por uma outra consulta que esta abaixo e � executada primeiro

            while (rs.next()) {
                alt = new AlternativaQuestao();
                alt.setNumero(rs.getInt("nu_alternativa_tpa"));
                alt.setDescricao(rs.getString("dc_alternativa_tpa"));
                alt.setSequencia(rs.getInt("nu_seqAlternativa_que"));
            }

Tentei fazer da seguinte maneira
Concatenei todos os alt.getNumero() separados por viruglas e coloquei no statement. Mas deu que nao podia fazer a consulta no BD pois esse numeros precisam ser Inteiros separados por virgulas, e nao um "stringao" como eu fiz.

Tentei coloca-los num array, mas eu nao sei quantos vao ter.

Tentei em um arrayList mas acabei caindo na mesma ideia, nao sei quantos numeros vao ter, entao nao sei como coloca-los separados por virgulas para colocar na sql.
Essa � a id�ia
String sql2 = "select distinct cd_polo_pol, count(*) as nRespondentes, nu_alternativa_tpa "
                    + "from capa..respostaQuestaoAcad_rqa "
                    + "where cd_pesquisa_pes=? "
                    + "and nu_sem_trm=? "
                    + "and cd_dimensao_dim=? and cd_grupoQuestao_grq=? and cd_questao_qto=? "
                    + "and cd_curso_rqa=? and cd_disciplina_dis=? "
                    + "and nu_alternativa_tpa In(alts.get(0) + "," + alts.get(1) ... + ")"
                    + "group by cd_polo_pol, nu_alternativa_tpa";

Ou seja, como posso montar essa SQL. Meu problema caiu em como montar ela.

=p

Responder

Gostei + 0

24/07/2009

Lucas Zago

Opa, sobre o post da consulta SQL j� consegui

select distinct cd_polo_pol, count(*) as nRespondentes, nu_alternativa_tpa
from capa..respostaQuestaoAcad_rqa
where cd_pesquisa_pes=101
and nu_sem_trm=20081
and cd_dimensao_dim=1
and cd_grupoQuestao_grq=1
and cd_questao_qto=1
and cd_curso_rqa=709
and cd_disciplina_dis='FIL9600'
and nu_alternativa_tpa In(select nu_alternativa_tpa from capa..vi_alternativaQuestao_que where cd_pesquisa_pes=101 and cd_dimensao_dim=1
and cd_grupoQuestao_grq=1
and cd_questao_qto=1)
group by cd_polo_pol, nu_alternativa_tpa

Responder

Gostei + 0

Mais t�picos