Kivik Base Teste: criando base de dados com múltiplos inserts

A Kivik Base Teste 2.0 foi desenvolvida em C++ como parte de um trabalho de conclus�o de curso com o intuito de gerar uma base de dados testes para MySQL ou MongoDB para ser utilizado em pesquisas de desempenho do SGBD. Inicialmente a vers�o 1.0 gerava um arquivo .txt e somente para MySQL, mas por suas limita��o de tamanho, como por exemplo n�o suportar 10.000.000 de inserts criados pela ferramenta, a vers�o 1.1 passou a gerar um arquivo .sql.

A vers�o que ser� utilizada neste artigo, a 2.0, al�m de gerar para MySQL tamb�m gera para MongoDB. Como essa ferramenta � open source, alterando seu c�digo fonte, � poss�vel gerar base de dados para qualquer SGBD existente, tendo em vista que o mais �dif�cil� j� foi feito, que foi criar um padr�o para banco de dados relacionais, neste caso o MySQL e, outro padr�o para SGBDs n�o relacionais, como � o caso do MongoDB.

O algoritmo de multiplica��o dos inserts est� inserido duas vezes dentro do c�digo fonte: uma para MySQL e outra para MongoDB. Ent�o, ao alterar o c�digo fonte, a primeira informa��o que voc� tem que ter em mente � se o SGBD � relacional ou n�o relacional.

Ap�s fazer o download da ferramenta (vide se��o Links), observe que o arquivo tem quatro arquivos, sendo um deles o execut�vel e outro o c�digo fonte salvo em formato .cpp. Para rodar este arquivo ser� necess�rio um compilador da linguagem C, como por exemplo, o DEV C++.

Por apenas ser executada, e como a Kivik trabalha com manipula��o da mem�ria do seu computador para gerar as tabelas ou documentos e criar o arquivo com a base de dados a ser utilizada, lembre-se de desabilitar o seu firewall antes de execut�-la.

Iniciaremos esse artigo separando o algoritmo especifico do MongoDB, e a partir dele, mostraremos como utiliz�-lo e alter�-lo. Na Listagem 1 temos o algoritmo de cria��o de documentos, gera��o e multiplica��o de inserts.


printf ("Nome do documento: "); 
// vers�es futuras numero de documentos ser� aleat�rio
scanf ("%s", &documento);

listaDeColunas = NULL;
printf ("\nDocumentos prontas para serem inseridas");

printf ("\n\nDigite o n�mero de chaves do documento: "); 
// vers�es futuras numero de colunas ser� aleat�rio
scanf ("%d", &qtdColunas);

for (cont=0; cont<qtdColunas; cont++){

printf ("Digite o nome da chave: "); 
// vers�es futuras nome da coluna ser� gerado randomicamente
scanf ("%s", &addcol);

novo = (col*)malloc(sizeof(col));
memcpy(novo->nome, addcol, 50);
novo->tipo = getchar();

novo -> prox = NULL;
if(listaDeColunas == NULL){
         listaDeColunas = novo;
} else {
         aux = listaDeColunas;
         while (aux -> prox != NULL) aux = aux->prox;
         aux -> prox = novo;
} 

}

  cls();

exibirCabecalho();

if (fp) {

fprintf (fp, "\n\n\nuse %s;", documento);

aux = listaDeColunas;

printf ( "insira quantidade de dados a serem criados: ");
scanf ("%d", &quant_dados);


for (i=quant_dados; i>=1; i--)
{

fprintf (fp, "\ndb.%s.insert( {", documento);

aux = listaDeColunas;

  while (aux != NULL){
     if(aux -> prox == NULL){
        fprintf (fp, "%s:\"%dkivik\"});", aux -> nome,  rand() % 200000);
        break;
    }else{
        if (aux == listaDeColunas){
            fprintf (fp, "%s:\"%d\", ", aux -> nome,  i);
        }else{
        fprintf (fp, "%s:\"kivik%d\", ", aux -> nome,  rand() % 200000);      
    }
    aux = aux -> prox;
  }
}
}
fclose(fp);
}
getch();

Listagem 1. Algoritmo para bancos n�o relacionais

Nas linhas um e dois o c�digo apenas inserimos um texto na tela e pedimos a inser��o de uma vari�vel do tipo string. Nas linhas quatro e cinco � separado um endere�o de mem�ria para poder come�ar a inserir os dados e sua mensagem de confirma��o, respectivamente. Nas linhas sete e oito � onde o usu�rio insere a quantidade de chaves/tabelas que a ferramenta deve ter: repare no coment�rio no final da linha sete que mostra que podemos usar o mesmo c�digo para gerar bases testes para todos os SGBDs existentes.

Na linha 10 � aberto um la�o de repeti��o com base no valor anteriormente digitado pelo usu�rio. Nas linhas 12 e 13 temos uma mensagem ao usu�rio pedindo para inserir o nome da chave/tabela. Em vers�es futuras, a ferramenta poder� gerar esses nomes aleatoriamente caso o usu�rio permita. Nas linhas 15 a 17 � alocado um espa�o na mem�ria e todo dado inserido � copiado para um novo endere�o de mem�ria, dado esse que � copiado de forma bin�ria, j� que esses dados est�o sendo tratados como vetores.

Na linha 19 criamos um novo espa�o de mem�ria vazio para continuar com a repeti��o. Nas linhas 20 a 28 do c�digo existe uma condi��o de apenas duas possibilidades: verificar se a lista onde foram inseridos os dados est� vazia ou j� cont�m algum dado. Lembre-se que � nessas linhas onde ocorre a inser��o dos dados na mem�ria.

Nas linhas 30 e 32 s�o chamadas duas fun��es que est�o fora desse algoritmo base (algoritmo base da ferramenta).

A linha 34 do algoritmo base � onde ocorre a abertura do arquivo onde ser�o inseridos os dados gerados. Esse arquivo � criado fora do algoritmo base nessa vers�o, com o intuito de sempre ser o mesmo arquivo, n�o importando qual SGBD o usu�rio escolha para gerar a base de dados a ser utilizada em seus testes.

Na linha 36 temos a sintaxe de cria��o de documentos do MongoDB: lembrando que estamos utilizando a vers�o do algoritmo base para MongoDB neste artigo. J� nas linhas 40 e 41 � onde ocorre a inser��o da quantidade de dados a serem criados.

Das linhas 44 at� 67 � onde ocorre o la�o que gera os inserts de acordo com o n�mero de dados digitado pelo usu�rio. Caso o usu�rio queira criar base de dados testes para outros SGBDs al�m do MongoDB e MySQL (gerados por esta vers�o), o usu�rio dever� alterar apenas a sintaxe das linguagens contidas nas linhas 36, 47, 53, 57 e 59 do algoritmo.

Lembre-se que a sintaxe entre bancos de dados relacionais e n�o relacionais difere bastante, ent�o, se o usu�rio for gerar bases de dados para bancos de dados relacionais, orienta-se a utiliza��o do algoritmo base que est� gerando para MySQL.

J� fora do algoritmo base apresentado, entre as linhas 200 e 217 do c�digo fonte, o usu�rio percebe uma fun��o utilizada para apagar o texto da tela da ferramenta. Esta fun��o foi utilizada porque utilizar a fun��o localizada na biblioteca stdlib.h n�o funcionava corretamente. Na Listagem 2 temos o referido c�digo.


void cls() 
{ 
 HANDLE hCon = GetStdHandle(STD_OUTPUT_HANDLE); 
 
 CONSOLE_SCREEN_BUFFER_INFO info; 
 GetConsoleScreenBufferInfo( hCon, &info ); 
 
 COORD home = { 0, 0 }; 
 DWORD nchars = (DWORD)info.dwSize.X * info.dwSize.Y; 
 DWORD nwritten; 
 
 // Fill the entire screen with blanks. 
 
 FillConsoleOutputCharacter( hCon, ' ', nchars, home, &nwritten ); 
 FillConsoleOutputAttribute( hCon, info.wAttributes, nchars, home, &nwritten); 
 
 SetConsoleCursorPosition( hCon, home ); 
}

Listagem 2. Fun��o da biblioteca stdlib.h

Como sabemos, a sintaxe dos inserts entre todos os SGBDs se difere, principalmente entre bancos de dados relacionais e n�o relacionais. Em bancos de dados n�o relacionais, como � o caso do MongoDB, sua sintaxe funciona no m�todo chave/valor, onde a cada chave digitada o valor deve ser inserido em seguida. J� nos bancos de dados relacionais, suas colunas s�o inseridas primeiro e, depois os valores em sua uma ordem respectiva a das colunas. Essa pequena diferen�a de sintaxe entre bancos relacionais e n�o relacionais foi crucial para o algoritmo base.

Enquanto que para MongoDB o usu�rio insere o n�mero de chaves que bem entender na vers�o 2.0, no caso do MySQL o n�mero de colunas � fixo em 10, podendo ser alterado nas linhas 63 e 64 de seu algoritmo base. Na Listagem 3 temos o algoritmo base na vers�o dos bancos de dados relacionais.


printf ("Nome da tabela: "); // vers�es futuras numero de tabelas ser� aleat�rio
scanf ("%s", &tabela);
            
 listaDeColunas = NULL;
 printf ("\nColunas prontas para serem inseridas");
 
 printf ("\n\nDigite 10 para gerar 10 colunas: "); 
 // vers�es futuras numero de colunas ser� aleat�rio
 scanf ("%d", &qtdColunas);
          
 printf ("\nPrimeira coluna eh primary key.\n\n"); 
            
 for (cont=0; cont<qtdColunas; cont++){
 
 printf ("Digite o nome da coluna: "); 
 // vers�es futuras nome da coluna ser� gerado randomicamente
  scanf ("%s", &addcol);
  printf ("insira alguma variavel do tipo char: "); 
  // vers�es futuras poder� escolher tipo da variavel nesse momento
  scanf ("%s", &tipo);
 
  novo = (col*)malloc(sizeof(col));
  memcpy(novo->nome, addcol, 50);
  novo->tipo = getchar();
 
  novo -> prox = NULL;
  if(listaDeColunas == NULL){
      listaDeColunas = novo;
  } else {
     aux = listaDeColunas;
     while (aux -> prox != NULL) aux = aux->prox;
     aux -> prox = novo;
 } 
            
}
            
cls();
            
exibirCabecalho();
            
if (fp) {
            
  fprintf (fp, "\n\n\ncreate table %s (", tabela);
            
  aux = listaDeColunas;
  while (aux != NULL){
     fprintf (fp, "\n %s varchar(50),", aux -> nome); 
     // vers�es futuras criar cases para tipo de variavel (recomendavel aqui)
    aux = aux -> prox;
   }
            
   fprintf(fp, "\nPRIMARY KEY (%s)\n);\n\n", listaDeColunas->nome);
            
   printf ( "insira quantidade de dados a serem criados: ");
   scanf ("%d", &quant_dados);
   
   for (i=quant_dados; i>=1; i--)
   {
            
     fprintf (fp, "\ninsert into %s (", tabela);
            
     aux = listaDeColunas;
 
     while (aux != NULL){
        if(aux -> prox == NULL){
           fprintf (fp, "%s) VALUES ( %d, 'kivik%d', 'kivik%d', '%dkivik', 
           'kivik%d', '%dkivik', 'kivik%d', '%dkivik', 'kivik%d', '%dkivik');"
           , aux -> nome, i, rand() % 200000, rand() % 200000, rand() % 200000, 
           rand() % 200000, rand() % 200000, rand() % 200000, rand() % 200000, rand() 
           % 200000, rand() % 200000);
       }else{
           fprintf (fp, "%s,", aux -> nome );      
       }
       aux = aux -> prox;
    }
  }
  fclose(fp);
}
getch();

Listagem 3. C�digo para altera��es com banco de dados relacionais

O uso da Kivik Base Teste � bem simples. Inicialmente, sugerimos que o usu�rio, para n�o ter poss�veis problemas com seu firewall, execute a ferramenta como administrador. Para este exemplo inserimos a ferramenta na raiz de uma parti��o qualquer, mas isso n�o � obrigat�rio. Lembre-se que o arquivo com os dados ser� gerado no mesmo local onde a ferramenta estiver.

Na tela inicial da ferramenta, as tr�s primeiras linhas s�o o cabe�alho da ferramenta. A fun��o deste cabe�alho se encontra entre as linhas 7 e 13 do seu c�digo fonte. Na linha 13 chamamos aquela fun��o que apaga o que est� escrito na tela da ferramenta.

As tr�s �ltimas linhas da tela inicial da ferramenta � um pequeno label, onde podemos escolher uma das tr�s op��es apresentadas, como mostra a Figura 1. Ap�s a escolha a ferramenta fecha.

**Figura 1**. Tela inicial Kivik Base Teste 2.0

Para este artigo vamos mesclar o uso da mesma, gerando uma base de dados apenas, e duas bases de teste.

Ap�s escolher para qual SGBD o usu�rio quer gerar a base de dados, a tela que aparece na vers�o 2.0 pergunta qual o nome da tabela/documento e, em seguida, pede para inserir o n�mero de colunas/chaves.

Na vers�o para gerar uma base de dados para MySQL, a cada nome de coluna inserido pede-se para digitar uma vari�vel do tipo char (uma letra) (n�o pode ser "�" ou caracteres especiais). Repare que esse peda�o corresponde as linhas 16 e 17 do algoritmo base para bancos de dados relacionais. Na Figura 2 temos um exemplo de como se encontrar� a tela da ferramenta neste momento.

**Figura 2**. Inserindo dados na Kivik Base Teste 2.0

Ap�s inserir o nome da �ltima coluna/chave a tela da ferramenta se apaga, isso ocorre porque nas linhas 34 ou 30 (o n�mero de linhas difere um pouco por causa da sintaxe de cada tipo de SGBD) do algoritmo base � chamado a fun��o utilizada para apagar os dados da tela.

O arquivo onde ser�o inseridos os dados � criado no momento em que a ferramenta � aberta, por causa disso, foi sugerido que utilize a ferramenta em modo administrador, para n�o perder tempo extra com seu firewall ou antiv�rus.

Neste momento a tela da ferramenta mostra o cabe�alho e pede ao usu�rio para inserir a quantidade de dados que deseja. O usu�rio pode solicitar a cria��o de nenhum dado ou de mais de 10.000.000 de inserts de uma vez. Enquanto a ferramenta n�o terminar de gerar os dados o usu�rio n�o poder� fechar a janela: ao clicar em �enter�, a ferramenta fecha, ent�o nada ocorre.

Por seguran�a n�o utilize o documento de forma nenhuma at� terminar de gerar os dados, pois isso pode travar tanto a ferramenta, quanto o local onde ela est� e outros softwares que estejam abertos.

Na Figura 3 a seguir um exemplo da tela da ferramenta neste momento.

**Figura 3**. Segunda tela da Kivik Base Teste 2.0

Ao final a ferramenta gera um arquivo do tipo .doc, mas isso pode ser alterado na linha 38 do c�digo fonte. Foi escolhido este tipo de arquivo por causa do seu f�cil manuseio. Repare que nesta linha do c�digo fonte temos a express�o "a+": ela foi escolhida pois cria um documento em branco, e se o documento j� existir, ele insere os dados criados no final do documento.

Se o usu�rio tentar criar uma nova base de dados com um documento com o mesmo nome, os dados que a ferramenta criar ser�o inseridos a partir do final desse documento. Caso o arquivo esteja aberto quando o usu�rio criar uma nova base de dados, basta o usu�rio n�o salvar poss�veis altera��es feitas no arquivo, fechar e abrir novamente, que a nova base de dados estar� criada ao final do arquivo.

Veja um exemplo desse documento na Figura 4.

**Figura 4**. Parte do arquivo criado na Kivik Base Teste 2.0

Veja na figura que temos duas bases criadas: a primeira para MySQL a quantidade de dados foi 0; j� a segunda base de dados, que foi gerada para MongoDB, t�m 10.000.000 de inserts.

Como podemos ver a ferramenta gera o n�mero da primary key em ordem decrescente, isso acontece para podermos visualizar de forma mais r�pida a quantidade de dados gerados. Nesta vers�o todas as colunas s�o do tipo varchar, mas o usu�rio n�o precisa se preocupar com a primary key tendo apenas n�meros, mas caso queira alterar o tipo da vari�vel da primary key, nesta vers�o o usu�rio tem que editar o documento gerado.

O c�digo completo da ferramenta encontra-se na Listagem 4.


#include <stdio.h>
#include <conio.h>
#include <windows.h>
#include <stdlib.h>
#include <time.h> 

void exibirCabecalho(){
  printf ("kivik base teste versao 1.1 - MySQL\n");
  printf ("Desenvolvido por: Alam Maia da Silva Vianna\n");
  printf ("Colaboradores: IRC, servidor RIZON, canal #gold_code\n\n\n");
}

  void cls();

main (void) {
  
  struct col{
  char nome[50];
  char tipo;
  int nucolna;
  col *prox;
}*listaDeColunas;

    char tabela[50];
    int qtdColunas=0;
    int cont;
    int i, quant_dados;
    char addcol[50];
  char *tipo;
  char addtipo;
//  int i, cont; /*retirado na retirada das fun��es*/
  col *aux, *novo;
          
    srand(time(NULL));

    exibirCabecalho();
    
    printf ("Nome da tabela: "); // vers�es futuras numero de tabelas ser� aleat�rio
    scanf ("%s", &tabela);
          
// cria lista vazia
  listaDeColunas = NULL;
  printf ("\nColunas prontas para serem inseridas");

    printf ("\n\nDigite 10 para gerar 10 colunas: "); 
    // vers�es futuras numero de colunas ser� aleat�rio
    scanf ("%d", &qtdColunas);
    
    printf ("\nPrimeira coluna eh primary key.\n\n"); 
    
    for (cont=0; cont<qtdColunas; cont++){
  //col *aux, *novo; // ignorado na retirada das fun��es

          printf ("Digite o nome da coluna: "); 
          // vers�es futuras nome da coluna ser� gerado randomicamente
          scanf ("%s", &addcol);
          printf ("insira alguma variavel do tipo char: "); 
          // vers�es futuras poder� escolher tipo da variavel nesse momento
//        fflush(stdio);
          scanf ("%s", &tipo);

          novo = (col*)malloc(sizeof(col));
          memcpy(novo->nome, addcol, 50);
          novo->tipo = getchar();

          novo -> prox = NULL;
          if(listaDeColunas == NULL){
                      listaDeColunas = novo;
          } else {
                      aux = listaDeColunas;
                      while (aux -> prox != NULL) aux = aux->prox;
                      aux -> prox = novo;
          } 
          
          }
          
                      cls();
          
          exibirCabecalho();
          

          FILE *fp = fopen("kivik.sql", "a+");
          
          if (fp) {
          
          fprintf (fp, "\ncreate table %s (", tabela);
          
          //col *aux; 
          aux = listaDeColunas;
          while (aux != NULL){
                      fprintf (fp, "\n %s varchar(50),", aux -> nome); 
                      // vers�es futuras criar cases para tipo de variavel (recomendavel aqui)
                      aux = aux -> prox;
          }
          
          fprintf(fp, "\nPRIMARY KEY (%s)\n);\n\n", listaDeColunas->nome);
          
          printf ( "insira quantidade de dados a serem criados: ");
          scanf ("%d", &quant_dados);
          
          for (i=quant_dados; i>=1; i--)
          {
          
          fprintf (fp, "\ninsert into %s (", tabela);
          
//          col *aux; 
          aux = listaDeColunas;

            while (aux != NULL){
                 if(aux -> prox == NULL){
                     fprintf (fp, "%s) VALUES ( %d, 'kivik%d', 'kivik%d', '%dkivik', 
                     'kivik%d', '%dkivik', 'kivik%d', '%dkivik', 'kivik%d', '%dkivik');"
                     , aux -> nome, i, rand() % 2000, rand() % 2000, rand() % 2000, 
                     rand() % 2000, rand() % 2000, rand() % 2000, rand() % 2000, rand() % 2000, 
                     rand() % 2000);
                 }else{
                     fprintf (fp, "%s,", aux -> nome );      
                 }
                 aux = aux -> prox;
              }
          }
          fclose(fp);
          }
          
           getch();
          return 0;
}


void cls() 
{ 
HANDLE hCon = GetStdHandle(STD_OUTPUT_HANDLE); 

CONSOLE_SCREEN_BUFFER_INFO info; 
GetConsoleScreenBufferInfo( hCon, &info ); 

COORD home = { 0, 0 }; 
DWORD nchars = (DWORD)info.dwSize.X * info.dwSize.Y; 
DWORD nwritten; 

// Fill the entire screen with blanks. 

FillConsoleOutputCharacter( hCon, ' ', nchars, home, &nwritten ); 
FillConsoleOutputAttribute( hCon, info.wAttributes, nchars, home, &nwritten); 

SetConsoleCursorPosition( hCon, home ); 
}

Listagem 4. C�digo completo da ferramenta

A ferramenta est� em constante desenvolvimento e, caso queira contribuir, basta alterar o c�digo no github (vide se��o Links). Caso altere o c�digo fonte para gerar para outro SGBD pedimos que suba a parte do c�digo que alterou, assim poderemos atualiz�-la com mais um SGBD, mas n�o precisa arrumar o menu inicial, bastando apenas informar o SGBD nos coment�rios do c�digo.

Nota: Kivik 2.0

Tecnologias:

Confira outros conte�dos:

SQL SUM: somando os valores de uma...

SQL: INNER JOIN

SQL: Introdu��o ao Where

Assista grátis a nossa aula inaugural

Perguntas frequentes

Quem somos?

Por que a programação se tornou a profissão mais promissora da atualidade?

Como faço para começar a estudar?

Em quanto tempo de estudo vou me tornar um programador?

Sim, você pode se tornar um programador e não precisa ter diploma de curso superior!

O que eu irei aprender estudando pela DevMedia?

Principais diferenciais da DevMedia

Qual o investimento financeiro que preciso fazer para me tornar um programador?

Como funciona a forma de pagamento da DevMedia?

Por Alam Em 2015

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouqu�ssimas coisas de programa��o antes de come�ar a estudar com voc�s, fui me especializando em v�rias �reas e ferramentas que tinham na plataforma, e com essa bagagem consegui um est�gio logo no in�cio do meu primeiro per�odo na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse per�odo a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta � continuar estudando e praticando para ser um Full-Stack Dev!

Her�clito J�nior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma � bem intuitiva e muuuuito did�tica a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda n�o tinha visto. A did�tica � do jeito que qualquer pessoa consegue aprender. S�rio, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de voc�s e logo percebi que s�o os melhores do Brasil. � um passo a passo incr�vel. S� n�o aprende quem n�o quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que j� fiz na vida e tenho aprendido bastante com a plataforma. Voc�s est�o fazendo parte da minha jornada nesse mundo da programa��o, irei assinar meu contrato como programador gra�as a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exerc�cios pr�ticos que n�o tem como n�o aprender, est�o de parab�ns!

Jos� Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino t�o presente na vida acad�mica de seus alunos, parab�ns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia h� cerca de 1 ano e meio... Hoje estou h� 1 ano empregado trabalhando 100% com React!

Adauto Junior

J� fiz alguns cursos na �rea e nenhum � t�o bom quanto o de voc�s. Estou aprendendo muito, muito obrigado por existirem. Est�o de parab�ns... Espero um dia conseguir um emprego na �rea.

Ver todos os casos de sucesso

Kivik Base Teste: Como gerar base de dados com m�ltiplos inserts

Veja neste artigo como utilizar a ferramenta Kivik Base Teste 2.0 para gerar uma base de dados com v�rios inserts, al�m de alterar no c�digo fonte para que a ferramenta gere diferentes tipos de documentos.