Carregando dados de forma mais eficiente com a classe SqlBulkCopy

Quando se leva em conta a necessidade de compartilhamento de informa��es entre diferentes sistemas, arquivos ainda s�o um meio ainda bastante comum de integra��o. Esse tipo de pr�tica est� normalmente associado ao processamento de um grande volume de dados, podendo tanto acontecer entre softwares de uma mesma companhia, quanto entre aplica��es de organiza��es distintas.

Listas de pre�os geradas por um determinado fornecedor, lan�amentos cont�beis e/ou financeiros, movimenta��es banc�rias e registros de folha de pagamento s�o apenas alguns exemplos comuns de agrupamento de dados comumente carregados em bases relacionais por meio de arquivos.

Existem in�meras solu��es que podem ser empregadas em cen�rios como os citados aqui. A pr�pria Microsoft conta com o Integration Services, sendo este �ltimo um dos componentes do SQL Server. A grande vantagem deste servi�o (Integration Services) est� em permitir que se obtenham aplica��es robustas e extremamente flex�veis no que se refere processamento de informa��es.

Ainda sobre o Integration Services, merece destaque o fato de que o mesmo disp�e de mecanismos capazes de processar grandes massas de dados organizadas sob a forma dos mais variados tipos de arquivos, sem que isto implique em grandes esfor�os de implementa��o. S�o suportados, neste caso, formatos como texto (em que cada posi��o pode corresponder a um campo/informa��o), CSV (sigla do ingl�s "Comma-separated values", com os diferentes valores de cada linha estando separados neste caso por ponto-e-v�rgula), XML ou ainda, planilhas do Excel e bancos de dados Access.

No entanto, nem sempre ser� poss�vel se contar com ferramentas que simplificam a importa��o de dados presentes em arquivos. Se o gerenciador de banco de dados utilizado for o SQL Server, a classe SqlBulkCopy do .NET Framework (namespace System.Data.SqlClient) pode se revelar como um instrumento de grande valia em tais situa��es.

Partindo de objetos dos tipos DataReader, DataTable ou DataRow, a classe SqlBulkCopy fornece meios para a carga eficiente de grandes volumes de dados em tabelas do SQL Server. Al�m disso, a performance conseguida atrav�s de inst�ncias da classe SqlBulkCopy costuma se mostrar bem superior, sobretudo se comparada � execu��o de centenas de instru��es SQL atrav�s de refer�ncias to tipo Command ou ainda, com mecanismos como LINQ to SQL ou o Entity Framework.

A finalidade deste artigo � demonstrar como o tipo SqlBulkCopy pode ser utilizado na importa��o do conte�do de arquivos para bases de dados do SQL Server. Visando cumprir este objetivo, ser� apresentado um exemplo pr�tico de como se proceder com a carga de um arquivo com a extens�o .csv.

Criando uma aplica��o que faz uso da classe SqlBulkCopy

A solu��o apresentada neste artigo foi criada no .NET framework 4.5, atrav�s da utiliza��o do Microsoft Visual Studio 2012 Professional.

Basicamente, ser� constru�da uma Console Application de nome �TesteSqlBulkCopy (Figura 1), a qual ser� respons�vel por importar informa��es de um arquivo .csv contendo pre�os de produtos comercializados por um estabelecimento comercial.

Figura 1: Criando o projeto TesteSqlBulkCopy

Num cen�rio real, este cat�logo de produtos poderia estar sendo gerado por um fornecedor da empresa considerada, englobando neste caso um n�mero extenso de itens que seriam reprocessados a cada novo arquivo recebido (ao menos para os testes aqui descritos, ser� efetuada a carga de um arquivo com poucos itens, somente para efeitos de simula��o).

Uma vez que a solu��o e o projeto correspondente tenham sido gerados, faz-se necess�ria a inclus�o de uma refer�ncia para a biblioteca System.Configuration (Figura 2). Este ajuste foi efetuado de maneira que se possam acessar funcionalidades disponibilizadas pelo tipo ConfigurationManager (conforme ser� demonstrado durante a implementa��o das classes que comp�em a aplica��o).

Figura 2: Adicionando ao projeto uma refer�ncia � biblioteca System.Configuration

Quanto � estrutura das informa��es presentes no cat�logo de produtos, o arquivo .csv em que constar�o tais registros possuir� as seguintes colunas (j� mencionadas aqui na ordem esperada pela aplica��o de exemplo):

C�digo de barras do produto;
Nome do produto;
Categoria (corresponde ao tipo de um produto: CDs, DVDs, Blu-Ray, Livros);
Data em que o produto passou a fazer parte do cat�logo;
Quantidade dispon�vel para comercializa��o;
Pre�o de venda sugerido.

Na Figura 3 est� um exemplo de como seria este arquivo.

OBSERVA��O: Para efeito de testes, a aplica��o de exemplo ir� sempre procurar por um arquivo de nome �AtualizacaoCatalogo.csv� no diret�rio �C:\Temp\Catalogo\�.

Figura 3: Arquivo .csv contendo o cat�logo de produtos

A estrutura da tabela que receber� as informa��es do arquivo AtualizacaoCatalogo.csv � apresentada na Listagem 1. Conforme ser� demonstrado mais adiante, est� se partindo do pressuposto que essa estrutura (TB_CARGA_CATALOGO) faz parte de um banco de dados tamb�m chamado �TesteSqlBulkCopy�.

Listagem 1: Estrutura da tabela TB_CARGA_CATALOGO


CREATE TABLE [dbo].[TB_CARGA_CATALOGO](
	[CodigoBarras] [varchar](13) NOT NULL,
	[NomeProduto] [varchar](50) NOT NULL,
	[Categoria] [varchar](30) NOT NULL,
	[DtIniComercializacao] [datetime] NOT NULL,
	[QtdDisponivel] [int] NOT NULL,
	[VlSugerido] [decimal](10,2) NOT NULL,
	CONSTRAINT [PK_TB_CARGA_CATALOGO] PRIMARY KEY ([CodigoBarras])
)

J� na Listagem 2 est� o arquivo app.config do projeto TesteSqlBulkCopy. Encontram-se declarados no mesmo os seguintes itens:

Uma ConnectionString de nome �TesteSqlBulkCopy�, a qual aponta para a base em que ser�o importadas as informa��es de produtos;
O caminho em que consta o arquivo .csv correspondente ao cat�logo de produtos (configura��o �CaminhoArquivoCatalogo�).

Listagem 2: Arquivo app.config da aplica��o TesteSqlBulkCopy


<?xml version="1.0" encoding="utf-8" ?>
<configuration>
  <connectionStrings>
    <add name="TesteSqlBulkCopy"
         providerName="System.Data.SqlClient"
         connectionString="Data Source=.;Initial Catalog=TesteSqlBulkCopy;Integrated Security=True"/>
  </connectionStrings>
  <appSettings>
    <add key="CaminhoArquivoCatalogo"
         value="C:\Temp\Catalogo\AtualizacaoCatalogo.csv"/>
  </appSettings>
  <startup>
    <supportedRuntime version="v4.0"
                      sku=".NETFramework,Version=v4.5" />
  </startup>
</configuration>

Com as diferentes configura��es do projeto de testes j� definidas, chega o momento de se proceder com a implementa��o das classes que ser�o utilizadas por esta aplica��o.

A primeira dessas constru��es ser� o tipo est�tico ArquivoCatalogo (Listagem 3), o qual ser� respons�vel pela convers�o do conte�do do arquivo .csv contendo o cat�logo de produtos num objeto equivalente da classe DataTable (namespace System.Data).

Constam na classe ArquivoCatalogo as seguintes opera��es:

CreateDataTableCatalogo: m�todo privado usado na cria��o novas inst�ncias do tipo DataTable, seguindo para isto a estrutura de colunas esperada para tais refer�ncias (o que � feito atrav�s de chamadas � opera��o Add, a partir da propriedade Columns);
GetInformacoesCatalogo: a finalidade deste m�todo � retornar um objeto do tipo DataTable com todo o conte�do j� convertido de um arquivo .csv, sendo que este processo envolve ainda uma chamada � opera��o privada CreateDataTableCatalogo.

A opera��o GetInformacoesCatalogo faz ainda uso das seguintes classes:

ConfigurationManager (namespace System.Configuration): permite o acesso a elementos definidos num arquivo de configura��o (app.config), com isto acontecendo por meio da propriedade AppSettings;
StreamReader (namespace System.IO): uma inst�ncia deste tipo servir� de base para a leitura do arquivo .csv em que est�o as informa��es do cat�logo de produtos. A obten��o de cada linha existente em tal arquivo acontece invocando-se o m�todo ReadLine;
DataRow (namespace System.Data): representa um registro em um DataTable. As diferentes informa��es que formam uma linha do arquivo .csv s�o transformadas em um array (via m�todo Split da classe String), com o conte�do deste �ltimo sendo ent�o associado �s diferentes colunas previstas para o objeto DataRow.

Listagem 3: Classe ArquivoCatalogo


using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Data;
using System.IO;
using System.Configuration;

namespace TesteSqlBulkCopy
{
    public static class ArquivoCatalogo
    {
        private static DataTable CreateDataTableCatalogo()
        {
            DataTable dt = new DataTable();

            dt.Columns.Add(
                "Codigo", typeof(string));
            dt.Columns.Add(
                "Nome", typeof(string));
            dt.Columns.Add(
                "Categoria", typeof(string));
            dt.Columns.Add(
                "DtIniComerc", typeof(DateTime));
            dt.Columns.Add(
                "QtDisponivel", typeof(int));
            dt.Columns.Add(
                "PrecoSugerido", typeof(decimal));

            return dt;
        }

        public static DataTable GetInformacoesCatalogo()
        {
            DataTable dtProdutos = CreateDataTableCatalogo();

            using (StreamReader arquivo = new StreamReader(
                ConfigurationManager
                    .AppSettings["CaminhoArquivoCatalogo"]))
            {
                string linhaArquivo;
                string[] campos;
                DataRow registro;
                while (!arquivo.EndOfStream)
                {
                    linhaArquivo = arquivo.ReadLine();
                    campos = linhaArquivo.Split(
                        new string[] { ";" },
                        StringSplitOptions.None);
                    registro = dtProdutos.NewRow();
                    registro["Codigo"] = campos[0].Trim();
                    registro["Nome"] = campos[1].Trim();
                    registro["Categoria"] = campos[2].Trim();
                    registro["DtIniComerc"] =
                        Convert.ToDateTime(campos[3]);
                    registro["QtDisponivel"] =
                        Convert.ToInt32(campos[4]);
                    registro["PrecoSugerido"] =
                        Convert.ToDecimal(campos[5]);

                    dtProdutos.Rows.Add(registro);
                }
            }

            return dtProdutos;
        }
    }
}

Na Listagem 4 est� a defini��o da classe est�tica CatalogoBulkCopyHelper. Esta �ltima disponibiliza o m�todo CreateSqlBulkCopy, o qual recebe como par�metro uma conex�o do tipo SqlConnection (namespace System.Data.SqlClient). Como resultado de sua execu��o, a opera��o CreateSqlBulkCopy retornar� uma inst�ncia da classe SqlBulkCopy, objeto este devidamente configurado para a carga das informa��es do cat�logo.

Sobre a cria��o de uma refer�ncia da classe SqlBulkCopy a partir da opera��o CreateSqlBulkCopy, � poss�vel observar:

A inst�ncia do tipo SqlConnection fornecida a CreateSqlBulkCopy � repassada como par�metro ao construtor de SqlBulkCopy;
Na propriedade DestinationTableName � definido o nome da tabela de destino (neste caso, �dbo.TB_CARGA_CATALOGO�);
J� a propriedade ColumnMappings permite que se fa�a o mapeamento entre as colunas do DataTable com os dados de produtos e a tabela SQL Server correspondente, com isto acontecendo atrav�s de chamadas ao m�todo Add. A configura��o dessa forma deste tipo de relacionamento n�o � obrigat�ria em situa��es nas quais o nome das colunas de um objeto coincidir com a identifica��o dos campos da tabela considerada.

Listagem 4: Classe CatalogoBulkCopyHelper


using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Data.SqlClient;

namespace TesteSqlBulkCopy
{
    public static class CatalogoBulkCopyHelper
    {
        public static SqlBulkCopy CreateSqlBulkCopy(
            SqlConnection conexao)
        {
            SqlBulkCopy bc = new SqlBulkCopy(conexao);
            bc.DestinationTableName = "dbo.TB_CARGA_CATALOGO";

            bc.ColumnMappings.Add("Codigo", "CodigoBarras");
            bc.ColumnMappings.Add("Nome", "NomeProduto");
            bc.ColumnMappings.Add("Categoria", "Categoria");
            bc.ColumnMappings.Add("DtIniComerc",
                "DtIniComercializacao");
            bc.ColumnMappings.Add("QtDisponivel", "QtdDisponivel");
            bc.ColumnMappings.Add("PrecoSugerido", "VlSugerido");

            return bc;
        }
    }
}

Ser� por meio do m�todo ProcessarImportacao da classe CatalogoFacade (Listagem 5) que ocorrer� a leitura do arquivo AtualizacaoCatalogo.csv e, consequentemente, a carga dos dados deste �ltimo para a tabela TB_CARGA_CATALOGO.

O tipo CatalogoFacade pode ser considerado um exemplo de uso de um padr�o de projeto conhecido como Fa�ade. Atrav�s deste pattern um conjunto de a��es envolvendo diversos objetos pode ser encapsulado, de forma que estruturas que dependam de uma ou mais funcionalidades n�o precisem realizar uma s�rie de a��es complexas para produzir o efeito esperado.

Quanto � implementa��o da opera��o ProcessarImportacao, deve ser destacado:

Inicialmente � gerada uma inst�ncia do tipo SqlConnection, utilizando para isto a string de conex�o definida no arquivo app.config (via propriedade ConnectionStrings da classe ConfigurationManager);
Um objeto do tipo SqlCommand � ent�o criado, de forma a se executar uma instru��o que elimina prov�veis informa��es existentes na tabela TB_CARGA_CATALOGO. O comando �TRUNCATE TABLE� equivale, dentro do SQL Server, ao uso de uma instru��o DELETE sem a cl�usula WHERE; a �nica diferen�a neste caso est� no fato de que a execu��o de TRUNCATE al�m de dispor de uma melhor performance, n�o grava em log quais registros foram exclu�dos (o que evita portanto a aloca��o desnecess�ria de espa�o em alguns casos);
Com os registros de TB_CARGA_CATALOGO removidos, o processo de importa��o ser� finalizado com a carga dos dados presentes no arquivo .csv para esta tabela. Uma inst�ncia da SqlBulkCopy � criada e (empregando a classe CatalogoBulkCopyHelper), na sequ�ncia, aciona-se o m�todo WriteToServer (o qual recebe como par�metro o DataTable retornado pela opera��o GetInformacoesCatalogo de ArquivoCatalogo); esta a��o ser� respons�vel por transferir os dados que est�o vinculados ao DataTable para a tabela correspondente na base de testes.

Listagem 5: Classe CatalogoFacade


using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Data;
using System.Data.SqlClient;
using System.Configuration;

namespace TesteSqlBulkCopy
{
    public class CatalogoFacade
    {
        public void ProcessarImportacao()
        {
            using (SqlConnection conexao =
                new SqlConnection(ConfigurationManager
                    .ConnectionStrings["TesteSqlBulkCopy"]
                    .ConnectionString))
            {
                conexao.Open();

                SqlCommand cmd = conexao.CreateCommand();
                cmd.CommandText =
                    "TRUNCATE TABLE dbo.TB_CARGA_CATALOGO";
                cmd.ExecuteNonQuery();

                using (SqlBulkCopy bc =
                    CatalogoBulkCopyHelper.CreateSqlBulkCopy(conexao))
                {
                    bc.WriteToServer(
                        ArquivoCatalogo.GetInformacoesCatalogo());
                }
            }
        }
    }
}

Por fim, a Listagem 6 apresenta o c�digo referente � classe Program, com o m�todo Main sendo acionado ao se executar este projeto de testes.

Conforme pode ser observado, uma inst�ncia de CatalogoFacade � criada dentro do m�todo Main, invocando a partir disto o m�todo ProcessarImportacao. Com esta a��o ser� carregado o conte�do do arquivo .csv com informa��es do cat�logo de produtos e, na sequ�ncia, tais dados ser�o inseridos na base de dados de testes.

Listagem 6: Classe Program


using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;

namespace TesteSqlBulkCopy
{
    class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine(
                "Iniciando carga do cat�logo de produtos...");

            CatalogoFacade facade = new CatalogoFacade();
            facade.ProcessarImportacao();

            Console.WriteLine(
                "Processamento conclu�do com sucesso!");
            Console.ReadKey();
        }
    }
}

Executando a TesteSqlBulkCopy por meio do Visual Studio, ser� exibida uma tela como a que consta na Figura 4.

Figura 4: Carga dos dados j� efetuada atrav�s da aplica��o TesteSqlBulkCopy

Consultando a tabela TB_CARGA_CATALOGO dentro do SQL Server Management Studio, contata-se que os dados foram carregados corretamente nessa estrutura (Figura 5).

Figura 5: Consultando a tabela TB_CARGA_CATALOGO ap�s a execu��o da aplica��o TesteSqlBulkCopy

OBSERVA��O: a exclus�o de informa��es para a consequente carga de novos dados costuma ser um tipo de pr�tica bastante comum na manipula��o de arquivos. Isto se justifica pois, em muitas situa��es, os registros da tabela de destino n�o representam a vers�o definitiva: tais informa��es ser�o validadas e, posteriormente, transferidas para uma outra estrutura similar (atrav�s da execu��o de comandos de INSERT, UPDATE ou ainda, DELETE). Importante destacar que todo este processo n�o foi detalhado aqui por quest�es de simplifica��o.

Conclus�o

Procurei com este artigo demonstrar uma maneira simples, por�m bastante eficiente para a carga de centenas (ou at� milhares) de registros em aplica��es .NET que dependam de bancos de dados no SQL Server. O uso da classe SqlBulkCopy n�o substitui outros recursos para execu��o de instru��es SQL como objetos Command do ADO.NET, LINQ to SQL e at� o Entity Framework. Na verdade, a utiliza��o de tais mecanismos � mais adequada em situa��es que envolvam o processamento de transa��es a partir de telas de cadastro de informa��es (e que, portanto, envolvem a execu��o de poucos comandos SQL).

Espero que o conte�do aqui abordado possa ser �til no seu dia-a-dia. At� uma pr�xima oportunidade!

30% OFF

NO PLANO PRIME

QUERO SER PRIME

// EXCLUSIVO DO PRIME

MENTORIAS

INDIVIDUAIS

Tenha acompanhamento individual para tirar d�vidas, receber feedback nos seus projetos e evoluir sem ficar travado nos estudos.

+ TUDO DO START:

Forma��es completas

+40 Projetos

+5000 exerc�cios