Introdu��o ao Amazon Web Services

Fique por dentro

Este artigo tem como objetivo apresentar os principais serviços de cloud computing oferecidos pela Amazon, e ilustrar casos onde seu uso pode ser �til em um projeto de infraestrutura.

A Amazon � o principal player de cloud computing do mercado e, portanto � fundamental para todos os interessados no assunto conhecer sua oferta de serviços.

A maioria dos leitores provavelmente j� ouviu falar na Amazon. O neg�cio que começou com a venda de livros em 1994, hoje � considerado a maior loja online do mundo, com mais de 100 mil funcion�rios e faturamento de mais de 60 bilh�es de d�lares em 2012.

Para um neg�cio desse porte funcionar, foi preciso a criaç�o de uma infraestrutura de TI colossal, com literalmente milhares de servidores distribu�dos em v�rios datacenters pelo mundo.

Com essa quantidade de servidores, s� existem duas alternativas para uma administraç�o eficiente: contratar um ex�rcito de t�cnicos, ou automatizar o quanto for poss�vel.

A Amazon escolheu o segundo caminho, e ap�s muito trabalho de pesquisa e desenvolvimento, onde foram criadas soluç�es para diversos problemas comuns de infraestrutura, eles perceberam que poderia ser um neg�cio interessante a venda de recursos computacionais utilizando a pr�pria infraestrutura.

At� a�, n�o parece diferente do que os provedores tradicionais faziam com serviços de hospedagem, por exemplo. A grande diferença � que na Amazon, s� se paga pelo uso do serviço, ou seja, se voc� possui um site que tem picos de acesso em determinadas �pocas, voc� pode provisionar recursos adicionais por um per�odo, e simplesmente deixar de us�-los quando n�o forem mais necess�rios.

Isso � uma grande mudança de paradigma: hoje, quando falamos do modelo tradicional, onde a empresa � dona de um parque de servidores dentro do datacenter, quando houver a necessidade de aumento de capacidade, provavelmente ser� necess�rio investir em equipamentos, seja servidor, storage ou rede.

A� começam os problemas: a empresa pode ter determinados equipamentos que foram descontinuados e que agora possuem um custo de expans�o maior do que o custo de equipamentos novos.Ao comprar novos equipamentos,� preciso decidir se vale a pena manter os antigos em uso, ao lado dos novos, ou se � melhor migrar tudo para os novos equipamentos, o que envolve projetos de migraç�o complexos.

A virtualizaç�o ajuda a minimizar muitos desses problemas, mas ainda est� sujeita a alguns, como por exemplo, o caso do pico sazonal. Quando h� a necessidade de se suportar uma demanda alta e inesperada com uma infraestrutura interna, provavelmente ser� necess�rio ter uma infraestrutura dimensionada �por cima�, ou seja, com uma grande capacidade de processamento, que ser� utilizada poucas vezes por ano.

O Amazon Web Services (daqui para frente, chamado apenas de AWS), fornece uma alternativa interessante para esses problemas.� como se tiv�ssemos � nossa disposiç�o uma infraestrutura �infinita�, em que podemos alocar recursos quando necess�rio, de forma r�pida e relativamente barata.

Para alguns tipos de empresa, como bancos, existem quest�es quanto � segurança e interoperabilidade dos serviços em nuvem que com o tempo precisam ser esclarecidas. Por exemplo, no Brasil existem leis que pro�bem o armazenamento de dados fora do pa�s.

No entanto, com o modelo de operaç�o atual oferecido pelos provedores de cloud computing, n�o � poss�vel garantir que dados de empresas brasileiras n�o ser�o replicados para servidores em outros pa�ses. Para empresas cujo neg�cio est� baseado na web, a ader�ncia � muito mais �bvia. O maior exemplo disso foi a migraç�o da Netflix, um dos maiores provedores de conte�do ondemand do mundo, para o AWS em 2011.

O AWS oferece diversos serviços, desde a infraestrutura at� bancos de dados e enfileiramento de mensagens. Veremos neste artigo os principais serviços relacionados � infraestrutura (IaaS � Infrastructure as a Service), e em alguns casosprocuraremos mostrar casos de uso de cada tecnologia.

Regi�es e zonas de disponibilidade

O AWS est� distribu�do em datacenters presentes em v�rias localidades no mundo. Esses datacenters s�o chamados pela Amazon de regi�es. Para aprimorar a disponibilidade, dentro de cada regi�o existem ao menos duas zonas de disponibilidade, que s�o infraestruturas completamente independentes com links de baixa lat�ncia entre elas para garantir uma comunicaç�o eficiente.

Atualmente as regi�es da Amazon s�o as seguintes, com as respectivas quantidades de zonas de disponibilidade:

US East: Virginia (tr�s zonas de disponibilidade);
US West: Oregon (tr�s zonas de disponibilidade);
US West: Calif�rnia (duas zonas de disponibilidade);
S�o Paulo (duas zonas de disponibilidade);
Europa: Irlanda (tr�s zonas de disponibilidade);
�sia e Pac�fico: T�quio (tr�s zonas de disponibilidade);
�sia e Pac�fico: Cingapura (duas zonas de disponibilidade);
�sia e Pac�fico: Sydney (duas zonas de disponibilidade).

Como um diferencial, muitos serviços possuem replicaç�o de dados transparente entre zonas de disponibilidade, para garantir a conting�ncia em caso de falhas. Al�m deste recurso, a replicaç�o de dados entre regi�es tamb�m � poss�vel, mas deve ser implementada caso a caso.

Assim, ao desenharmos uma arquitetura para funcionar sobre o AWS, devemos levar em conta as regi�es e zonas de disponibilidade para garantir a conting�ncia da aplicaç�o, evitando que falhas no AWS causem impacto para a aplicaç�o.

Diante desse cen�rio, j� ocorreram grandes falhas em regi�es isoladas do AWS que causaram indisponibilidade para grandes clientes como Sony e Netflix. Estatisticamente, ao considerarmos a infraestrutura apresentada, a probabilidade de todas as zonas de disponibilidade de uma regi�o falharem ao mesmo tempo � muito pequena, e a probabilidade de todas as regi�es falharem � menor ainda.

Se desenharmos nossa arquitetura com isso em mente, o que teremos � uma infraestrutura com um n�vel de resili�ncia alt�ssimo, ao custo de alguns milhares de d�lares, e que custaria muito mais se implementada de forma tradicional, com servidores instalados on-premises.

Sendo assim, � preciso analisar cada caso de forma independente, mas de modo geral, o custo das soluç�es no AWS � bastante atrativo.

Simple Storage Service � S3

O S3 foi o primeiro serviço do AWS, tendo sido lançado em 2006. Ele fornece um sistema de armazenamento online bastante simples, onde os arquivos s�o acessados via HTTP, web services (REST ou SOAP) ou protocolo BitTorrent. No S3, o armazenamento � feito em buckets (containers de arquivos), e cada bucket possui uma s�rie de funcionalidades, que listamos a seguir:

Permissions: Cada bucket possui um controle individual de permiss�es (leitura, upload e remoç�o de arquivos, visualizaç�o e ediç�o de permiss�es) que podem ser concedidas a todos ou apenas a usu�rios autenticados no AWS;
Static Web Hosting: � poss�vel publicar um web site est�tico utilizando o S3. Basta habilitar a opç�o e indicar qual o documento �index� do web site, que o S3 passa a servir este conte�do;
Logging: Pode ser habilitado o log de acesso aos seus objetos no S3, para efeito de estat�sticas e auditoria;
Lifecycle: Define regras de expiraç�o e arquivamento de objetos dentro do bucket. � poss�vel configurar pol�ticas baseadas em data para remover os objetos do S3, ou ainda mov�-los para o Glacier, que � o serviço de arquivamento, que veremos mais adiante;
Requester Pays: � um modelo onde o custo de transfer�ncia de dados � cobrado do usu�rio que est� solicitando o objeto. Nesse modelo, o acesso p�blico e an�nimo ao bucket � desabilitado;
Versioning: Este recurso permite o versionamento de objetos dentro de um bucket. � �til para arquivos cujo hist�rico de alteraç�es precisa ser guardado.

O S3 tipicamente � utilizado para hospedagem de arquivos que ser�o acessados diretamente pela web, como imagens e p�ginas web est�ticas, mas pode ser utilizado tamb�m como reposit�rio de arquivos de backup de inst�ncias e imagens do EC2.

Elastic Compute Cloud � EC2

O EC2 � o serviço de virtualizaç�o de servidores do AWS, onde � poss�vel criar servidores virtuais (chamados de inst�ncias, na terminologia da Amazon) com diversas opç�es de tamanho e sistema operacional.

A Amazon classifica o tamanhodas inst�ncias oferecidas atrav�s da m�trica chamada de ECU � Elastic Compute Unit. Uma ECU equivale � capacidade de um processador Xeon ou Opteron de 1.0 GHz de 2007. Conforme os servidores f�sicos da Amazon s�o atualizados e passam a utilizar processadores de maior capacidade, a oferta das inst�ncias muda e o n�mero de ECUs de um determinado tipo de inst�ncia muda tamb�m. Nesse ponto vale destacar que a informaç�o de tamanho de um tipo de inst�ncia � descrita pelo n�mero total de ECUs.

A seguir podemos ver os principais tipos de inst�ncia dispon�veis no AWS equal a indicaç�o de uso para cada um deles:

M1 e M3 - Inst�ncias de uso geral: Tipo de inst�ncia gen�rica, que possui uma distribuiç�o dos recursos equilibrada entre CPU, mem�ria e I/O;
C1, CC2 e C3 � Otimizadas para CPU: Tipo de inst�ncia indicada para aplicaç�es que possuem grande demanda de CPU, como servidores de encoding de v�deo;
G2 e CG1 � Inst�ncias com GPU: Tipo de inst�ncia que permite o acesso a recursos da placa gr�fica para processamento, o que � muito utilizado em aplicaç�es cient�ficas que necessitam de alto desempenho;
M2 e CR1 � Otimizadas para Mem�ria: Tipo de inst�ncia que possui grandes quantidades de mem�ria, o que � ideal para servidores de banco de dados e de cache;
HI1 e HS1 � Otimizadas para Storage: Tipo de inst�ncia que � otimizada para aplicaç�es que possuem demanda por grandes volumes de I/O. Tamb�m possui grande capacidade de processamento e mem�ria, o que a torna indicada para uso em servidores de banco de dados de alto volume;
T1 �Inst�ncias Micro: Tipo de inst�ncia m�nima, ideal para testes e sites com pouco acesso.

Na Tabela 1 podemos ver a relaç�o entre os tipos de inst�ncia e os tamanhos oferecidos.

Tabela 1. Tamanhos das inst�ncias dispon�veis no EC2.

Tipo de Inst�ncia	Tamanho	vCPU	ECU	Mem�ria (GB)
Uso Geral	m3.xlarge	4	13	15
Uso Geral	m3.2xlarge	8	26	30
Uso Geral	m1.small	11	1	1.7
Uso Geral	m1.medium	1	2	3.75
Uso Geral	m1.large	2	4	7.5
Uso Geral	m1.xlarge	4	8	15
Otimizadas para CPU	c3.large	2	7	3.75
Otimizadas para CPU	c3.xlarge	4	14	7
Otimizadas para CPU	c3.2xlarge	8	28	15
Otimizadas para CPU	c3.4xlarge	16	55	30
Otimizadas para CPU	c3.8xlarge	32	108	60
Otimizadas para CPU	c1.medium	2	5	1.7
Otimizadas para CPU	c1.xlarge	8	20	7
Otimizadas para CPU	cc2.8xlarge	32	88	60.5
Inst�ncias com GPU	g2.2xlarge	8	26	15
Inst�ncias com GPU	cg1.4xlarge	16	33.5	22.5
Otimizadas para Mem�ria	m2.xlarge	2	6.5	17.1
Otimizadas para Mem�ria	m2.2xlarge	4	13	34.2
Otimizadas para Mem�ria	m2.4xlarge	8	26	68.4
Otimizadas para Mem�ria	cr1.8xlarge	32	88	244
Otimizadas para Storage	hi1.4xlarge	16	35	60.5
Otimizadas para Storage	hs1.8xlarge	16	35	117
Inst�ncias Micro	t1.micro	1	At� 2	0.615

Vejamos os principais recursos oferecidos pelo EC2:

Instances: � onde criamos as m�quinas virtuais, chamadas de inst�ncias na terminologia do EC2. Na seç�o Links, mais precisamente no endereço relacionado a�Amazon EC2 Instance Details�, podemos ver todos os tipos de inst�ncia dispon�veis e as suas diferentes configuraç�es;
AMIs: AMI significa Amazon Machine Image.S�o imagens de sistema operacional prontas para serem executadas, com software pr�-instalado. � poss�vel escolher dentre centenas de imagens existentes (por exemplo, com Linux, Apache e MySQL instalados), ou começar com uma imagem de sistema operacional b�sica, instalar o software desejado e criar a sua pr�pria AMI para uso futuro;
Security Groups:S�o as �regras de firewall� que controlam o acesso �s suas inst�ncias do EC2. Atrav�s do security group � poss�vel controlar de forma granular o acesso a endereços IP e portas, externos ou internos;
Elastic IPs:S�o endereços IP p�blicos que podem ser atribu�dos a qualquer inst�ncia EC2;
Load Balancers:� poss�vel criar balanceadores de carga para distribuir os acessos entre os seus servidores web, por exemplo. Os balanceadores de carga ainda possuem a funcionalidade de detectar servidores que n�o est�o respondendo, e coloc�-los fora de serviço, de modo a n�o causarem problemas na sua aplicaç�o;
Auto Scaling Groups:Para compreender esse recurso, imaginemos o seguinte cen�rio: nosso site de e-commerce possui enormes picos de tr�fego em datas comemorativas, como dia das m�es, dos pais, Natal, etc., mas durante o resto do ano o tr�fego � razoavelmente est�vel.

Em uma infraestrutura tradicional, o ambiente seria dimensionado pelo pico, ou seja, para suportar a maior quantidade poss�vel de acessos prevista. Isso faz com que paguemos o ano inteiro por uma infraestrutura que s� � utilizada algumas vezes por ano.O auto scaling serve para racionalizar o uso da infraestrutura.

Ele monitora o consumo de recursos dos seus servidores, e baseado em pol�ticas, pode adicionar ou remover servidores do grupo para atender a demanda.

Ou seja, no caso de um pico de tr�fego, o auto scaling pode aumentar a capacidade de 2 para 10 servidores, e quando o pico passar, eliminar os servidores adicionais e deixar somente os dois que existiam antes. Dessa forma, somente pagamos pelo utilizado;

Volumes e Snapshots: Dentro do EC2 existe um produto chamado EBS � Elastic Block Storage, que implementa funcionalidades de storage para inst�ncias EC2. Nele podemos criar discos, chamados de volumes, e snapshots desses volumes, com o objetivo de extrair uma c�pia dos dados.

Os volumes podem ter at� 1 TB de tamanho, e podem ser do tipo Standard, ou do tipo Provisioned IOPS, onde se paga um pouco mais caro para garantir um throughput previs�vel. Um volume EBS � replicado dentro de uma mesma Zona de Disponibilidade para garantir a conting�ncia quanto a falhas de hardware.

Com todos os recursos citados, � poss�vel implementar soluç�es completas de infraestrutura de servidor na nuvem, tanto para uso em aplicaç�es p�blicas, como sites de e-commerce, como para aplicaç�es internas e privadas. Com os v�rios tamanhos de inst�ncia dispon�veis, � poss�vel hospedar serviços diversos como e-mail, banco de dados, servidores web, entre outros.

Al�m disso, existem casos de empresas que utilizam o AWS para a criaç�o de supercomputadores, empregando tecnologias de clustering sobre centenas de inst�ncias EC2. Essa � uma estrat�gia que proporcionou grande economia para estas empresas, que tradicionalmente investiam milh�es de d�lares na construç�o de supercomputadores.

Virtual Private Cloud � VPC

VPC � o serviço que possibilita a configuraç�o de uma rede privada no AWS. Dentro de uma rede privada � poss�vel ter todos os recursos do EC2, como inst�ncias e balanceadores, bem como montar sub-redes separadas, com endereços IP privados, e rotear entre elas.

� um serviço bastante �til para manter organizado o ambiente em nuvem quando a soluç�o começa a depender de v�rios componentes, como servidores de aplicaç�o, banco de dados, balanceadores de carga, etc.

Al�m disso, a rede privada � interessante do ponto de vista da segurança, porque com uma VPC as nossas inst�ncias EC2 n�o precisam de endereço IP p�blico para serem acessadas.

� poss�vel ainda criar uma VPN entre sua empresa e uma VPC no AWS para ter o seu ambiente na nuvem p�blica, mas com acesso totalmente isolado.A seguir podemos ver as principais configuraç�es oferecidas pelo serviço de VPC:

VPCs:Uma VPC simplesmente define o bloco de endereçamento IP cont�guoque ser� utilizado no seu ambiente, como 10.0.0.0/16. Para ser utilizado por inst�ncias EC2, por exemplo, esse bloco deve ser dividido em subnets, que devem possuir um endereçamento que faça parte do bloco definido na VPC. Al�m disso, quando desejamos ter ambientes totalmente isolados e com uma pol�tica de acesso diferenciada, podemos criar mais de uma VPC;
Subnets:Uma subnet � uma partiç�o do bloco de endereçamento IP configurado na VPC. Dentro de uma VPC deve existir ao menos uma subnet, para que componentes do AWS, como inst�ncias EC2, possam se conectar. No entanto, podem ser criadas quantas subnets forem suportadas pelo bloco de endereçamento IP;
Route Tables:� poss�vel configurar rotas est�ticas entre as subnets, para habilitar a comunicaç�o entre inst�ncias que est�o em subnets diferentes;
VPN Connections: � poss�vel configurar conex�es VPN do seu escrit�rio ou datacenter para uma VPC no AWS. Para isso � utilizado um Customer Gateway, que representa o gateway VPN do lado do datacenter, e um Virtual Private Gateway, que representa o gateway VPN do lado do AWS.

Glacier

O Glacier � o serviço de storage off-line do AWS. � um serviço de baix�ssimo custo (1 centavo de d�lar por GB) direcionado para o armazenamento de grandes volumes de dados e que s�o muito pouco acessados, como soluç�es de backup hist�rico e backup off-site. Os dados copiados para o Glacier s�o automaticamente replicados dentro da infraestrutura do AWS, com o objetivo de garantir m�xima durabilidade.

O baixo custo de armazenamento tem uma contrapartida de custo no acesso aos dados. Deste modo, se o cliente acessar em um m�s mais do que 5% da m�dia hist�rica do volume armazenado mensalmente, essa transfer�ncia � cobrada. � a forma utilizada pela Amazon para garantir que o acesso seja infrequente. Se precisamos de acesso frequente, o S3 e o EBSs�o produtos mais apropriados.

Relational Database Services � RDS

O RDS � o serviço de banco de dados relacional do AWS. Atrav�s dele podemos criar inst�ncias de banco de dados MySQL, Microsoft SQL Server, Oracle ou PostgreSQL. O RDS cria servidores virtuais com o DBMS desejado de acordo com os par�metros especificados pelo usu�rio. Para bancos de dados que necessitam de alto desempenho de I/O, � poss�vel utilizar a opç�o de Provisioned IOPS, que garante uma quantidade de IOPS (operaç�es de I/O por segundo) m�nima e previs�vel.

Uma opç�o que o RDS oferece � a possibilidade de criarmos inst�ncias de conting�ncia, utilizando a feature Multi-AZ, que indica que a inst�ncia ser� replicada automaticamente para outra inst�ncia que est� em uma zona de disponibilidade diferente, e o AWS far� o failover para esta inst�ncia caso uma falha seja detectada. Essa funcionalidade est� dispon�vel para todos os DBMSs, exceto para o MS SQL Server. No caso do MySQL, podem ser criadas r�plicas somente para leitura, que s�o �teis no caso de aplicaç�es web de alto tr�fego.

A seguir s�o apresentadas as principais funcionalidades do RDS:

Instances:Uma inst�ncia RDS representa um �nico bancode dados de um DBMS particular. Um banco de dados no RDS funciona da mesma forma que um banco de dados instalado em um servidor local, com a diferença que n�o temos acesso ao console do servidor onde o banco de dados est� hospedado;
Snapshots:Snapshots s�o como �fotografias� do seu banco de dados em um determinado momento no tempo. S�o �teis como estrat�gia de backup e para congelar uma vers�o do banco de dados antes de uma mudança em produç�o, por exemplo;
Parameter Groups:Com Parameter Groups � poss�veldefinirvalorescustomizados para os par�metros de cada DBMS, que podem ser aplicados a todas as inst�ncias que forem criadas. � um excelente recurso para garantir a padronizaç�o na configuraç�o de inst�ncias;
Option Groups:Option Groups fornecem um mecanismo de controle de funcionalidades adicionais e particulares de cada DBMS. Por exemplo, para o MySQL � poss�vel habilitar a funcionalidade de memcache, para o Oracle � poss�vel habilitar a funcionalidade do Statspack, entre outras.

Custos

Todos os produtos do AWS possuem pol�ticas de preço bastante detalhadas e com farta documentaç�o no site. � importante estudar a forma de cobrança de cada produtoantes da contrataç�o para evitar sustos na hora da conta. � muito comum provisionarmos mais recursos do que precisamos porque todos os serviços est�o a um clique de dist�ncia, de forma muito simples. Outro ponto importante � que existem duas formas de contrataç�o para a maioria dos recursos: on-demand e reservado.

No caso do EC2, por exemplo, inst�ncias on-demand s�o aquelas que n�s criamos e removemos a qualquer momento. Nesse caso pagamos um valor por hora, pelo total de horas em que a inst�ncia esteve ligada.

No caso de demandas de prazo mais longo, a Amazon oferece descontos bastante atrativos para clientes que querem se comprometer a manter um contrato por per�odos de 1 ou 3 anos.

Deste modo, ao pagarmos um valor por inst�ncia no momento do contrato, o valor pago por hora cai para menos da metade do valor de inst�ncias on-demand, em alguns casos.

A recomendaç�o geral � que, da mesma forma que n�o se deve investir em hardware ou datacenter sem planejamento, n�o se deve faz�-lo com recursos na nuvem. O planejamento antecipado pode maximizar enormemente a economia que pode ser conseguida ao se optar por contratar infraestrutura na nuvem.

Neste artigo foram apresentados os principais serviços de cloud computing fornecidos pela Amazon e foram mostrados alguns casos de uso. Al�m desses, existem v�rios outros serviços, mais focados em aplicaç�o, que omitimos aqui por quest�es de brevidade.

Sendo assim, sugerimos que o leitor visite o site do AWS e explore os produtos, para entender em profundidade do que a plataforma � capaz. Al�m do site, vale mencionar que todos os manuais dos produtos do AWS est�o dispon�veis na loja do Kindle (leitor de livros digitais da Amazon) sem custo. A documentaç�o � bastante completa e certamente ajudar� a esclarecer os detalhes de cada produto.

Para os que gostam de programar, vale mencionar que existem bibliotecas para as linguagens de programaç�o mais populares, como Java, C# e Python, por exemplo, que permitem a automaç�o de todos os aspectos de todos os produtos do AWS. Esse � um recurso extremamente interessante, que possibilita a construç�o de ferramentas de gerenciamento e automaç�o bastante poderosas, e que facilitam a vida no dia-a-dia.

Apesar de o artigo ser totalmente baseado no AWS, que por ter sido o pioneiro, ainda � a refer�ncia no mercado quando se fala de nuvem p�blica, vale mencionar que existem outras ofertas no mercado, sendo o Windows Azure, da Microsoft, e o Compute Engine, da Google, as mais conhecidas.

Com base no que falamos, � importante conhec�-los para poder avaliar qual � oserviço mais adequado para cada situaç�o, e o mais importante, para que comparemos os valores e vejamos qual oferece o melhor custo benef�cio. Com a tend�ncia da popularizaç�o do uso da nuvem p�blica, espera-se que a concorr�ncia se torne cada vez mais acirrada, e com isso podemos esperar uma oferta de serviços de qualidade cada vez melhor e com menor custo.

Links

Site do Amazon Web Services
Site de preços do EC2
Site com os detalhes dos tipos de inst�ncia do EC2
Site de preços do S3
Site de preços do RDS
Site de preços do Glacier
Site com exemplos de uso do AWS em substituiç�o a supercomputadores
Case de migraç�o para AWS da Netflix
Site do Windows Azure
Site do Google Compute Engine