A importância do planejamento e prevenção contra eventuais falhas

Natal DevMedia: Assine hoje e ganhe 3 meses gr�tis

Recentemente ocorreram dois eventos que chamaram a aten��o nos notici�rios e foram veiculados em todos os grandes meios de comunica��o nacionais e internacionais.

Coincidentemente, ambos ocorreram no Brasil e no setor a�reo mais especificamente.

Embora problemas no setor a�reo, telecomunica��es e banc�rio n�o sejam novidade para o brasileiro, pois o que deveria ser exce��o � habitual, desta vez as falhas tomaram grandes propor��es.

A primeira foi no aeroporto de Viracopos, onde um avi�o cargueiro quebrou no procedimento de aterrissagem e bloqueou a pista para os demais avi�es.

Alguns links sobre essa noticia:

A outra falha foi no sistema utilizado pela TAM para realizar seus procedimentos de check-in, o que prejudicou n�o s� os clientes da empresa no Brasil como tamb�m em todos os aeroportos onde ela opera.

Alguns links sobre isso:

Depois do ocorrido, tanto o Procon como a ANAC desejam apurar o ocorrido e verificar se foram tomadas as atitudes cab�veis para o caso:

Independente do que seja decidido pelo Procon ou pela ANAC, ficou muito claro que nas duas situa��es n�o existe um plano de gest�o da crise, um sistema de contingenciamento, um plano pensado previamente sobre quais procedimentos adotar caso um cen�rio onde algo que fa�a parte ou seja essencial para o funcionamento normal falhe ou deixe de existir.

As a��es adotadas aparentemente foram tomadas no correr da situa��o tentando minimizar o ocorrido, n�o ficou aparente em nenhum momento que houvesse um procedimento a seguir nessa situa��o.

Figura 1: Como se preparar para poss�veis falhas do sistema?

Isso tudo nos leva a pensar em quantas empresas ou pessoas est�o preparadas ou possuem um manual de procedimentos, um sistema alternativo para quando situa��es de crise ou falha se apresentam e o quanto isso reflete diretamente nos neg�cios da empresa.

Em sistemas web, sejam sites institucionais, p�ginas pessoais, e-commerces, etc, a inten��o ao cri�-los � deix�-los dispon�veis 24h por dia, todos os dias da semana, o ano todo, correto?

Mas e se ele por algum motivo ficar fora do ar?

Ou se tiver o acesso ao banco de dados da aplica��o comprometido ou indispon�vel?

E se sofrer um ataque de nega��o de servi�o, XSS, etc.?

Voc� est� preparado para algum desses cen�rios?

J� pensou o que poder� ser feito caso isso aconte�a?

Enquanto a falha persistir, o quanto isso impactar� nos neg�cios da empresa?

E os eventuais preju�zos e problemas na imagem da empresa?

Para cada tipo ou tamanho de site ou necessidade de quem o possui, as falhas citadas acima podem n�o ter nenhum impacto se durarem alguns dias ou horas, mas existem tamb�m aqueles n�o podem ficar nenhum minuto indispon�vel, pois o cerne do neg�cio reside na aplica��o estar sempre dispon�vel.

E a necessidade em estar sempre dispon�vel n�o � algo que somente m�dios e grandes t�m, o pequenino tamb�m pode ter, pois se o potencial cliente vai at� ele e est� indispon�vel, o cliente vai para o concorrente e n�o volta mais, deixando assim de vender e quem sabe ter um cliente que efetue compras com certa regularidade nele.

Por isso, n�o se pode pensar que planos de contingencia � algo que apenas grandes empresas devem ter ou algo do tipo.

Planos de contingencia e gest�o de crise � algo que deve ser feito de acordo com as necessidades de cada empresa ou cliente.

Afinal, essa empresa ou cliente, comprou um software, ou contratou os servi�os do desenvolvedor para ter um sistema de gest�o, web site o que for, para desta forma, poder gerenciar melhor seu neg�cio, melhorar o atendimento a seus clientes e assim, se destacar da concorr�ncia em algum aspecto.

� incr�vel uma empresa do porte da TAM n�o ter um sistema alternativo para realizar os procedimentos de check-in caso o principal falhasse, obrigando seus funcion�rios a realiz�-lo manualmente.

O atraso e a insatisfa��o que isso gerou, j� � por si s� argumento mais do que suficiente para seu departamento de TI ter um sistema alternativo que opere enquanto o principal estivesse indispon�vel e atualiza-se o principal para manter assim os registros de forma correta para a gera��o de relat�rios e estat�sticas.

Como desenvolvedores, sabemos que � poss�vel fazer isso, seja por meio de API'S ou pelo envio dos dados diretamente ao banco de dados no formato correto que ele armazena.

Se a empresa busca por excel�ncia nas atividades e minimizar ao m�ximo eventuais preju�zos, se faz obrigat�rio pensar sempre no �e se...�.

Atualmente, com os sistemas de gest�o sendo portados para nuvem ou desenvolvidos para operarem em diversas filiais, ou funcionando a partir do web site, n�o temos o controle total de todo o seu funcionamento, como era at� o inicio da d�cada passada, onde estava tudo no mesmo pr�dio da empresa ou algo do tipo, na maioria das empresas.

Nos dias de hoje, delegou-se muitas coisas a empresas terceirizadas seja por n�o ser o foco principal da empresa, seja por redu��o de custos e dessa forma, as eventuais falhas se tornam mais evidentes e passam a ter um peso maior quando ocorrem.

Vamos supor que a empresa (n�o importa o tamanho) contratou um sistema de gest�o on-line para gerenciar melhor todo o neg�cio, por diversas raz�es (mobilidade, redu��o de custos etc.).

Para essa empresa, ela precisar� ter ao menos uma segunda forma de acessar a web caso a principal falhe.

E quem comercializa esse sistema? O que precisar� ter?

Ele precisar� ter a garantia que o servi�o que hospeda esse sistema tenha um uptime elevado, normalmente as grandes hospedagens garantem uptime de 99,99%.

E se optar por montar a estrutura de servidores localmente?

Ser� preciso garantir o mesmo uptime, garantindo que o fornecimento de energia n�o falte, bem como n�o fique sem acesso � internet.

Para isso, precisar� investir em geradores, no-breaks, link dedicado, link alternativo via radio ou 3g, m�quinas reservas, hd's reservas, etc.

Politica de backup dos dados numa frequ�ncia que em caso de perda dos dados, a restaura��o n�o seja muito distante do dia em que a falha ocorreu.

Algumas empresas realizam backups di�rios, outras a cada certo n�mero de horas, depende da empresa e dos clientes que ela atende.

Redund�ncia dos dados, possuir apenas um banco de dados pode ser satisfat�rio para a maioria das empresas, mas se o servidor de banco de dados ficar indispon�vel, as opera��es deixar�o de ser realizadas e para impedir que a falha no acesso ao banco de dados comprometa as opera��es da empresa, ter um banco de dados espelho alocado num endere�o diferente do principal � importante e permite que a empresa n�o paralise seu funcionamento.

Servidores web bem configurados, muitos dos ataques feitos a sites, sejam ataques XSS, DoS e outros, ocorrem por causa de servidores web mal configurados ou que n�o est�o com seus patches atualizados.

Servidores de proxy reverso e outras t�cnicas ajudam tamb�m a reduzir significativamente a ocorr�ncia de falhas, pois impedem o acesso direto ao servidor que abriga o sistema.

Assim como o servidor-espelho de banco de dados, um servidor-espelho da aplica��o � tamb�m importante para manter o sistema funcionando sem falhas mesmo que o servidor principal fique indispon�vel.

E se considerarmos que os custos de hospedagem est�o cada vez menores, a pol�tica de possuir espelhos se torna vi�vel a um numero cada vez maior de empresas independente de seu tamanho.

Embora tudo isso pare�a �bvio, (e realmente �!) � em casos como os citados acima que percebemos isso sendo deixado de lado por raz�es nem sempre claras, afinal negligenciar algo que ao falhar impactar� negativamente na fonte de receitas da empresa, � no m�nimo uma contradi��o com o objetivo principal de qualquer empresa que � o lucro. � na verdade, est�pido.

Em nome da redu��o de custos, n�o pensar em conting�ncias para cen�rios de crise, e assim preferir acreditar que por raz�es esot�ricas nunca falhar�, ou algo do tipo, � como pensar que ter o pneu estepe no carro s� serve para carregar um peso desnecess�rio, pois � muito raro o pneu do carro furar.

Mas e quando falhar?

Voc� estar� preparado para resolver rapidamente ou vai amargar preju�zos n�o s� financeiros como tamb�m de reputa��o para a empresa?

N�s desenvolvedores, normalmente programamos pensando nos requisitos do cliente, e na forma como esperamos que o usu�rio se comporte utilizando aquele sistema.

Como n�o sabemos exatamente a forma que o usu�rio se comportar� no sistema, colocamos filtros e tentamos isolar qualquer comportamento inesperado, para se caso ocorrer, n�o afetar o seu funcionamento, apenas exiba uma mensagem de erro ou que ignore tal a��o.

Raramente pensamos nas possibilidades de falhas ocorrerem por faltar alguma parte essencial do sistema, ou como o sistema dever� se comportar caso o banco de dados n�o exista.

Precisamos pensar nisso tamb�m, se o banco de dados n�o existir, usaremos um alternativo?

Armazenaremos tudo num arquivo de texto?

E se o acesso � base remota ficar indispon�vel, como o sistema se comportar�?

E no caso da m�quina demorar muito tempo para responder as solicita��es ou sofrer alguma avaria?

� preciso pensar n�o s� em falhas l�gicas, como tamb�m nas f�sicas, afinal, tudo pode apresentar defeito em algum momento, e geralmente os defeitos surgem nos momentos que em o sistema mais � solicitado, tal como datas especiais, eventos sazonais onde o pico de trabalho aumenta muito e ficamos extremamente dependentes de que o sistema n�o falhe.

Temos de pensar al�m do habitual ou do ambiente ideal de funcionamento. Se faz necess�rio cada dia mais pensar fora da zona de conforto da aplica��o, para assim cobrirmos uma gama maior de possibilidades onde a falha pode surgir e como agir em cada um desses cen�rios para que a crise n�o tome propor��es tais que comprometa n�o s� a imagem da empresa, mas tamb�m seu maior ativo que � o cliente satisfeito com os servi�os dessa empresa.

At� a pr�xima!