Do que se trata o artigo:

O artigo trata do gerenciamento de alta disponibilidade de serviços. No artigo são descritos os principais objetivos associados à alta disponibilidade, bem como os controles e métricas para atingir tais objetivos. Em seguida, associam-se os cinco estágios do ciclo de vida dos serviços propostos pelo ITIL aos objetivos associados à alta disponibilidade.

Em que situação o tema útil:

O tema é de suma importância aos analistas de infraestrutura que desejam incorporar os conceitos de alta disponibilidade aos serviços prestados pela instituição a que pertencem. O artigo indica algumas métricas que devem ser observadas por esses analistas para acompanhar e certificar que seus serviços atendem aos critérios de alta disponibilidade.

Resumo DevMan:

O artigo aborda o conceito de gerenciamento de alta disponibilidade, incluindo os objetivos e controles associados a este gerenciamento. Além disso, apresentam-se as principais métricas a serem observadas para garantir serviços com alta disponibilidade. Por fim, estabelece-se uma relação entre o ciclo de vida dos serviços descrito pelo Information Technology Infrastructure Library e os objetivos da alta disponibilidade.

O artigo anterior abordou os conceitos de Alta Disponibilidade (High Availability – HA) e Recuperação de Desastres (Disaster Recovery – DR). Naquela ocasião, destacou-se uma série de definições pertinentes aos conceitos e mostraram-se algumas topologias para implementá-los. Contudo, o tema é muito vasto e, por isso, este artigo complementará as informações, considerando as questões de gerenciamento de alta disponibilidade nos serviços de TI.

Para ter um gerenciamento de HA efetivo, o primeiro passo é compreender e documentar os requisitos de disponibilidade da instituição ou do cliente. Importa destacar que nem todos os serviços prestados pela instituição devem atender aos critérios de alta disponibilidade (99,9% de disponibilidade ou mais) e, quanto maior o número de serviços com características de HA, maior será o investimento. Por isso, a implementação do gerenciamento de disponibilidade com sucesso depende de uma clara compreensão dos requisitos de disponibilidade do cliente e dos negócios da instituição.

Objetivos e controles associados à Alta Disponibilidade

Os quatro principais objetivos associados à HA são: (i) maximização do tempo de serviço disponível ou redução do tempo médio entre falhas de serviço; (ii) eliminação ou redução do impacto dos incidentes relacionados ao serviço; (iii) minimização do tempo de manutenção do serviço não planejado ou não agendado; e (iv) redução do tempo de manutenção planejado ou agendado. Esses objetivos estão ligados a três conceitos importantes: reliability (confiança do serviço), maintainability (facilidade de manutenção do serviço) e serviceability (tempo planejado de manutenção).

Uma vez determinados os objetivos, o próximo passo é determinar os controles necessários para o gerenciamento de HA. Os principais controles são os seguintes: planos de disponibilidade, tanto no nível empresarial, quanto no nível do serviço (incluindo todos os serviços que possuem HA); identificação dos recursos críticos de TI, especialmente os discos e processadores; manutenção dos planos de disponibilidade; políticas de segurança; níveis de acordo de serviço (service level agreement – SLA) e níveis de acordo de operações (operations-level agreement – OLA); uma estratégia de TI; e um catálogo de serviços. Esses controles são documentos essenciais para o gerenciamento de sistemas com alta disponibilidade.

Além dos controles, é preciso ter métricas que possam medir o desempenho de um sistema de gerenciamento de disponibilidade. Tais métricas podem sinalizar alguns aspectos que devem estar presentes nos controles mencionados. Entre tais aspectos estão os esforços, custos financeiros e quantidade de tempo dedicados às tarefas, por exemplo. A seguir, apresentam-se algumas das métricas mais comuns:

· Duração de tempo, esforço humano e custos requeridos para desempenhar as atividades do processo de gerenciamento de disponibilidade, e.g. planejamento e execução dos planos de disponibilidade;

· Porcentagem, duração, frequência, impacto e custo dos incidentes que afetaram a disponibilidade;

· Quantidade e porcentagem de:

o Planos de disponibilidade aprovados, financiados e executados;

o Componentes de TI críticos e serviços com acordos de HA (atualizados e não atualizados); e

o Componentes de TI críticos e serviços com critérios de recuperação.

· Tempo decorrido desde a última:

o Auditoria de disponibilidade;

o Atualização do plano de disponibilidade; e

o Avaliação do plano de disponibilidade.

Alta Disponibilidade e o ciclo de vida dos serviços

Não se pode comentar sobre ciclo de vida de serviços sem relacioná-lo com o que preconiza o Information Technology Infrastructure Library (ITIL), em sua versão 3, lançada em maio de 2007. O ITIL documenta as boas práticas que devem ser aplicadas na operação, manutenção e infraestrutura de serviços TI.

A versão 3 do ITIL identifica cinco estágios no ciclo de vida de serviços, conforme ilustrado na Figura 1, a saber: (i) gerenciamento da estratégia de serviços; (ii) projeto de serviços; (iii) transição de serviços; (iv) operação dos serviços; e (v) melhoria contínua do serviço. Esses cinco estágios estão relacionados aos quatro objetivos da HA descritos a seguir.

Figura 1. Ciclo de vida dos serviços, segundo a ITIL.

No estágio (i), o gerenciamento da estratégia de serviço ajuda na definição dos requisitos de disponibilidade e na racionalização dos investimentos para melhorar a disponibilidade do serviço. Isso é feito ao se detalhar a relação entre o serviço e as estratégias funcionais e do negócio.

Na fase (ii), o projeto do serviço inclui a determinação e documentação dos requisitos do serviço, inclusive aqueles ligados às questões de disponibilidade, bem como a adição de um conjunto de requisitos funcionais e não funcionais. Convém ressaltar que o gerenciamento de disponibilidade é um processo de TI e, como tal, é parte do estágio de projeto do serviço.

Na transição de serviços, ou seja, no estágio (iii), o serviço muda para o modo operacional, e isso envolve o desenvolvimento de uma base de informações de configuração relacionada ao serviço. Essa base de informações contém a documentação da arquitetura do serviço, os procedimentos operacionais e outras documentações específicas. Nesse estágio também se incluem testes, avaliação e validação do serviço em ambiente de produção. Portanto, também é necessário incluir os testes de HA.

Na fase (iv), operação do serviço, várias atividades operacionais devem ser observadas. Entre elas estão aquelas ligadas às medidas antes citadas, a saber: gerenciamento de eventos e incidentes, com vistas às coletas dos dados relativos aos quatro objetivos associados à HA; auditorias de configuração pós implantação, incluindo auditoria de disponiblidade; e auditorias de operação, com o objetivo de direcionar manutenções preventivas em hardware e software.

Por fim, no estágio (v), o melhoramento do serviço inclui o desenvolvimento e implementação dos planos de melhoria da disponibilidade. Esses planos são baseados na análise da arquitetura, observando os pontos de fragilidade do serviço implantado e que impactam na sua disponibilidade.

Conclusão

São três as ações fundamentais da atividade de gerenciamento: organizar, planejar e executar. Sendo assim, um sistema de alta disponibilidade, bem gerenciado, prescinde da organização de requisitos claros que estabeleçam os critérios de negócios e de serviços. Em seguida, esse sistema precisa de um bom planejamento que considere esses requisitos e garanta a continuidade dos serviços, especialmente na presença de incidentes. Depois, por ocasião da sua execução, o sistema deve atender os requisitos de robustez previstos no seu plano original. Essas ações fazem parte de um ciclo que se renova a cada atualização dos serviços. Cabe aos analistas responsáveis pela infraestrutura uma visão crítica de todo o processo, a auditagem da situação e a indicação das melhorias a serem implementadas no próximo ciclo.

Referências

Livro “An Introductory Overview of ITIL V3”, Escrito por Alison Cartlidge et al. Editora itSMF Ltd., 2007.
http://www.best-management-practice.com/gempdf/itSMF_An_Introductory_ Overview_of_ITIL_V3.pdf

Livro “Business Continuity and Disaster Recovery Planning for IT Professionals”. Escrito por Susan Snedaker. Editora Syngress, 2007.

Normas ISO/IEC 27001 (Information Security Management System) e ISO/IEC 27002 (Information Technology - Security Techniques)
http://17799.standardsdirect.org