Subscrever newsletter Não desejo continuar a receber a newsletter
SINFIC insight - A newslettes semanal
Esta semana: ITIL - Information Technology Infrastructure Library  
Newsletter n.º 88  20 Novembro 2006  
 
 

Recuperação de Desastres

A intenção da planificação de recuperação de desastre, ou disaster recovery, é manter o negócio a funcionar durante uma interrupção devido a causas tecnológicas, humanas, ou naturais. Um plano robusto de recuperação de desastre - que engloba a protecção de informação e infra-estruturas redundantes, bem como o acesso aos mesmos pelos trabalhadores - pode ser crítico para a sobrevivência da organização e para o sustento dos seus empregados.

 



O desafio: acesso ininterrupto à informação do negócio

Na preparação para os desastres, sejam devidos a causas naturais, ou humanas, a gestão de TI deve minimizar ou eliminar a possibilidade de interrupções dos serviços, quer seja para os empregados, clientes, fornecedores, ou parceiros de negócio. É necessário o acesso a aplicações e a dados, pelo que os processos do negócio devem continuar após o encerramento do local de trabalho (por exemplo, devido a incêndio, falha de corrente, etc.), ou quando os empregados não poderem deslocar-se ao local de trabalho (por exemplo, devido a uma pandemia de gripe, tempestade, ou acidente de viação).

Os aspectos críticos destes cenários são o backup e a protecção da informação e das aplicações críticas; o fornecimento de acesso a recursos essenciais ao negócio a partir de casa ou escritório temporário via Websites seguros; e a permissão de encontros remotos e de conferências com equipas de empregados, clientes e fornecedores para avançar com projectos e vendas.

Nos objectivos de um plano eficaz de recuperação de desastres estão incluídos aspectos como:

  • Fornecer redundância nas aplicações e dados através de um local de contingência remoto;
  • Fornecer aos empregados um rápido restabelecimento do acesso à informação redundante, sem esperar pela reparação da rede;
  • Permitir que os empregados trabalhem a partir de locais alternativos, incluindo as suas casas, por conexão via Internet ao sistema de contingência;
  • Fornecer aos empregados meios de acesso remoto aos seus computadores e realizar conferências e encontros de equipas de empregados.

Muitas empresas criaram centros de backup de dados logo após o 11 de Setembro, mas o aspecto do acesso à recuperação de desastres é frequentemente omitido nos projectos. Em que medida é útil ter uma infra-estrutura de redundância e backups de dados se os empregados não têm acesso a eles de forma rápida, fácil e segura, a partir de qualquer local onde estiverem? De que serve a informação armazenada no computador do escritório se este está fora do alcance do empregado durante um desastre? Finalmente, como pode uma organização manter uma relação forte e ter rendimentos sem haver contacto entre as equipas de funcionários, sem contactos telefónicos com os clientes, e sem outras interacções frente a frente, especialmente por longos períodos quando as deslocações são impossíveis?

As soluções de acesso à infra-estrutura conduzem a um componente crítico de uma solução eficiente e eficaz em termos de custos relativamente à continuidade do negócio, ao permitir o acesso dos empregados aos recursos da organização para poderem trabalhar produtivamente durante a ruptura.

A seguir, descrevemos um negócio simulado que está a lidar com a construção de um plano de recuperação de desastres utilizando software de acesso à infra-estrutura. Explicamos também como uma solução de acesso à infra-estrutura pode fornecer o acesso simples e seguro à informação e a outros recursos que foram duplicados e guardados em segurança num local de contingência.

A empresa Xpto

A empresa Xpto é uma cuidados de saúde, com duas instalações distantes em termos geográficos e um pequeno centro de dados num deles. Tem um terceiro escritório noutro local. As operações estão divididas entre dois centros de dados, embora operem de forma independente um do outro. Os centros de dados são responsáveis para servir as seguintes funções do negócio:

  • Acesso a aplicações críticas para 60 000 utilizadores (40 000 utilizadores num dos locais e 20 000 no outro);
  • Acesso a aplicações para 1000 utilizadores remotos e utilizadores em viajem;
  • Acesso a aplicações de parceiros para parceiros de negócio.

Para além de fornecer acesso a todos os utilizadores da organização, a empresa Xpto deve dar aos seus parceiros acesso seguro aos dados e às aplicações de que são proprietários. A Xpto utiliza uma VPN SSL para garantir o acesso à informação específica e aos dados requeridos pelos parceiros, ao mesmo tempo que previne acessos indesejados à rede da organização.

Relativamente aos dois centros de dados, a Xpto tem administradores locais independentes, responsáveis pela manutenção dos servidores nos seus respectivos locais geográficos. Os administradores são responsáveis por tarefas como a gestão de aplicações, a reinicialização dos servidores, e a monitorização dos recursos. Tudo estava a correr normalmente na empresa Xpto até que um grupo de auditores identificou a falta de um documentado e testou o plano de recuperação de desastre. Assim, requereram à empresa Xpto que tinha de apresentar o quanto antes um plano de recuperação de desastre, bem documentado e testado.

Identificação dos objectivos da recuperação

A organização Xpto começou de imediato a formular um plano de recuperação de desastres e concluiu que precisava de ver respondidas duas questões.

Questão 1. Qual é o tempo aceitável em que os processos do negócio podem estar em baixo? Isto é normalmente referido como Recovery Time Objective (RTO).

Na qualidade de organização de cuidados de saúde, a Xpto não pode ter nenhum tempo de paragem das suas aplicações críticas. Se estas aplicações falharem, as vidas dos pacientes podem ser postas em perigo. Para facilitar estes requisitos, a Xpto coloca todas estas aplicações críticas em servidores centrais.

A Xpto tem também aplicações menos críticas que estão nos computadores individuais dos utilizadores. Estas aplicações não são críticas para o negócio da organização, pelo que não estão incluídas no plano de recuperação de desastres. O acesso dos utilizadores remotos não tem os mesmos requisitos que as aplicações críticas. Consequentemente, a Xpto decidiu que os seus utilizadores e parceiros remotos podem ficar até um dia sem acesso.

Após analisar o aspecto do negócio face aos utilizadores, a Xpto orientou as suas atenções para as tarefas executadas pelos empregados de TI. A empresa precisava de determinar quanto tempo o departamento de TI precisa para estar em condições de proceder a alterações no seu ambiente em situação de falha. As alterações avaliadas pela Xpto incluem tarefas como a implementação de novas aplicações, a adição de novos utilizadores ao ambiente, a monitorização do ambiente, e a manutenção do acesso à infra-estrutura.

Questão 2. Qual a quantidade de dados que se perderá depois de uma recuperação? Este é definido como Recovery Point Objective (RPO).

Qual é a quantidade de dados que a organização Xpto suporta perder? Depois de alguma deliberação, a Xpto decidiu que não tem tolerância de perda de dados que são relevantes nos processos diários do negócio. Os dados usados pela equipa de TI para gerir e monitorizar o seu ambiente são os únicos para os quais não é requerida protecção, uma vez que não são relevantes para o negócio e são considerados menos críticos.

Planificação da recuperação

Após a identificação do recovery time objective e do recovery point objective, a Xpto está em condições de planear os detalhes da recuperação face a desastres. O plano de desaster recovery da Xpto está dividido em categorias distintas.

a) Configuração dos componentes de redundância. Prevenir quebras nos servidores devido a falhas de equipamentos, tais como fontes de alimentação, placas de rede, e assim por diante. O primeiro aspecto é a redundância de componentes físicos dos servidores. De seguida listamos algumas recomendações para componentes redundantes.

  • Fontes de alimentação redundantes;
  • Utilização de RAID (conjuntos redundantes de discos independentes), por exemplo, RAID 1, 5, 1+0;
  • Placas de rede redundantes;

O segundo aspecto é a redundância dos serviços que os servidores físicos fornecem. Depois de salvaguardar os componentes físicos dos servidores, o enfoque passará pela criação da redundância dos serviços fornecidos pelos servidores.

b) Planificar o local de contingência. Permitir o encaminhamento imediato dos utilizadores de um local geográfico para o outro em caso de desastre, por exemplo, um incêndio, inundação, sismo, ou uma falha de corrente eléctrica.

A tarefa inicial da organização Xpto era seleccionar o local do disaster recovery. Uma das localizações secundárias existentes podia ser seleccionada, porque cada uma delas tem infra-estrutura suficiente para albergar um local de recuperação. A decisão seria baseada somente no potencial de desastre de cada um dos locais. A análise identificou um dos locais como tendo maiores probabilidades de um sismo afectar o local de recuperação. A outra localização tornou-se assim uma boa escolha, por ser um local de relativamente baixo risco no que se refere a desastres naturais.

A Xpto tem a vantagem de seleccionar um local de disaster recovery numa das suas localizações. Caso não tivesse um local óptimo, a organização poderia vir a considerar a utilização de um terceiro centro de dados. Se ocorrer uma falha, o local geográfico teoricamente mais seguro precisa de ter capacidade para suportar, para além dos seus utilizadores, também os utilizadores da outra localização geográfica. O contrário também é verdadeiro, obviamente.

Para o modelo da recuperação, a equipa ligada a essa vertente teve que seleccionar entre activo-passivo e activo-activo. O modelo activo-passivo é um modelo em que o centro de dados do local da recuperação do desastre está numa modalidade "em situação de espera", até ser requerido. Todos os utilizadores ligam-se a um dos centros de dados. O outro centro de dados não é utilizado até que ocorra uma falha. O modelo activo-activo descreve um ambiente de disaster recovery no qual o local designado pelo centro de dados do disaster recovery está online e a funcionar em conjunto com o centro de dados principal. Neste modelo, os utilizadores conectam-se localmente ao local que tenha menos latência.

A Xpto seleccionou o modelo activo-activo, com base na sua experiência. O negócio requer um completo plano de disaster recovery, que fornece o acesso a todos os utilizadores, mesmo quando um dos locais está em baixo. Cada um dos locais tem de ser completamente redundante e ter capacidade de resposta a todos os utilizadores da organização. O acesso à infra-estrutura é somente uma das peças do puzzle da redundância e disaster recovery. Para ter uma solução completa, deve haver planos para os seguintes componentes:

  • Rede física da infra-estrutura (routers, switches, etc.);
  • Active directory, LDAP, etc.;
  • Serviços de rede (DNS, DHCP, etc.);
  • Armazenamento de dados e replicação;
  • Acesso e gestão de aplicações;
  • Pontos de acesso dos utilizadores.

c) Definir um plano de backup. Prevenir erros devido a vírus, corrupção de bases de dados, ou eliminação acidental de configurações.

O mundo da computação moderna tem muitos erros lógicos que podem causar potenciais tempos de paragem. A Xpto identificou imediatamente as ameaças de vírus, hackers e os empregados descontentes. Percebeu-se também que os erros lógicos podem assumir a forma de dados corrompidos, tais como bases de dados com dados corrompidos. Para além desses erros lógicos, existe a possibilidade de um erro de um utilizador causar uma falha. Os erros dos utilizadores podem assumir muitas formas diferentes, tais como um administrador apagar acidentalmente informações vitais.

A Xpto concluiu que esses erros lógicos e de utilizadores podem facilmente ser prevenidos com um plano de backup bem estruturado, que inclua calendarizações de backups regulares, com arquivo fora das instalações.

Fornecer acesso a pedido

A organização Xpto teve ainda que criar um plano para fornecer aos seus empregados e parceiros acesso flexível aos recursos que estão no centro de dados do local de contingência. Na eventualidade de uma inundação ou de qualquer outro desastre natural, os empregados seriam evacuados para outros locais. Se um escritório for forçado a fechar, os empregados poderão necessitar de acesso, por exemplo, a partir das suas casas. Uma solução de acesso à infra-estrutura é ideal para cenários de disaster recovery porque fornece o seguinte:

  • Rápido acesso às aplicações e dados, através da utilização de um browser Web standard. A utilização da Internet para aceder aos recursos da organização é uma abordagem mais flexível durante um desastre, porque qualquer computador - seja em casa, num escritório temporário, ou mesmo num quiosque público, ou terminal - tem um browser Web.
  • Segurança a nível da Internet pública. Uma solução de acesso à infra-estrutura mantém as aplicações a processar no servidor e dá um acesso virtual aos utilizadores, que vêem e trabalham com a interface da aplicação. Consequentemente, os dados não são armazenados no dispositivo. As soluções de acesso às infra-estruturas utilizam tipicamente ligações VPN SSL para proteger a quantidade de dados que atravessa a rede.
  • Controlo centralizado. A solução de acesso à infra-estrutura permite que os administradores de sistema monitorizem e controlem remotamente quem está a aceder à informação e o que estão a fazer com ela - tais como download, gravar e imprimir. Isto é crítico durante uma interrupção, quando os utilizadores estão fora dos seus locais de trabalho do escritório e são forçados a ligar-se através de um terminal público, sem as medidas de segurança instaladas.
  • Capacidade de suporte técnico remoto. Durante uma interrupção, os utilizadores continuam a precisar de suporte para os seus computadores e aplicações, mas pode não haver disponibilidade de recursos técnicos nos seus locais temporários. Através de ferramentas centralizadas, os administradores de sistemas podem ver e mesmo actuar remotamente sobre as sessões dos utilizadores, a fim de lhes fornecerem suporte e informação necessária para manterem o empregado a trabalhar produtivamente.
  • Conferências remotas por Internet para manter as relações entre o trabalho e os clientes. Um dos aspectos negligenciados numa interrupção é a incapacidade de encontros com os colegas de trabalho, parceiros e clientes. A conferência remota via Web permite que os empregados se mantenham em contacto, continuem a colaboração em projectos, e estabeleçam ligações com os clientes e fornecedores para manterem a actividade lucrativa da organização.

Conclusão

No mundo dos negócios dos nossos dias, em que o acesso à informação é fundamental para a sobrevivência das organizações, os desastres naturais, as ameaças terroristas, ou as pandemias têm vindo a aumentar em termos de probabilidade. Consequentemente, a necessidade de um plano de continuidade é mais crítica do que nunca. Para manter o negócio operacional, as relações com os clientes, e dar suporte aos empregados, é essencial ter uma solução tecnológica que facilite o acesso rápido, simples e seguro à informação e às pessoas.

 

Voltar
 
 
 
 
     
 
 

Notícias

Onde Vão os Utilizadores à Procura de Serviços de Segurança?

Os Homens são Investidores Mais Activos

Quem Viaja Tem Mais Equipamentos de Alta Tecnologia

Aplicações Internet Ricas

A Alemanha Lidera a Adopção Europeia das Funcionalidades ATM

 

Eventos/Formação

Evento: Instructional Design - 29 de Novembro de 2006 - Inscrições Limitadas

Evento: Engenharia de Interfaces (GUI e Web) - 30 de Novembro de 2006 - Inscrições Limitadas

Evento: Gestão de Risco e Conformidades - 12 de Dezembro - Inscrições Limitadas

Formação: Introdução à ISO27001:2005 e ISO17799:2005 - 27 e 28 de Novembro de 2006

Formação: Análise e Desenho Orientado a Objectos com UML - 04 a 07 de Dezembro de 2006

Formação: Fundamentos de Rational Requisite Pro - 11 de Dezembro de 2006

Formação: Usabilidade - a Norma ISO 9241 - 11 de Dezembro de 2006

 
 
 

 

 
 
Editor: Leonel Miranda mail: newsletter@sinfic.pt
Sinfic, S.A. Estrada da Ponte, 2 - Quinta Grande, Alfragide, 2610-141 Amadora
Tel. (+351) 210 103 900 Fax. (+351) 210 103 999 • www.sinfic.pt A SINFIC é uma empresa certificada pela APCER. Leia mais em www.sinfic.pthttp://www.sinfic.pt/