|
O desafio:
acesso ininterrupto à informação do
negócio
Na preparação
para os desastres, sejam devidos a
causas naturais, ou humanas, a gestão
de TI deve minimizar ou eliminar a
possibilidade de interrupções dos
serviços, quer seja para os empregados,
clientes, fornecedores, ou parceiros
de negócio. É necessário o acesso
a aplicações e a dados, pelo que os
processos do negócio devem continuar
após o encerramento do local de trabalho
(por exemplo, devido a incêndio, falha
de corrente, etc.), ou quando os empregados
não poderem deslocar-se ao local de
trabalho (por exemplo, devido a uma
pandemia de gripe, tempestade, ou
acidente de viação).
Os aspectos críticos
destes cenários são o backup e a protecção
da informação e das aplicações críticas;
o fornecimento de acesso a recursos
essenciais ao negócio a partir de
casa ou escritório temporário via
Websites seguros; e a permissão de
encontros remotos e de conferências
com equipas de empregados, clientes
e fornecedores para avançar com projectos
e vendas.
Nos objectivos
de um plano eficaz de recuperação
de desastres estão incluídos aspectos
como:
- Fornecer redundância
nas aplicações e dados através de
um local de contingência remoto;
- Fornecer aos
empregados um rápido restabelecimento
do acesso à informação redundante,
sem esperar pela reparação da rede;
- Permitir que
os empregados trabalhem a partir
de locais alternativos, incluindo
as suas casas, por conexão via Internet
ao sistema de contingência;
- Fornecer aos
empregados meios de acesso remoto
aos seus computadores e realizar
conferências e encontros de equipas
de empregados.
Muitas empresas
criaram centros de backup de dados
logo após o 11 de Setembro, mas o
aspecto do acesso à recuperação de
desastres é frequentemente omitido
nos projectos. Em que medida é útil
ter uma infra-estrutura de redundância
e backups de dados se os empregados
não têm acesso a eles de forma rápida,
fácil e segura, a partir de qualquer
local onde estiverem? De que serve
a informação armazenada no computador
do escritório se este está fora do
alcance do empregado durante um desastre?
Finalmente, como pode uma organização
manter uma relação forte e ter rendimentos
sem haver contacto entre as equipas
de funcionários, sem contactos telefónicos
com os clientes, e sem outras interacções
frente a frente, especialmente por
longos períodos quando as deslocações
são impossíveis?
As soluções de
acesso à infra-estrutura conduzem
a um componente crítico de uma solução
eficiente e eficaz em termos de custos
relativamente à continuidade do negócio,
ao permitir o acesso dos empregados
aos recursos da organização para poderem
trabalhar produtivamente durante a
ruptura.
A seguir, descrevemos
um negócio simulado que está a lidar
com a construção de um plano de recuperação
de desastres utilizando software de
acesso à infra-estrutura. Explicamos
também como uma solução de acesso
à infra-estrutura pode fornecer o
acesso simples e seguro à informação
e a outros recursos que foram duplicados
e guardados em segurança num local
de contingência.
A empresa
Xpto
A empresa Xpto
é uma cuidados de saúde, com duas
instalações distantes em termos geográficos
e um pequeno centro de dados num deles.
Tem um terceiro escritório noutro
local. As operações estão divididas
entre dois centros de dados, embora
operem de forma independente um do
outro. Os centros de dados são responsáveis
para servir as seguintes funções do
negócio:
- Acesso a aplicações
críticas para 60 000 utilizadores
(40 000 utilizadores num dos locais
e 20 000 no outro);
- Acesso a aplicações
para 1000 utilizadores remotos e
utilizadores em viajem;
- Acesso a aplicações
de parceiros para parceiros de negócio.
Para além de fornecer
acesso a todos os utilizadores da
organização, a empresa Xpto deve dar
aos seus parceiros acesso seguro aos
dados e às aplicações de que são proprietários.
A Xpto utiliza uma VPN SSL para garantir
o acesso à informação específica e
aos dados requeridos pelos parceiros,
ao mesmo tempo que previne acessos
indesejados à rede da organização.
Relativamente
aos dois centros de dados, a Xpto
tem administradores locais independentes,
responsáveis pela manutenção dos servidores
nos seus respectivos locais geográficos.
Os administradores são responsáveis
por tarefas como a gestão de aplicações,
a reinicialização dos servidores,
e a monitorização dos recursos. Tudo
estava a correr normalmente na empresa
Xpto até que um grupo de auditores
identificou a falta de um documentado
e testou o plano de recuperação de
desastre. Assim, requereram à empresa
Xpto que tinha de apresentar o quanto
antes um plano de recuperação de desastre,
bem documentado e testado.
Identificação
dos objectivos da recuperação
A organização
Xpto começou de imediato a formular
um plano de recuperação de desastres
e concluiu que precisava de ver respondidas
duas questões.
Questão
1. Qual é o tempo aceitável
em que os processos do negócio podem
estar em baixo? Isto é normalmente
referido como Recovery Time Objective
(RTO).
Na qualidade de
organização de cuidados de saúde,
a Xpto não pode ter nenhum tempo de
paragem das suas aplicações críticas.
Se estas aplicações falharem, as vidas
dos pacientes podem ser postas em
perigo. Para facilitar estes requisitos,
a Xpto coloca todas estas aplicações
críticas em servidores centrais.
A Xpto tem também
aplicações menos críticas que estão
nos computadores individuais dos utilizadores.
Estas aplicações não são críticas
para o negócio da organização, pelo
que não estão incluídas no plano de
recuperação de desastres. O acesso
dos utilizadores remotos não tem os
mesmos requisitos que as aplicações
críticas. Consequentemente, a Xpto
decidiu que os seus utilizadores e
parceiros remotos podem ficar até
um dia sem acesso.
Após analisar
o aspecto do negócio face aos utilizadores,
a Xpto orientou as suas atenções para
as tarefas executadas pelos empregados
de TI. A empresa precisava de determinar
quanto tempo o departamento de TI
precisa para estar em condições de
proceder a alterações no seu ambiente
em situação de falha. As alterações
avaliadas pela Xpto incluem tarefas
como a implementação de novas aplicações,
a adição de novos utilizadores ao
ambiente, a monitorização do ambiente,
e a manutenção do acesso à infra-estrutura.
Questão
2. Qual a quantidade de dados
que se perderá depois de uma recuperação?
Este é definido como Recovery Point
Objective (RPO).
Qual é a quantidade
de dados que a organização Xpto suporta
perder? Depois de alguma deliberação,
a Xpto decidiu que não tem tolerância
de perda de dados que são relevantes
nos processos diários do negócio.
Os dados usados pela equipa de TI
para gerir e monitorizar o seu ambiente
são os únicos para os quais não é
requerida protecção, uma vez que não
são relevantes para o negócio e são
considerados menos críticos.
Planificação
da recuperação
Após a identificação
do recovery time objective e do recovery
point objective, a Xpto está em condições
de planear os detalhes da recuperação
face a desastres. O plano de desaster
recovery da Xpto está dividido em
categorias distintas.
a)
Configuração dos componentes de redundância.
Prevenir quebras nos servidores devido
a falhas de equipamentos, tais como
fontes de alimentação, placas de rede,
e assim por diante. O primeiro aspecto
é a redundância de componentes físicos
dos servidores. De seguida listamos
algumas recomendações para componentes
redundantes.
- Fontes de alimentação
redundantes;
- Utilização
de RAID (conjuntos redundantes de
discos independentes), por exemplo,
RAID 1, 5, 1+0;
- Placas de rede
redundantes;
- …
O segundo aspecto
é a redundância dos serviços que os
servidores físicos fornecem. Depois
de salvaguardar os componentes físicos
dos servidores, o enfoque passará
pela criação da redundância dos serviços
fornecidos pelos servidores.
b)
Planificar o local de contingência.
Permitir o encaminhamento imediato
dos utilizadores de um local geográfico
para o outro em caso de desastre,
por exemplo, um incêndio, inundação,
sismo, ou uma falha de corrente eléctrica.
A tarefa inicial
da organização Xpto era seleccionar
o local do disaster recovery. Uma
das localizações secundárias existentes
podia ser seleccionada, porque cada
uma delas tem infra-estrutura suficiente
para albergar um local de recuperação.
A decisão seria baseada somente no
potencial de desastre de cada um dos
locais. A análise identificou um dos
locais como tendo maiores probabilidades
de um sismo afectar o local de recuperação.
A outra localização tornou-se assim
uma boa escolha, por ser um local
de relativamente baixo risco no que
se refere a desastres naturais.
A Xpto tem a vantagem
de seleccionar um local de disaster
recovery numa das suas localizações.
Caso não tivesse um local óptimo,
a organização poderia vir a considerar
a utilização de um terceiro centro
de dados. Se ocorrer uma falha, o
local geográfico teoricamente mais
seguro precisa de ter capacidade para
suportar, para além dos seus utilizadores,
também os utilizadores da outra localização
geográfica. O contrário também é verdadeiro,
obviamente.
Para o modelo
da recuperação, a equipa ligada a
essa vertente teve que seleccionar
entre activo-passivo e activo-activo.
O modelo activo-passivo é um modelo
em que o centro de dados do local
da recuperação do desastre está numa
modalidade "em situação de espera",
até ser requerido. Todos os utilizadores
ligam-se a um dos centros de dados.
O outro centro de dados não é utilizado
até que ocorra uma falha. O modelo
activo-activo descreve um ambiente
de disaster recovery no qual o local
designado pelo centro de dados do
disaster recovery está online e a
funcionar em conjunto com o centro
de dados principal. Neste modelo,
os utilizadores conectam-se localmente
ao local que tenha menos latência.
A Xpto seleccionou
o modelo activo-activo, com base na
sua experiência. O negócio requer
um completo plano de disaster recovery,
que fornece o acesso a todos os utilizadores,
mesmo quando um dos locais está em
baixo. Cada um dos locais tem de ser
completamente redundante e ter capacidade
de resposta a todos os utilizadores
da organização. O acesso à infra-estrutura
é somente uma das peças do puzzle
da redundância e disaster recovery.
Para ter uma solução completa, deve
haver planos para os seguintes componentes:
- Rede física
da infra-estrutura (routers, switches,
etc.);
- Active directory,
LDAP, etc.;
- Serviços de
rede (DNS, DHCP, etc.);
- Armazenamento
de dados e replicação;
- Acesso e gestão
de aplicações;
- Pontos de acesso
dos utilizadores.
c)
Definir um plano de backup.
Prevenir erros devido a vírus, corrupção
de bases de dados, ou eliminação acidental
de configurações.
O mundo da computação
moderna tem muitos erros lógicos que
podem causar potenciais tempos de
paragem. A Xpto identificou imediatamente
as ameaças de vírus, hackers e os
empregados descontentes. Percebeu-se
também que os erros lógicos podem
assumir a forma de dados corrompidos,
tais como bases de dados com dados
corrompidos. Para além desses erros
lógicos, existe a possibilidade de
um erro de um utilizador causar uma
falha. Os erros dos utilizadores podem
assumir muitas formas diferentes,
tais como um administrador apagar
acidentalmente informações vitais.
A Xpto concluiu
que esses erros lógicos e de utilizadores
podem facilmente ser prevenidos com
um plano de backup bem estruturado,
que inclua calendarizações de backups
regulares, com arquivo fora das instalações.
Fornecer
acesso a pedido
A organização
Xpto teve ainda que criar um plano
para fornecer aos seus empregados
e parceiros acesso flexível aos recursos
que estão no centro de dados do local
de contingência. Na eventualidade
de uma inundação ou de qualquer outro
desastre natural, os empregados seriam
evacuados para outros locais. Se um
escritório for forçado a fechar, os
empregados poderão necessitar de acesso,
por exemplo, a partir das suas casas.
Uma solução de acesso à infra-estrutura
é ideal para cenários de disaster
recovery porque fornece o seguinte:
- Rápido acesso
às aplicações e dados, através da
utilização de um browser Web standard.
A utilização da Internet para aceder
aos recursos da organização é uma
abordagem mais flexível durante
um desastre, porque qualquer computador
- seja em casa, num escritório temporário,
ou mesmo num quiosque público, ou
terminal - tem um browser Web.
- Segurança a
nível da Internet pública. Uma solução
de acesso à infra-estrutura mantém
as aplicações a processar no servidor
e dá um acesso virtual aos utilizadores,
que vêem e trabalham com a interface
da aplicação. Consequentemente,
os dados não são armazenados no
dispositivo. As soluções de acesso
às infra-estruturas utilizam tipicamente
ligações VPN SSL para proteger a
quantidade de dados que atravessa
a rede.
- Controlo centralizado.
A solução de acesso à infra-estrutura
permite que os administradores de
sistema monitorizem e controlem
remotamente quem está a aceder à
informação e o que estão a fazer
com ela - tais como download, gravar
e imprimir. Isto é crítico durante
uma interrupção, quando os utilizadores
estão fora dos seus locais de trabalho
do escritório e são forçados a ligar-se
através de um terminal público,
sem as medidas de segurança instaladas.
- Capacidade
de suporte técnico remoto. Durante
uma interrupção, os utilizadores
continuam a precisar de suporte
para os seus computadores e aplicações,
mas pode não haver disponibilidade
de recursos técnicos nos seus locais
temporários. Através de ferramentas
centralizadas, os administradores
de sistemas podem ver e mesmo actuar
remotamente sobre as sessões dos
utilizadores, a fim de lhes fornecerem
suporte e informação necessária
para manterem o empregado a trabalhar
produtivamente.
- Conferências
remotas por Internet para manter
as relações entre o trabalho e os
clientes. Um dos aspectos negligenciados
numa interrupção é a incapacidade
de encontros com os colegas de trabalho,
parceiros e clientes. A conferência
remota via Web permite que os empregados
se mantenham em contacto, continuem
a colaboração em projectos, e estabeleçam
ligações com os clientes e fornecedores
para manterem a actividade lucrativa
da organização.
Conclusão
No mundo dos negócios
dos nossos dias, em que o acesso à
informação é fundamental para a sobrevivência
das organizações, os desastres naturais,
as ameaças terroristas, ou as pandemias
têm vindo a aumentar em termos de
probabilidade. Consequentemente, a
necessidade de um plano de continuidade
é mais crítica do que nunca. Para
manter o negócio operacional, as relações
com os clientes, e dar suporte aos
empregados, é essencial ter uma solução
tecnológica que facilite o acesso
rápido, simples e seguro à informação
e às pessoas.
|