Árvore de páginas

01. O que é um plano para recuperação de desastres?

O Plano de Recuperação de Desastres (DRP – Disaster Recovery Plan) é um processo documentado envolvendo um conjunto de procedimentos para recuperar os serviços de TI após um evento extremo de falha no ambiente, seja em Banco de Dados, infraestrutura de rede, servidores de aplicações ou qualquer outro ambiente crítico ao funcionamento do negócio.

02. Objetivos de um DRP

O principal objetivo de um DRP é identificar possíveis situações de risco e elaborar soluções para restabelecer as operações do negócio, no menor tempo possível, caso uma das possíveis falhas levantadas aconteçam. As situações levantadas podem ser de origem técnica, operacional, de infraestrutura ou até mesmo um desastre natural.
Objetivos secundários de um DRP podem ser observados a seguir:

  • Ter pessoas preparadas para atuar no caso de um problema grave;
  • Reduzir ao máximo as perdas financeiras nessas situações;
  • Identificar prioridades de restabelecimento para as operações;
  • Facilitar a realização das tarefas da recuperação;
  • Reduzir a complexidade do esforço de recuperação, entre outras.

03. Elabore o seu DRP

Atenção

Neste item serão abordados temas genéricos para elaboração de um DRP, tendo como foco principal um cenário de utilização dos produtos Linha Consinco. Cenários específicos, envolvendo outras aplicações, ambientes ou tecnologias não serão abordados aqui.

Um plano para recuperação de desastres, habitualmente, pode ser dividido em algumas fases:

  1. Pré-planejamento das atividades;
  2. Avaliação de vulnerabilidades, impactos no negócio e estratégias para a recuperação;
  3. Documentação do plano com os procedimentos descritos;
  4. Criação de um plano de testes/simulação;
  5. Realização de testes periódicos;
  6. Programa de manutenção.
É importante destacar que, as fases aqui elencadas e descritas podem ser alteradas, podendo haver inclusões ou exclusões de novos passos para elaboração e implementação do seu DRP, conforme necessidade do negócio.

03.1 Pré-planejamento das atividades

Essa fase determina as necessidades iniciais do projeto, os times e pessoas a serem envolvidas, tanto na elaboração quanto na participação das atividades de recuperação dos ambientes. Define-se também o esforço e investimentos relativos à implementação e manutenção do plano. Além disso, devemos considerar também a elaboração de estratégias para conscientização e treinamentos de pessoas relacionadas às atividades aqui descritas.

03.2 Avaliação de vulnerabilidades, impactos no negócio e estratégias para a recuperação

Neste ponto do projeto, o foco passa a ser a avaliação de vulnerabilidades e possíveis impactos destas na operação do negócio. A intenção é documentar todas as possíveis vulnerabilidades encontradas, os impactos no negócio e também o plano para a solução dos casos levantados. Além disso, deve-se estabelecer papéis e responsabilidades sobre cada etapa nas ações de recuperação.

Como exemplo, podemos avaliar:

  • Possíveis falhas de hardware;
  • Falhas de software;
  • Ataques cibernéticos;
  • Desastres naturais, etc.

Aqui no TDN disponibilizamos várias documentações sobre topologias, servidores e configurações de aplicação, que podem auxiliar no levantamento de pontos a serem incluídos e documentados no seu DRP. Veja alguns exemplos:

Em Requisitos de Infraestrutura encontramos uma vasta documentação sobre:

  • Ambiente Client
  • Oracle Client
  • Servidores
    • Aqui podemos encontrar informações sobre conectividade das aplicações do eco sistema do ERP Linha Consinco ao banco de dados Oracle.
  • Topologias de implementação e uso.

Além dos temas acima, relacionados a infraestrutura, temos também uma ampla documentações sobre configurações dos produtos. Dentre elas, destacamos:

Um ponto fundamental para uma rápida recuperação dos ambientes tecnológicos que envolvem o uso das soluções TOTVS Varejo Supermercados - Linha Consinco, são os backups. Após o levantamento de riscos e vulnerabilidades, e de avaliar o impacto desses riscos nas operações e infraestrutura, considerar as estratégias de backup contribuirá para a redução do tempo de restauração dos ambientes. Para isso, considera-se importante os seguintes pontos:

  • Avaliar e implementar uma política de backup regular para todos os dados críticos do ERP - aplicações, bancos de dados e configurações de servidores.
  • Realizar backups completos e diferenciais para minimizar a perda de dados.
  • Armazenar cópias de backup em locais geograficamente distintos, como locais internos e serviços de nuvem seguros.

Outros dois temas muito importantes para otimização no tempo de recuperação são a Replicação e a Redundância. Avaliar a possibilidade de se ter serviços de infraestrutura com alta disponibilidade, como replicação de dados em tempo real, Data Guards, Clusters para alta disponibilidade, são algumas ações que também minimizam o tempo de recuperação dos ambientes.

A contingência de infraestrutura também é um fator a ser avaliado. Manter uma infraestrutura de hardware e software de contingência que possa ser ativada rapidamente em caso de falha enriquece certamente o plano e minimiza o tempo de recuperação.

Considera-se também como tarefa chave nesta etapa, uma avaliação completa da segurança de todos os ambientes do negócio, observando:

  • Pessoal;
  • Segurança física;
  • Procedimentos operacionais;
  • Planejamento de apoio e de contingência;
  • Desenvolvimento e manutenção dos sistemas;
  • Segurança das bases de dados;
  • Segurança de comunicações dos dados e voz;
  • Sistemas e segurança do software de controle do acesso;
  • Apólices de seguro;
  • Planejamento e administração da segurança;
  • Controles da aplicação;
  • Computadores pessoais;
  • Etc.

03.3 Documentação do plano com os procedimentos descritos

Nesta fase, inicia-se a materialização do plano, através de sua documentação e disponibilização a todos os interessados. Esta fase inclui também a execução das mudanças nos procedimentos dos usuários e a implementação de processos para suportar as estratégias selecionadas para a recuperação e as alternativas identificadas.

Também ocorre a formalização dos acordos contratuais com os fornecedores de hardware, software e serviços para suportar o plano de recuperação. As equipes de apoio ao plano de recuperação devem ser definidas, assim como suas responsabilidades no plano.

  • Documente os procedimentos especificados anteriormente para a recuperação em diferentes cenários de desastres;

  • Tenha uma lista de contatos de equipe e fornecedores relevantes que precisam ser notificados durante a recuperação;
  • Verificar, e se necessário, modificar os contratos com fornecedores;
  • Treinar o time para atuação;
  • Verificar outras tarefas pertinentes ao bom andamento do processo;

Para auxiliar na documentação do plano, a TOTVS disponibiliza, além das informações sobre a topologia de implementação do ERP divulgada acima, documentações sobre as configurações recomendadas para os servidores utilizados em cada topologia.

Dentro das informações sobre o Servidor de Banco de Dados, na seção Conexões com o Banco de Dados, temos um resumo das configurações sobre as conexões ao banco de dados conhecidas pelo ERP Linha Consinco.

03.4 Criação de um plano de teste/simulação

Uma vez definidos os planos, inicia-se a fase de implementação e testes. É aconselhado repetições na execução dos testes para que o time de atuação esteja sempre apto a fazê-lo. É recomendado também que se repita o teste sempre que ocorrer uma mudança significativa no ambiente tecnológico de negócio.

As seguintes atividades devem ser realizadas:

  • Definição e estruturação do escopo do teste;
  • Condução do teste;
  • Análise dos resultados do teste; e,
  • Modificação dos planos de recuperação, se necessário.

O escopo do teste depende da estratégia de recuperação selecionada, refletindo os requerimentos de negócio da empresa. O plano de recuperação desenvolvido deve ser escrito de forma que seja compreensível e fiel à realidade da organização.

03.5 Realização de Testes Periódicos

Conforme mencionado acima, é muito importante a realização de testes regulares do plano de recuperação para garantir que todos os processos funcionem conforme o esperado. Siga a periodicidade documentada nos levantamentos. Documente os resultados dos testes e revise o plano com base nas lições aprendidas.

03.6 Programa de Manutenção

Revise e atualize regularmente o plano de recuperação de desastres para garantir que ele permaneça relevante e eficaz diante das mudanças no ambiente de TI e nos riscos.

Atenção: Lembre-se de que um plano de recuperação de desastres não é um documento estático. Ele deve ser constantemente revisado, testado e adaptado para garantir que esteja alinhado com as necessidades e mudanças do ambiente de ERP.