Home / Artigos / Bacula – Liberdade e Segurança (Parte 2)

Bacula – Liberdade e Segurança (Parte 2)

Olá galera, hoje iremos falar sobre backup. O que é backup, Tipos de backup, termos utilizados, restauração de uma forma geral, isso é, Os termos usados nessa matéria são universais.

A integração, Gerenciamento e Administração de um backup é um serviço de Segurança da Informação e existem várias etapas envolvidas até chegar no backup e restauração em si.

O Backup, ou cópia de segurança, simplesmente é a cópia de dados específicos, para serem restaurados em caso de perda de informação, isto é redundância de informação.

Essa cópia pode ser feita para o mesmo computador, outro computador na rede, um dispositivo de armazenamento ou outro prédio ou localidade, assim podendo proteger seu backup inclusive fisicamente de algum dano a estrutura predial.

Seja qual for a forma de perda de dados, um backup precisa ser capaz de minimizar o impacto causado por essa perda possibilitando a restauração dos dados ou serviços no menor tempo possível com o mínimo de defasagem possível em termos de modificação dos dados copiados.

Existem vários dispositivos de armazenamento, porem os mais comuns são DVD, Disco rígido, Disco externo, Fitas Magnéticas e a cópia de segurança externa.

Esses backups podem ser feitos de 2 formas, Centralizados ou descentralizados. Sendo ele centralizado normalmente existe um servidor que comanda a realização dos backups e restaurações, deixando tudo mais prático e simples, economizando tempo e equipamento assim temos um ganho de escalabilidade.

Geralmente realiza-se esses backups a noite para que o impacto nos serviços utilizados em horários de expediente seja menor e o backup mais fiel. Essa característica fez com que o Bacula ganha-se seu nome (Backup + Drácula) então temos o “Bacula o backup Imortal” ou, como diz o livro Bacula – Ferramenta livre de Backup, “Ele vem pela noite e Suga a essência dos computadores”.

Bom, sabendo isso vamos olhar para o Futuro, e conhecer o futuro do backup. Os Cenários de hoje mostram um crescimento na complexibilidade dos ambientes bem como no tamanho dos volumes que necessitam ser protegido. Por isso tem-se cada vez mais buscado soluções alternativas como Snapshot e Espelhamento de dados. Um exemplo disso são as ferramentas de snapshot nativas na maioria dos Storages como o FreeNAS por exemplo.

Apenas 10% das grandes empresas alegam que deixaram de usar backups convencionais, em prol das soluções alternativas (Snapshot e espelhamento) mas segundo o relatório da Gartner, Dificilmente as ferramentas de backup devem desaparecer. Outro ponto é que aplicações especificas, como Bancos e hypervisors, deverão ser mais ativos para um melhor aprimoramento dos backups.

Mais um fator, é que o Snapshot e o Espelhamento, são mais eficazes em conjunto com o backup tradicional, transformando esse último como uma última linha de defesa na proteção dos dados. Logo uma boa linha de defesa seria, as versões anteriores dos arquivos (VSS) como primeira linha, o Espelhamento como segunda linha, o snapshot como terceira linha e o Backup tradicional como última linha defensiva.

Isso tudo além do fato que pelo menos 30% das organizações trocaram o fornecedor de software de backup por conta de frustações relativas ao custo, complexibilidade ou capacidade.

Alguns Mitos dos Backups

 Backup não pode ser confundido com Ciclo de Vida da Informação (ILM – Information Lifecycle Manager)

Hoje em dia se fala muito sobre ILM, tem até muitos desenvolvedores que falam que o ILM seria um dos papeis do Backup, porem Gerenciamento de Ciclo de Vida da informação consiste em vários processos, é um item tão vasto que aborda outros elementos como armazenamento, acesso, auditoria, criação, indexação, atualização, delegação entre outros.

Dito isso, o Backup é apenas mais um processo do ILM e não ao contrário, e faria parte de uma subdisciplina do ILM chamada ILP (“Information LiveCycle Protection” – Proteção do Ciclo de vida da informação). Que teria como item vários outros fatores:

  • Proteção Proativa contra Perda de dados – como antivírus, e outros aspectos em nível de aplicação;
  • Alta Disponibilidade;
  • Redundância de sistemas;
  • Backup e restauração de dados perdidos.

O ROI, como estamos falando de um serviço da segurança da tecnologia da Informação, o Backup não podia fugir à regra, porem trata-se da algo cujo o retorno do investimento é quase impossível de ser quantificado. Por isso muitos gerentes de TI ou Administrativos de empresas devem reagir com ceticismo aos modelos de cálculos de ROI, isso faz com que empresas que experimentaram limitadas falhas passem reduzir a atenção dispensada ao orçamento de Backup, tratando eles como menos necessários, deixando de fazer expansões ou implementações necessárias para que o sistema atenda a demanda adequadamente ou até mesmo fiquem sem a criação de backup.

Por tanto o backup deve ser considerado como uma apólice de seguro, isto é, é preferível que se tenha, porém nunca precise de utiliza-lo, do que não o ter e precisar dele.

A grande vantagem de um sistema livre de backup em relação ao ROI consiste no fato de que o sistema pode ser testado, e assim ter uma flutuação menor na estimativa de ROI.

Backup x sistema de tolerâncias a falha.

Primeira coisa que precisamos saber. Backup não vem, de forma alguma, ser um elemento de tolerância a falhas, dito isso, trata-se então de um importante elemento da recuperação de falhas.

Já a Tolerância a falhas trata-se da propriedade que permite ao sistema continuar funcionando adequadamente mesmo depois da falha de um de seus componentes. Um exemplo disso o Raid 1, pois permite que os dados continuem disponíveis mesmo depois da falha de 1 disco. Essa tolerância a falhas é uma propriedade inerente a sistemas de alta disponibilidade.

Cuidado, algumas empresas tendem a achar que um bom sistema de tolerância a falhas substitui ou diminuem a necessidade de backups, entre tanto eles são caros, não se pode implementa-los em todos os pontos críticos sem falar que não existe, em hipótese NENHUMA, um sistema de tolerância a falha é 100% eficaz, logo existe sim o risco de perda crítica de dados.

Riscos X Custos

Podemos classificar essa parte em duas grandes áreas, Riscos Operacionais e Riscos Comerciais, por outro lado, nem todas as chances de perda de dados podem ser evitadas por mais caros que sejam os sistemas de proteção. Mas ignorando as possibilidades catastróficas, principalmente porque caso elas ocorram as necessidades de restauração de dados não será mais importante, precisamos observar sempre a capacidade constante, verificando  a relação risco x custo dos sistemas de backup, principalmente quanto as operações são realizadas no plural “backups retirado de diversas localidades e  enviados para diversas localidades diferentes” ou seja redundância de backup, prevenindo assim contra um possível incêndio por exemplo2933_20_burnt-computer-university-of-southampton-fire-data-recovery, caso não seja possível a redundância de backup ou o envio para localidades diferentes, recomenda-se o uso de cofre anti-chamas. Por isso levem em consideração uma série de fatores como Criticidade e natureza da informação, o grau de maturidade dos usuários, a periodicidade da atualização de dados e por aí vai.

As Ferramentas nativas de backup do sistema x Ferramentas especificas de backup

As aplicações nativas dos sistemas operacionais, carecem de uma qualidade muito importante universo do Backup, a interoperabilidade, assim é impossível, ou excessivamente difícil, fazer várias copias de vários servidores em um único storage. O que causaria em um custo maior de manutenção e implementação, sem falar da administração descentralizada.

O que não ocorre com ferramentas Especificas de Backup seja ela Proprietárias ou GLP, mas existem outras funcionalidades que devemos considerar nas ferramentas especificas de backup.

  • Possibilidade de backup e restores cruzados (ou seja, através de rede em uma estação para outra);
  • Restores rápido usando apenas as mídias ncessesárias;
  • Catálogo para indexar os arquivos gravados, facilitando a busca por eles;
  • Possibilidade de usar robôs de fitas;
  • Ferramentas de recuperação de Desastres.

Ferramentas de Backup x Scripts de backup

Vamos começar falando de uma frase antiga no mundo da informática, nesse mundo nada se perde nada se cria tudo se copia. Com isso quero dizer, fazer um script de backup consiste em um “Retrabalho”, isso porque já existem várias aplicações bastante maduras sob Licenças livres. Sem falar que é uma solução única para um servidor especifico sendo usada apenas no ambiente em que se encontra. E sem possibilidade de suporte externo ou compartilhamento de experiência de cenário. Outro fator que as ferramentas de backup, suportam uso de scripts externos para executar funções antes e depois do backup ou restore.

Sem uma documentação interna detalhada sobre o script a continuidade da solução seria prejudicada caso não tenha mais contato com seu desenvolvedor, fora o fato do custo mais alto para aprendizado do que uma ferramenta mais comum.

Em termo de desempenho, tente fazer um backup a 2.6Gb/s que algumas ferramentas conseguem fazer em conjunto com o ambiente que estão instaladas, com um script. Poucos, para não dizer nenhum administrador de sistema desenvolveria um script que atinja performance próxima a essa.

Conceitos

Agora que falamos sobre o que é um backup, vamos aos conceitos. Existem alguns termos que precisamos saber que são iguais em qualquer ferramenta de backup, assim sendo vamos falar um pouco sobre elas.

Retenção: esse é o tempo em que determinada informação não pode ser apagada do banco de dados ou da Mídia de backup, podendo ser apagada somente por intervenção humana e o mesmo deve ser relatado no chamado que foi aberto para o procedimento.

Expiração: Nada mais do que o termino do prazo de retenção.

Job: Trabalho de backup, restore ou teste da cópia de segurança.

Purge: Esta é a ação de eliminar os dados do catálogo a respeito de um determinado volume (Files, Jobs e etc). porem as label’s ficam no catalogo e os dados ficam na mídia de backup.

Prune: Esta é a ação de eliminar as entradas, que não são mais necessárias no banco de dados, (arquivos e Jobs já expirados nos volumes) essa ação não apaga os dados contidos nos volumes das mídias.

SAN: Storage Area Network, Rede Seccionada com o objetivo de isolar o trafego destinado ao backup, tanto por performance quanto por segurança, utiliza protocolo SCSI.

Volume: Divisão, pequenas gavetas usadas para o armazenamento dos dados de backup podem ser armazenadas em fitas, HDs e etc, sendo que no caso das fitas só pode haver um único volume lógico. Em geral esses volumes são proprietários e somente é possível abrir os volumes dentro do próprio sistema de backup. Aqui vale ressaltar a maravilha do Bacula, que monta volumes livres, assim podendo abri-los utilizando o ”tar” por exemplo, facilitando a recuperação de dados em caso de uma falha onde o servidor de backup é perdido ou a troca de sistema de backup.

Pool: um grupo com um conjunto de volumes que possuem as mesmas características, como tempo de retenção por exemplo. Um determinado backup usa um Pool agendado não pode usar volumes de outro pool pois o volume herda as características do pool.

FileSet: Lista de diretórios ou arquivos que serão protegidos pelo backup e pode ser utilizado para um ou vários servidores. Pode-se incluir ou excluir pastas ou arquivos, pois o bacula aceita expressões regulares para incluir ou excluir nomes ou terminações específicas.

Catalogo: é responsável por armazenar o índice de todos os arquivos armazenados, bem como informações dos volumes e mídias que foram utilizados. Fica armazenada normalmente em um banco de dados, aqui aparece outra vantagem do Bacula, ele suporta três diferentes bancos de dados Livres, para armazenamento do catalogo, PostgreSQL, MySQL ou SQLite.

Janela de backup: é apenas o tempo máximo de duração que um job pode ser executado, seja ele de backup, Restore ou verificação, de maneira que não exista, ou sejam minimizados, os impactos para os usuários do respectivo servidor. Por isso a boa prática nos diz que devemos agendar os backups para depois dos horários administrativos, deixando assim o backup mais fiel a realidade pois assim teremos poucos ou nenhuns dados sendo modificados durante o backup. Obviamente, aplicações 24/7 não possuem janela de backup, por isso os horários para execução são irrelevantes.

Política de backup:  é apenas um documento corporativo onde deve estar delineado de maneira genérica (sem falar sobre produtos específicos) como devem ser feitos os backups, Restaurações e testes e deve seguir as normas ISO referentes ao tema (ISO27001 E ISO27002).

MTBF (Mean Time Between Failure): Esse é um conceito já bem conhecido dentro da área de T.I. é o tempo de vida médio de um determinado hardware ou suprimento pode ser utilizado com segurança com o mínimo risco de erro, um exemplo são as fitas magnéticas onde indica-se que sejam trocada a cada 5 anos.

GFS (Grandfather, father, son): se trata de uma estratégia de rotação de fita ou mídias de backup, usando uma hierarquia de pools com tempos diferentes de retenção gerando economia em mídias, um exemplo disso é:

GrandFather

  • Realizar um backup Full com retenção de 365 dias todo primeiro domingo do mês

Father

  • Realizar um backup Diferencial com retenção de 30 dias todo segundo, terceiro e quarto domingo do mês.

Son

  • Realizar um backup Incremental com retenção de 5 dias de segunda-feira a sexta-feira.

Assim além de economizar espaço na mídia, temos sequencias de backup diferentes protegendo todo o sistema.

Os tipos de backup trataremos mais à frente.

Tabe Virtualization: com o barateamento do custo dos HDs (por GB), aliado a um ganho de confiabilidade, fez com que os HDs sejam bastante utilizados em backup em substituição a fita magnética, com isso houve a necessidade de criar múltiplos volumes de backup nesses HDs, simulando assim um robô de fita. Aplicando a GFS também nos discos.

Backup Cruzado: Backup realizado remotamente de uma máquina para outra ou storage independente, através da rede.

Tipos de Backup

Full: faz a cópia integral de todos os dados do FileSet de um servidor, independente deles terem sido modificados ou não. Feito na primeira vez em que é realizado o backup de um servidor ou no início de cada Ciclo mensal ou mesmo em estruturas de backup onde só se realize backup Full como backup de base de dados SQL. Entre tanto é um backup extremamente caro para ser feito diariamente, principalmente por consumir muito espaço em disco ou quantidade de suprimentos gastos. Porem usa apenas o ultimo job Full realizado para o restauro. Esse backup é considerado GrandFather, na estrutura GFS.

Diferencial: Faz apenas a cópia dos dados do Fileset de um servidor que foram modificados desde o último backup Full assim, todos os backups diferenciais realizados terão todos os dados modificados do último backup Full, independente se o arquivo já está ou não no último backup Diferencial. A grande vantagem é a economia de espaço em disco e a mínima quantidade de volumes para restaura-los (em geral apenas 2 Jobs são usados o último Full e o último Diferencial). Esse Backup é considerado Father na estrutura GFS.

Incremental: Ele é bastante similar, porem ao contrário do Diferencial o último backup incremental não terá dados do backup incremental anterior, tendo então, uma substancial economia de espaço em mídia, isso por que ele vai checar todos os Jobs (Full, Diferencial e Incremental) procurando arquivos modificados, e vai comparar a informação entre os Jobs identificando se a mesma já foi copiada em algum job do Ciclo, caso não tenha sido ele cópia essa informação em um novo job incremental. A desvantagem é que serão necessários várias mídias para sua restauração pois teremos que restaurar o Backup Full, seguido do último Diferencial e todos os incrementais realizados após o último Diferencial. Esse backup é considerado Son na estrutura GFS.

Também existem outros tipos de backup como:

Cópia: uma Cópia secundário ou complementar de determinado Volume de backup (redundância). Muito utilizada para backup off-site. O volume é mantido intacto.

Migração: é quando os dados de um determinado volume são migrados para outro para que se possa remover o volume antigo, pode ser útil em caso de erros de leitura ou gravação em determinada mídia de armazenamento, pois os dados precisam ser movidos para uma mídia saudável.

Mídias de backup

Existem vários tipos de mídias vou resumir somente as principais

Fita Magnética: podem ser não compactados/compactados ex: 20/40 GB normalmente definido pelo fabricante e a quantidade de dados varia de acordo com a natureza dos dados (Músicas, vídeos, fotos, documentos, zip).

                Tipos de fita:

                DDS – Digital data Storage com capacidade que faria de 24/40 a 80/160 GB e taxa de transmissão que varia de 3.2MB/s a 6.9MB/s.

                DLT – Digital Linear Tape com capacidades que varia de 40 a 800 GB e taxa de transmissão que varia de 6 a 60 MB/s.

                LTO – Linear Tape Open com capacidade que varia de 200/400 a 800/1.6Tb com taxas de transmissão variando entre 40 a 120Mb/s.

Mídia óptica –  A falta de capacidade, durabilidade e confiabilidade ampliadas fizeram com que esse tipo de mídia não fosse tão utilizado para fins de backup.

Disco Rígido:  O fato dos discos Rígidos estarem sempre acessíveis para o sistema operacional, aliado a uma diminuição no custo por Gigabyte e aumento de confiabilidade, fez com que aumentasse a aplicabilidade dos HDs para o armazenamento de backup, sendo uma excelente opção, para usuários domésticos, pequenas e médias empresas uma vez que o investimento Inicial é baixo em relação ao robô de fita.

Armazenamento

Já quanto ao local de armazenamento, podemos dividir ele em dois grupos. Backups on-site e backups off-site.

Os backups on-site os dados ficam armazenados no mesmo prédio de origem (servidor), assim a ocorrência de catástrofes físicas, incêndio por exemplo, poderia afetar não apenas os dados originais, mas também a cópia de segurança. O Backup on-site é aceitável quando existem cofres Anti-chamas para armazenamento das mídias.

Já o backup off-site, é o oposto do On-site, pois os dados ficam armazenados em outra localidade, até mesmo em nuvem.

Como boa prática é aconselhável ter os dois backups, on-site e off-site, assim o tempo de restauração da maioria dos restores será mais rápida, mas temos a segurança do backup remoto para os momentos em que também se perde o backup local.

Bom nessa matéria, teve por objetivo conversamos um pouco sobre o que é um backup. Nos próximos posts falaremos sobre, projeto de um sistema de backup, políticas e melhores práticas, Estratégias de backup e o GFS ai então entraremos no Bacula em Si. Peço desculpa por ter escrito um post mais longo, mas precisava fechar esse assunto para seguir. Espero que tenham gostado desse post, deixem seus comentários e dúvidas.

Um abraço a todos e até a próxima.

Fonte: Livro Bacula – Ferramenta Livre de Backup. – Site: http://www.bacula.com.br

Sobre Andre Telles

Atuo na área de T.I desde 1992 então tenho 24 anos de área, trabalho com segurança da informação desde 1995 especialmente com UNIX/Linux, no desenvolvimento de estratégias de Filtragem de pacotes, ILM (Information LiveCycle Manager) e ILP (Information LiveCycle Protection), Roteamento Estático e Dinâmico, Políticas de Segurança, Melhores práticas, Criptografia, LDAP, LAMP e WAMP, Proxy e muitas outras atividades de segurança interna/externa e monitoramento de redes. Faço parte da Equipe do Todos de TI e da equipe de desenvolvimento do UBUNTU, junto à Canonical, e sou sócio proprietário da ACTech Service Consultoria em TI de São José dos Campos.

Veja também

controlador primário de domínio (PDC).

Como configurar Servidor Samba como controlador primário de domínio (PDC).

O objetivo desse roteiro é mostrar como configurar um servidor Samba PDC compartilhando o diretório …

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

blog lam dep | toc dep | giam can nhanh

|

toc ngan dep 2016 | duong da dep | 999+ kieu vay dep 2016

| toc dep 2016 | du lichdia diem an uong

xem hai

the best premium magento themes

dat ten cho con

áo sơ mi nữ

giảm cân nhanh

kiểu tóc đẹp

đặt tên hay cho con

xu hướng thời trangPhunuso.vn

shop giày nữ

giày lười nữgiày thể thao nữthời trang f5Responsive WordPress Themenha cap 4 nong thonmau biet thu deptoc dephouse beautifulgiay the thao nugiay luoi nutạp chí phụ nữhardware resourcesshop giày lườithời trang nam hàn quốcgiày hàn quốcgiày nam 2015shop giày onlineáo sơ mi hàn quốcshop thời trang nam nữdiễn đàn người tiêu dùngdiễn đàn thời tranggiày thể thao nữ hcmphụ kiện thời trang giá rẻ