Storage Consulting

Protezione Dati

La protezione dei dati è di fondamentale importanza per ogni azienda che voglia garantire la propria produttività: questo perchè, ad oggi, ogni ciclo produttivo è generalmente gestito da sistemi infomativi che elaborano documenti e progetti conservati in forma elettronica. Meglio quindi non rischiare di perdere nessun dato, per non compromettere la continuità e la resa economica della produzione.

Ogni dato  è rappresentato da un file elaborabile tramite software e che ha la propria sede fisica all'interno del disco gestito dal Sistema Operativo.
Ma che cosa può accadere e far si che i dati vengano persi?

PERICOLI
  • rottura del disco
  • modifica o erronea cancellazione del file da parte dell'utente
  • attacco del file da parte di agenti esterni che ne possono modificare il contenuto

 Fortunatamente, per ognuna di queste eventualità esistono una o più soluzioni

SOLUZIONI
  • Protezione del CONTENITORE DEL DATO: si tratta di soluzioni di storage che prevedono un sistema di implementazione dei dischi di tipo RAID (Redundant Array of Independent Disksinsieme ridondante di dischi indipendenti) e che permettono una miglior tollerabilità ai guasti che possono colpire le componenti fisiche del sistema informativo.
  • Protezione del CONTENUTO DEL DATO: si tratta di soluzioni per la creazione di copie di riserva dei dati, che andrebbero poi conservati separatamente su supporti di memorizzazione di varia natura
  • Protezione contro MINACCE ESTERNE: si tratta di soluzioni con due diverse funzioni. Da una parte possono rendere inaccessibili i dati più importanti a una determinata utenza, mentre dall'altra possono proteggerli dalle intrusioni (FIREWALL) o dagli attacchi di virus (ANTIVIRUS)

Protezione del contenitore (Storage)

I sistemi RAID

Come detto, una delle migliori soluzioni di protezione dello Storage è quella di implementare più dischi in un sistema RAID.

Il sistema RAID è un sistema di "connessione logica" tra più dischi che permette una visione unica di tutto lo spazio disponibile, che risulterà dalla somma delle capacità dei dischi che lo compongono, aumentando così parallelamente anche le prestazioni in lettura/scrittura, nonchè ovviamente la sicurezza dei dati stessi.
Il collegamento logico dei dischi tra loro viene definito da una struttura detta array, che a sua volta identifica il livello RAID; tutto il sistema sarà gestito poi da un controller che consentirà di collegare i vari dischi e di implementare uno o più livelli di RAID, rispettivamente in sistemi di protezione semplice o complessa.
Una delle peculiarità del RAID è la ridondanza, ossia una "eccedenza", una duplicazione delle informazioni esistenti, per consentirne comunque il recupero, in caso di guasto a uno dei dischi.

Esistono livelli RAID standard e livelli annidati, che derivano dalla combinazione di due livelli standard organizzati tra loro in un altro sistema RAID.

Livelli STANDARD
  • RAID 2
  • RAID 4
  • RAID 3
Livelli ANNIDATI
  • RAID 0+1
  • RAID 10
  • RAID 50
  • RAID 60

I livelli RAID maggiormente utilizzati sono 1, 10, 5 e 6, in qualche caso 50 e 60.

RAID 0

(striping)
L'unico livello RAID che non prevede la ridondanza e quindi la protezione contro la perdita dei dati è il livello RAID 0, che permette però un miglioramento delle prestazioni del sistema.
Ciò è possibile grazie alla funzione di striping che suddivide i dati da scrivere in stringhe di egual lunghezza (unità di striping), le quali vengono poi allocate in maniera sequenziale nei dischi che compongono questo tipo di sistema RAID.

Questa è una configurazione alquanto "fragile" poichè il guasto di un disco provoca la perdita totale del contenuto dell'intero array di dischi; per questo motivo il livello RAID 0 è consigliato in situazioni in cui la ridondanza dei dati è irrilevante.

Nel RAID 0 la capacità totale del disco logico (Cld) risulterà dalla moltiplicazione della capacità del singolo disco fisico (Cfd) per il numero dei dischi (Nfd) presenti nel sistema RAID e quindi
                                                                 Cld = Cfd x Nfd

Vantaggi
  • Dati distribuiti in blocchi, ognuno scritto su un disco separato
  • Performance di I/O migliorate grazie alla distribuzione del carico di I/O tra molti canali e dischi
  • Le performance migliori si ottengono quando i dati sono suddivisi tra controller multipli con un solo disco per controller
  • Nessun calcolo di parità
  • Facile da implementare
Svantaggi
  • Nessuna tolleranza ai guasti
  • Il guasto di un singolo disco provoca la perdita di tutti i dati in tutto l'array
  • Da non utilizzare in ambienti critici

RAID 1

(mirroring)
Questo livello è costituito da coppie di dischi e prevede l'utilizzo della tecnica del mirroring per ottenere la ridondanza: ogni blocco di dati viene scritto contemporaneamente su i due dischi della coppia e ciò permette di evitare la perdita dei dati in caso di guasto di uno dei due dischi.
Il controller può gestire configurazioni RAID 1 multiple, ognuna delle quali costituita da due dischi.

Questo tipo di RAID prevede quindi l'utilizzo minimo di 2 dischi, preferibilmente con la stessa capacità: in questo modo, la capacità totale del disco logico (Cld) sarà uguale al prodotto della capacità del singolo disco (Cfd) per il numero di dischi (Nfd) diviso 2. In caso di dischi con capacità diverse verrà considerata la capacità del disco più piccolo.
                                                              Cld = (Cfd x Nfd)/2

Vantaggi
  • Possibile una lettura o due scritture per coppia in mirroring
  • Velocità di transazione raddoppiata in lettura rispetto a un singolo disco, mantenuta in scrittura
  • Grazie alla ridondanza al 100%, in caso di guasto nessuna necessità di ricostituire i dati; basta copiarli nel disco che va a sostituire quello danneggiato
  • Velocità di trasferimento per blocco uguale a quella del singolo disco
  • In certe circostanze, RAID 1 può sopportare il guasto di drive multipli
  • Il più semplice livello RAID per lo storage
Svantaggi
  • Il maggiore overhead di disco tra tutti i sistemi RAID
  • Funzione RAID garantita dal software di sistema o da un controller esterno, caricando CPU/Server e possibilmente declassando il throughput se raggiunti elevati livelli di attività. Implementazione hardware caldamente consigliata
  • Può non supportare la sostituzione a caldo del disco se implementato in software

RAID 5

(distributed parity)
Il livello RAID 5 utilizza la tecnica dello striping in associazione a quella del controllo di parità, per la sicurezza dei dati.
Lo striping, in questa configurazione, avviene a blocchi (di byte) con calcolo e scrittura della parità per ogni blocco: la parità è una somma binaria che consente, a ritroso, di ricalcolare il dato eventualmente mancante.
In questa configurazione non esiste il disco dedicato alla scrittura della parità, ma su tutti i dischi vengono scritti indifferentemente i dati o il corrispondente calcolo di parità (contraddistinto dalla lettera p in figura), ottenendo cosi anche delle buone prestazioni in scrittura.
In caso di  guasto, la ricostruzione dell’array di un disco può avvenire, a seconda delle caratteristiche del controller e del sistema, sia in avvio del sistema stesso o durante il normale funzionamento.

Nel RAID 5 vanno utilizzati un minimo di 3 dischi e la capacità totale del disco logico (Cld) risulterà dalla moltiplicazione tra la capacità del singolo disco fisico (in caso di capacità diverse nel sistema, si considera sempre quella del disco più piccolo) (Cfd) e il numero dei dischi (Nfd), meno uno.
                                                                       Cld = Cfd x (Nfd-1)

Vantaggi
  • Elevata velocità di transazione dei dati in lettura
  • Velocità di transazione dei dati media in scrittura
  • Rapporto ridotto tra dischi ECC (controllo di parità) e dischi di dati significa alta efficienza
  • Buona velocità di trasferimento nel complesso
Svantaggi
  • Il danneggiamento del disco ha un impatto medio sul throughput
  • Sistema con controller molto complesso
  • Difficoltà di ricostituzione in caso di danneggiamento del disco
  • Velocità di trasferimento di blocchi singoli uguale al disco singolo

 

RAID 6

(distributed double parity)
Questo ultimo livello semplice è assimilabile al livello RAID 5: infatti anche in questo caso si utilizzano in combinazione la tecnica di striping e quella del controllo di parità, il cui calcolo e la cui scrittura saranno però doppi in questo livello e non singoli come nel precedente.
La parità viene quindi riportata due volte, in due dischi diversi della stripe (contraddistinte dalle lettere p e q in figura): questo ovviamente aumenta la sicurezza dei dati, ma altrettanto ovviamente aumenta anche lo spazio occupato per la ridondanza.
In caso di guasto, valgono le stesse considerazioni fatte per il livello RAID 5.

Questo sistema necessita di un controller specifico e un numero minimo di 4 dischi.
La capacità totale del disco logico (Cld) risulterà dal prodotto della capacità del singolo disco fisico (in caso di capacità diverse nel sistema, si considera sempre quella del disco più piccolo) (Cfd) e il numero dei dischi (Nfd), meno due.
                                                                     Cld = Cfd x (Nfd-2)

Vantaggi
  • RAID 6 è sostianzialmente un'estensione di un RAID 5 che permette una tolleranza al guasto aggiuntiva grazie all'utilizzo di una seconda parità (doppia parità)
  • I dati sono ripartiti in livelli di blocchi tra tutti i dischi appartenenti al RAID, come nel RAID 5, e un secondo set di parità è calcolato e scritto tra tutti i dischi; RAID 6 fornisce un livello estremamente alto di tolleranza al guasto e può sostenere guasti multipli e simultanei dei dischi
  • In condizioni non degradate protegge da guasti di blocchi multipli
  • In condizioni degradate protegge da guasti di blocchi singoli
  • Soluzione perfetta per applicazioni mission critical
Svantaggi
  • Controller con struttura più complessa
  • Il calcolo delle parità richiede un overhead estremamente alto del controller
  • L'implementazione dello schema a doppia parità richiede due dischi aggiuntivi

Protezione del contenuto (File)

Errori Umani

Gli errori umani costituiscono la più frequente causa di perdita dei dati; tra gli esempi possono essere citati la sovrascrittura o la cancellazione involontaria di file, la formattazione accidentale, l'introduzione di virus nel sistema attraverso l'utilizzo di dispositivi mobili.

Per tutelarsi da tali inconvenienti la soluzione di prima scelta consiste nel

BACKUP DEI DATI
Il backup dei dati consiste nella creazione di una copia di riserva su dispositivi di memorizzazione di elementi presenti nella memoria fisica del computer, sia esso desktop o server.
In questo modo si crea una ridondanza, che permette il recupero di singoli file o di interi dischi in caso di perdita per errore o danneggiamento del supporto hardware originale.

E' importante che il backup venga effettuato con periodicità, manualmente o impostando automaticamente un software che si prenderà carico di eseguirlo.
Inoltre è bene che i supporti su cui vengono create le copie, siano esse cassette o altri dispositivi di memorizzazione, vengano conservati lontano dal sistema in cui i dati nativi risiedono, in modo da poterli recuperare anche in caso di disastro totale (perdita completa di tutte le componenti hardware e software del sistema).

IL NOSTRO IMPEGNO
La nostra azienda si occupa di questo tipo di servizio, prevalentemente rivolto al backup di sistemi server, attraverso l'utilizzo del software di backup VEEAM Backup & Replication.
E' possibile acquistare da noi solo il software e poi gestirlo autonomamente nella Vostra azienda , oppure al bisogno offriamo anche servizi di installazione e gestione da parte nostra.