Guida definitiva ai livelli RAID (0, 1, 5, 6, 10)

La tecnologia RAID può aumentare l’affidabilità e/o l’efficienza dell’archiviazione dei dati. Il nome RAID può essere tradotto come “gruppo ridondante di unità disco indipendenti”. Già la sua definizione ci fa capire che un sistema RAID è un sistema che combina in varie modalità, come vedremo di seguito, una moltitudine di dischi rigidi. Due o più dischi in parallelo, quindi, possono costituire un sistema RAID. Nonostante la tecnologia SSD stia guadagnando popolarità, la stragrande maggioranza dei sistemi RAID commerciali utilizzano dischi meccanici, perché hanno costo per gigabyte inferiore ed un affidabilità collaudata. Esistono diversi livelli RAID, ognuno dei quali è il più appropriato in una particolare situazione, perché si possono attuare combinazioni dischi per massimizzare la velocità, o la ridondanza (e quindi la sicurezza), o come vedremo ottenere entrambe bilanciando il numero di dischi destinato ad ospitare i dati veri e propri e quelli che invece ospitano dati utili al sistema (dischi di parità). I livelli di RAID più diffusi sono:

RAID 0 – striping
RAID 1 – mirroring
RAID 5 – striping con parità
RAID 6 – striping con doppia parità
RAID 10 – combinazione di mirroring e striping

Come si gestisce un RAID?
Il software necessario per controllare i dischi e abilitare le funzionalità RAID è contenuto in un driver o in una scheda controller separata (ovvero un controller RAID hardware). Alcune versioni di Windows, come Windows Server 2012 e Mac OS X, supportano il RAID software, cioè attuato direttamente dal sistema operativo, che non necessita quindi di alcuna scheda hardware. I controller RAID hardware hanno prestazioni migliori rispetto ai controller RAID software puri, ma sono più costosi, in particolare per creare RAID 5 o 6. Solitamente troveremo i controller RAID hardware in sistemi che fanno un utilizzo intensivo dei dati, come i server o NAS.

RAID 0

Numero dischi richiesti: da 2 in poi

Il RAID 0 richiede un minimo di 2 dischi per essere utilizzato. Suddivide i file e mette i dati in”pezzi” distribuendoli in sostanza su tutti i dischi in modo uguale, un “pezzo” per ciascuno di essi. Questo meccanismo è chiamato striping. Grazie alla lettura e scrittura simultanea dello stesso file da tutti i dischi contemporaneamente, il throughput, ovvero la velocità di lettura, è solitamente più elevata. Approssimativamente è la somma della velocità di tutti i dischi.

RAID 0 non ha alcuna ridondanza, quindi nessuna tolleranza ai guasti, in quanto tratta i dischi multipli come un’unica partizione; se un disco si danneggia, il “pezzo” del file contenuto su quel disco va perduto e quindi l’intero file risulta illeggibile. Pertanto, se per voi sono importanti le prestazioni elevate e la ridondanza è in secondo piano, questo livello dell’array è indicato.

Il livello RAID 0 presenta una serie di vantaggi.

Il RAID 0 è estremamente veloce sia in lettura che in scrittura. I controlli di parità non aggiungono alcun overhead.
Non c’è overhead perché tutta la capacità di archiviazione è stata utilizzata.
La tecnologia è semplice da usare.

Gli svantaggi del RAID 0

Il RAID 0 non è progettato per essere tollerante ai guasti. Se una delle unità dell’array RAID 0 si guasta, i dati dell’intero array andranno persi. Non dovrebbe essere utilizzato in sistemi mission-critical.

Uso ideale

Il RAID 0 è adatto per l’archiviazione di dati non critici che devono essere letti/scritti rapidamente, come ad esempio in una stazione di fotoritocco o di editing video.

RAID 1

Numero dischi richiesti: da 2 in poi

Anche il RAID 1 richiede almeno due dischi per funzionare e utilizza un meccanismo di mirroring per distribuire i dati. Il termine inglese “mirror”, ovvero “specchio”, ci fa capire rapidamente che i dati vengono scritti in maniera identica su tutti i dischi in RAID 1. Il risultato è che fornisce ridondanza dei dati e failover, ma la velocità di scrittura non è il suo punto forte. Se uno dei dischi in mirroring si danneggia, i dati intatti si trovano sul disco funzionante. Dopo aver sostituito l’unità danneggiata, il sistema RAID copierà automaticamente i dati sull’unità sostitutiva.

Pertanto, il RAID 1 è un processo conveniente per il failover dei server applicativi, ed è sistema più semplice per garantirci sicurezza dei dati anche con sole 2 unità disco.

Vantaggi del livello RAID 1

Il sistema RAID 1 ha una velocità di lettura equivalente a quella di un’unità singola e una velocità di scrittura paragonabile a quella di un’unità singola.
I dati non devono essere ricostruiti in caso di guasto di un’unità, ma solo trasferiti sull’unità sostitutiva. Di solito se ne occupa il sistema in maniera automatica.
Il RAID 1 è una tecnica semplice, realizzabile anche soltanto con 2 unità.

Svantaggi del livello RAID 1

Lo svantaggio principale è che, poiché ogni dato viene scritto due volte, la capacità di archiviazione effettiva è solo la metà dell’intera capacità dell’unità. Ovvero con 2 dischi da 16TB, avrete soltanto 16TB di spazio effettivo, e non 32TB.
Con le soluzioni RAID 1 software non è sempre possibile effettuare uno cambio al volo (hot-swap) del disco in avaria. Ciò significa che il disco danneggiato potrà essere sostituito solo dopo che il computer/server a cui è collegato sia stato spento. Questo potrebbe non essere accettabile in certe situazioni, come per i server utilizzati da un gran numero di utenti contemporaneamente.

Uso ideale di questo livello RAID

RAID-1 è una scelta eccellente per lo storage mission-critical, come i sistemi di contabilità o per conservare dati con una certa garanzia di sicurezza. È molto diffuso sui sistemi NAS, anche casalinghi (leggasi: economici), che difatti offrono due slot.

RAID 5

Numero dischi richiesti: da 3 in poi

RAID 5 distribuisce lo striping e la parità a livello di blocco, il che significa che il sistema RAID calcola i suoi valori per creare un blocco di parità che utilizza per recuperare i dati in striping da un disco guasto. Semplificando, a partire da un file, esso viene suddiviso su più dischi (come per il RAID 0) ma in più c’è un disco che conserva delle informazioni per ricostruire il file nel caso che uno degli altri dischi si rompa. In questo tipo di configurazione, 1 disco di occupa di gestire la parità, mentre tutti gli altri sono destinati ai dati.

Di conseguenza, il sistema RAID 5 è in grado di resistere alla perdita al massimo di 1 disco dell’array, mentre le prestazioni dell’array rimangono elevate (tutti i dischi dell’array infatti servono simultaneamente le richieste di scrittura).

Vantaggi del livello RAID 5

Le transazioni di dati in lettura sono veloci, mentre le operazioni di scrittura richiedono un po’ più di tempo (a causa della parità che deve essere calcolata).
Anche in caso di guasto di un’unità, è possibile accedere a tutti i dati mentre l’unità guasta viene sostituita e i dati sull’unità sostitutiva vengono ricostruiti dal controller di archiviazione.

Svantaggi del livello RAID 5

Sebbene i guasti alle unità riducano il throughput, la velocità di trasferimento rimane “accettabile”.
Si tratta di una tecnologia complicata. Se uno dei dischi di un array da 16 TB muore e deve essere sostituito, il recupero dei dati (il tempo di ricostruzione) può richiedere un giorno o più, a seconda del carico dell’array e delle prestazioni del controller. Se un altro disco si guasta in quel periodo, i dati sono definitivamente persi.

Uso ideale di questo livello RAID

Il livello RAID 5 è una soluzione completa ed efficace che offre uno storage efficiente, una sicurezza robusta e prestazioni adeguate. È perfetto per i server di file e applicazioni che hanno solo pochi dischi di dati.

RAID 6

Numero dischi richiesti: da 4 in poi

RAID 6 utilizza un meccanismo di striping a doppia parità, utilizzando un minimo di quattro dischi. Il sistema memorizzerà, per ogni file, un blocco di parità + un blocco di parità extra. Possiamo quindi affermare che un RAID 6 è un RAID 5 con una parità in più: ciò significa che i dischi destinati a questo scopo saranno 2. Questo implica che due dischi possono guastarsi prima che l’intero l’array diventi non disponibile e i dati inaccessibili. Poiché questo array ha un costo più elevato, viene utilizzato nei server applicativi e negli array di archiviazione di grandi dimensioni.

Si otterrà un’elevata ridondanza, prestazioni e tolleranza ai guasti.

Vantaggi del livello 6 di RAID

I trasferimenti di dati in lettura sono molto rapidi, proprio come nel caso del RAID 5.
Anche se due unità si guastano, è possibile accedere a tutti i dati fino alla sostituzione delle unità guaste. Di conseguenza, il livello RAID 6 è più sicuro del livello RAID 5.

Svantaggi del RAID 6

A causa dei dati di parità aggiuntivi che devono essere calcolati, le operazioni di scrittura dei dati sono più lente rispetto a RAID 5. Le prestazioni di scrittura sono inferiori di circa il 20%.
Anche se i guasti alle unità riducono il throughput, questo è ancora accettabile.
Si tratta di una tecnologia più “complicata”. Potrebbe essere necessario molto tempo per ricostruire un array dopo il guasto di un disco.

Uso ideale

Il livello 6 di RAID è una soluzione completa ed efficace che offre uno storage efficiente, una sicurezza robusta e prestazioni adeguate. È preferibile al RAID 5 nei server di file e applicazioni che memorizzano i dati su molti dischi grandi.

RAID 10 (o RAID 1+0)

Numero dischi richiesti: da 4 in poi

RAID 10 utilizza lo striping e il mirroring e richiede un minimo di quattro unità nell’array. Se si utilizza un array di quattro dischi, il sistema esegue lo striping dei dati su due dischi e gli altri due dischi eseguono il mirroring dei dischi sottoposti a striping, ciascuno dei quali contiene metà dei dati. Come il nome suggerisce, è la combinazione di un RAID 0 “specchiato” in un RAID 1.

Questo livello RAID garantisce un’elevata sicurezza dei dati e prestazioni elevate.

Vantaggi di RAID 10

Se uno dei dischi di una configurazione RAID 10 si guasta, il tempo di ricostruzione è minimo, poiché è sufficiente replicare tutti i dati dal mirror superstite a un nuovo disco. Per le unità da 1 TB, questo può richiedere anche solo 30 minuti.

Svantaggi del RAID 10

Il mirroring consuma metà dello spazio di archiviazione, rendendo questo metodo di ridondanza più costoso rispetto agli array RAID 5 o RAID 6 di grandi dimensioni.

RAID su SSD

Sì, le unità SSD possono essere utilizzate su RAID tradizionali. Molto probabilmente si otterranno prestazioni migliori rispetto all’utilizzo di unità disco. Tuttavia, alcuni fornitori di SSD hanno sviluppato le proprie funzioni RAID flash (Pure Storage RAID-3D e Dell XtremIO Data Protection) per fornire prestazioni elevate e ridondanza dei dati. Teniamo presente però che gli SSD hanno una “vita dichiarata” di Terabyte che possono essere scritti sull’unità (TBW), un numero cioè di dati scritti oltre le quali l’unità potrebbe non più funzionare. Sebbene questo valore non sia affatto dichiarato per le unità meccaniche, negli SSD è solitamente molto inferiore.

Altri tipi di livelli RAID

Altri tipi di RAID sono utilizzati in misura minore, ma sono ancora presenti sul mercato.

Ad esempio, il RAID 2, oggi raramente utilizzato, utilizza una tecnologia di striping a livello di bit e non di blocco. Questo livello dell’array utilizza un tipo complesso di codice di correzione degli errori che sostituisce la parità. In questo caso è impossibile servire più richieste contemporaneamente.

Anche il RAID 3 è usato raramente, utilizza lo striping e la parità a livello di byte e memorizza i calcoli di parità su un disco dedicato. Inoltre, non può servire più richieste contemporaneamente e questo fenomeno rallenta i carichi di lavoro ad accesso casuale.

RAID 4 è simile a RAID 5 in quanto esegue lo striping dei dati a livello di blocco e alloca il disco per la parità. La scrittura in lettura è elevata, ma le prestazioni di scrittura casuale ne risentono.

In conclusione, va aggiunto che il RAID protegge certamente la disponibilità e la ridondanza dei dati, ma non riconosce e ancor più non risolve la corruzione dei file. Pertanto, i professionisti IT dovrebbero sempre eseguire il backup o disporre di uno strumento di ripristino dell’array dedicato.

Ricostruzione

Quando un’unità si guasta in un sistema RAID ridondante, i dati devono essere ricostruiti una volta sostituita l’unità guasta. Questa operazione richiede più tempo man mano che le unità diventano più grandi. L’array non è completamente ridondante mentre l’unità è in fase di ricostruzione; è infatti considerato “degradato”.

Quando un array è degradato, spesso la ridondanza è scarsa o nulla, le prestazioni diminuiscono in modo significativo e le unità sono sottoposte a stress in quanto contribuiscono ai dati per la ricostruzione.

I sistemi di mirroring non ne risentono più di tanto, poiché è necessario un solo disco per ricostruire l’unità in mirroring, ma le prestazioni dei sistemi basati sulla parità, come RAID 5 e RAID 6, ne risentono drasticamente perché i dati devono essere ricostruiti al volo utilizzando i calcoli di parità.

Altro fattore da tenere in considerazione è che i tempi di ricostruzione di un RAID 5 crescono di pari passo con le capacità delle unità, fino a richiedere ore o addirittura giorni per recuperare i dati da un disco perso.

Le unità per una configurazione RAID vengono solitamente acquistate insieme e dallo stesso lotto di produzione, quindi hanno caratteristiche di guasto comparabili. Ovvero se un lotto è difettato, lo saranno anche tutti i dischi! Poiché tutte le unità dell’array lavorano insieme come un’unità, non è raro che un’altra unità mediocre si guasti nello stesso set allo stesso momento. Il RAID 6 è stato sviluppato proprio per superare gli inconvenienti del RAID 5, aggiungendo in sostanza un disco in più per tollerare la rottura di 2 dischi contemporaneamente.

Conclusioni

Con uno sguardo generale, RAID 10 offre le prestazioni e la ridondanza più elevate, ma riduce della metà la capacità utilizzabile, rendendo costoso il funzionamento su grande scala. Il RAID 1offre un buon bilanciamento di sicurezza, perché fornisce una ridondanza 2N, con la possibilità che fino alla metà dei dischi si guasti. È sicuramente una soluzione adatta a server con prestazioni basiche, e ai NAS, sia in ambiente di lavoro che a casa.
Quando invece è richiesta una grande quantità di spazio di archiviazione ed è presente un numero elevato di dischi, si ricorre spesso a RAID 6. Viene fornita una ridondanza N+2. Per la sua enorme capacità e tolleranza ai guasti, il RAID 6 è ampiamente utilizzato all’interno di dispositivi di archiviazione su larga scala di EMC, IBM e altri, anche se in genere è velocizzato da cache o SSD che “aiutano” i colli di bottiglia prestazionali. Quando si dispone di un enorme volume di dati che deve essere ridondato, RAID 5 e 6 sono sicuramente la scelta più vantaggiosa. I database e i grandi volumi di archiviazione sono esempi comuni.
Il RAID 0, infine, è raramente utilizzato in ambito aziendale a causa della totale mancanza di ridondanza (il guasto di una singola unità fa perdere l’intero array), anche se può essere appropriato in alcune circostanze. Può essere utile, ad esempio, per i server di caching, se i dati memorizzati sono irrilevanti e facilmente sostituibili, ma sono necessarie grandi prestazioni.

Cancellazione accidentale dei dati, corruzione del disco, incidenti, sono le cause più frequenti di perdita di dati RAID. Data la natura professionale di queste soluzioni, il recupero dei dati persi ed il ripristino del sistema risultano spesso vitali per imprese ed organizzazioni.

Il recupero dati RAID non è certamente consigliato per i dilettanti. Italia Assistance ha recuperato con successo i dati da sistemi RAID e dai dispositivi di archiviazione più diffusi.

Se stai cercando un partner competente ed affidabile per il recupero dei tuoi dati importanti, contatta il nostro team compilando il modulo, scrivendoci all’indirizzo info@italyassistance.it o telefonando al numero 0828 1842949.