TECNOLOGIA

NAS e configurazioni RAID

Un Network Attached Storage (NAS) è un dispositivo collegato alla rete la cui funzione è quella di consentire agli utenti di accedere e condividere una memoria di massa, in pratica costituita da uno o più dischi rigidi, all'interno della propria rete o dall'esterno.

La platea dei potenziali utilizzatori di un dispositivo NAS è davvero ampia: dalla piccola azienda allo studio professionale, fino ad arrivare al singolo utente Soho (small office/home office) o a quello domestico evoluto. Fino a pochi anni fa era frequente, e in alcuni casi non del tutto errato, associare il termine NAS al più semplice concetto di disco di rete, ma oggi questa descrizione è quanto mai imprecisa e limitativa.

Un NAS moderno è principalmente un server di storage in grado di fornire all’utente tutte i servizi per la gestione centralizzata dello spazio di archiviazione in una rete informatica, ma è in grado di fare molto di più. Alle funzioni classiche e fondamentali come la condivisione in rete di file e cartelle e l’archiviazione centralizzata dei dati si affiancano servizi evoluti che permettono la connessione remota tramite VPN (Virtual Private Network), servizi FTP (File Transfer Protocol) anche attraverso interfaccia grafica. Con la diffusione dei servizi cloud sono state implementate funzioni per la sincronizzazione automatica con i servizi di storage nel cloud; ancora, alcuni modelli di NAS (anche quelli economici) permettono di installare macchine virtuali e server locali per realizzare e mantenere siti web per lo sviluppo o per i quali non è necessario, in termini di potenza e connettività, affidarsi a un servizio di hosting esterno. Una funzione che ha preso piede con la diffusione delle videocamere di rete a basso costo è quella fornire un server di registrazione per la videosorveglianza. Insomma, i NAS sono il complemento ideale per una struttura di rete all’interno della quale si gestiscono grandi quantità di informazioni e che deve essere in grado di garantire continuità operativa riducendo al tempo stesso il rischio di perdita dei dati. I dischi, ovvero i supporti fisici sui quali sono scritti, risiedono e sono letti i dati, sono i componenti principali e più importanti di un NAS.

Lo stress su questi componenti deriva dal tempo di attività, dal numero di accessi in lettura e scrittura. Anche in ambito domestico lo stress sui dischi può essere elevato se si eseguono frequenti registrazioni (è il caso della videosorveglianza) oppure se si utilizza il NAS come server per lo streaming video. Sul mercato sono disponibili modelli già equipaggiati di dischi, ma spesso è più vantaggioso acquistare un apparato vuoto e scegliere in modo autonomo i supporti da inserire. Questa operazione implica però che siate voi a effettuare la scelta dei dischi e la successiva configurazione del NAS. La scelta dei dischi è una fase critica: i modelli specifici per utilizzo NAS hanno un costo superiore ma caratteristiche di affidabilità operabilità che i modelli standard non garantiscono.

I dischi non sono tutti i uguali e non intendiamo solo per capacità di archiviazione o prestazioni pure. I modelli per un utilizzo desktop sono progettati per ottimizzare i consumi o le prestazioni, mentre non sono pensati per l’operatività 24x7, ovvero continuativa dal momento dell’accensione. Per garantire un tale livello di affidabilità sono necessari materiali, soluzioni tecniche hardware e software differenti da quelle impiegate in ambito consumer e che non sempre permettono di ottenere il minor consumo energetico, la maggiore densità di registrazione per piatto e le migliori prestazioni in termini assoluti. Quello che sì ottiene scegliendo un disco pensato in modo specifico per i NAS è una maggiore affidabilità nel tempo e la capacità di operare in configurazioni dove più dischi lavorano in spazi ristretti e dove la temperatura e le vibrazioni possono essere fonte di malfunzionamenti. Il nostro consiglio, quindi, è di equipaggiare sempre un NAS con dischi pensati in modo specifico per questo utilizzo, in modo particolare se il NAS opera in modo continuativo.

Di seguito alcuni modelli consigliati:

NAS

 

NAS Hard Disks

 

In informatica il RAID, acronimo di "Redundant Array of Independent Disks" ovvero insieme ridondante di dischi indipendenti, è una tecnica di installazione raggruppata di diversi dischi rigidi in un computer (o collegati ad esso) che fa sì che gli stessi nel sistema appaiano e siano utilizzabili come se fossero un unico volume di memorizzazione. Gli scopi del RAID sono: aumentare le performance, rendere il sistema resiliente alla perdita di uno o più dischi e poterli rimpiazzare senza interrompere il servizio. Il RAID sfrutta, con modalità differenti a seconda del tipo di realizzazione, i principi di ridondanza dei dati e di parallelismo nel loro accesso per garantire, rispetto ad un disco singolo, incrementi di prestazioni, aumenti nella capacità di memorizzazione disponibile, miglioramenti nella tolleranza ai guasti e quindi migliore affidabilità.

Le catene RAID più diffuse in ambito domestico o del piccolo ufficio sono quelle che utilizzano i livelli o schemi base 0, 1 e 5. Tali soluzioni consentono di sfruttare i dischi presenti per incrementare le prestazioni e garantire l’accessibilità alle informazioni in caso di malfunzionamento di un disco (ad eccezione del Raid 0). A fianco delle catene RAID che utilizzano schemi di tipo base, esistono soluzioni – definite come livelli nidificati – che combinano più livelli RAID tra loro, come ad esempio il livello 10 (o 1+0); in questo caso la catena RAID è generata utilizzando come elementi base non i singoli dischi, bensì altre catene RAID con lo scopo di migliorare le caratteristiche di sicurezza e prestazioni dell’intero sistema. La notazione standard prevede l’utilizzo di un numero che identifica la struttura della catena con una sequenza di cifre a partire dal livello RAID più nidificato, a salire fino a quello più esterna; in alternativa è possibile utilizzare una notazione con le cifre separate dal simbolo “+”.

Tutte le strutture RAID che sopportano il guasto di una o più unità disco permettono di accedere in modo continuativo ai dati, ma richiedono una manutenzione tempestiva. Ritardare la sostituzione di un’unità danneggiata espone al rischio concreto di perdere in modo irreversibile l’intero archivio di informazioni, in quanto una catena RAID degradata – a meno che non si considerino livelli nidificati che sopportano più guasti in simultanea – non offre più la protezione contro ulteriori guasti. L’utilizzo di un disco di spare (disco di ricambio conosciuto dal sistema), sebbene permetta di iniziare subito la ricostruzione dei dati presenti sul disco non funzionante, non deve trarre in inganno: il processo di ricostruzione di un disco di grandi dimensioni può richiedere parecchie ore e durante questo intervallo di tempo l’affidabilità dell’intera catena RAID è compromessa. Per questo motivo è consigliabile creare e aggiornare con sufficiente frequenza una copia di backup dell’intero archivio o perlomeno dei dati sensibili. Durante la fase di ricostruzione dei dati è consigliabile, inoltre, limitare il numero di accessi alla catena RAID per non rallentare il processo di riparazione. Una buona politica di prevenzione per catene RAID di dimensioni contenute è quella di avere a disposizione almeno un disco di emergenza, anche nel caso di soluzioni che prevedono la presenza di un disco di spare.

 

RAID 0

Il RAID di livello 0, chiamato anche stripe, utilizza due o più dischi in parallelo e opera dividendo i dati in blocchi logici di dimensione predefinita – solitamente compresa tra 1 e 128 Kbyte – che sono scritti in maniera concorrente su tutte le unità della catena RAID. Tale approccio permette di frammentare i file in piccoli blocchi e di scrivere ciascuno di questi alla velocità propria del disco di destinazione. Lo schema operativo di una catena RAID 0, ovvero la suddivisione dei dati in modo coordinato e logico su tutti i volumi disponibili, impone l’utilizzo di dischi di uguale dimensione tra loro; nella fase di costruzione del volume RAID la dimensione del volume fisico più piccolo è determinata dalla dimensione dei volumi sugli altri dischi. La capacità totale della catena RAID 0 è pari a quella del disco più piccolo moltiplicata per il numero di dischi utilizzati. Per questo motivo si consiglia l’utilizzo di dischi identici tra loro sia per capacità sia per prestazioni, così da non sprecare spazio e da non determinare differenze evidenti durante le fasi di scrittura e lettura dei dati. Vale la pena ricordare inoltre che il RAID di livello 0, pur essendo da tempo entrato a far parte della nomenclatura tradizionale, non è un RAID vero e proprio, in quanto manca per costruzione pratica la parte ridondante dei dati. Una catena Raid 0 presenta, infatti, un’elevata vulnerabile ai guasti poiché la perdita di un solo disco comporta l’immediata corruzione di tutto il volume. La probabilità di guasto aumenta, inoltre, al crescere del numero di dischi che compongono la catena stessa.

 

RAID 1

Il livello RAID 1 corrisponde al modo più semplice di pensare e implementare la ridondanza dei dati e, proprio per questa semplicità, è stato il primo ad essere proposto; il livello 0 accennato in precedenza è successivo, ed il nome deriva dalla non completa appartenenza alla famiglia RAID. Il RAID 1 opera secondo uno schema – definito mirror o specchio – nel quale i dati sono replicati in modo perfetto su uno o più dischi che compongono la catena. Questo approccio garantisce la massima ridondanza della informazioni e la massima tolleranza ai guasti: in una catena RAID 1, composta da due o più unità, è sufficiente l’operatività di un singolo disco per avere accesso a tutte i dati; ciò significa che questo livello RAID può tollerare il gusto di tutti i dischi tranne uno per garantire l’integrità delle informazioni. Di contro la capacità complessiva di un archivio RAID configurato in RAID 1 è pari alla capacità del disco più piccolo impiegato in quanto tutti i dischi sono una copia degli altri. Considerando che la prassi prevede l’utilizzo di dischi di pari dimensioni, la capacità di un RAID 1 è pari a quella di un singolo disco, e lo spreco di spazio è di conseguenza massimo. Utilizzando un sistema RAID 1 la corruzione di un disco non comporta dunque perdita di dati, e la sostituzione con un disco nuovo può essere spesso eseguita "a caldo", con il controller che si occuperà di ricostruire la catena copiando tutti i dati anche sulla nuova unità collegato.

 

RAID 5

Il RAID di livello 5 corrisponde alla implementazione di base più complessa di un volume con ridondanza dei dati. A differenza dei due schemi precedenti, l’algoritmo utilizzato dal livello 5 permette di incrementare contestualmente le prestazioni e la disponibilità dei dati. Il numero minimo di dischi utilizzabili sale però a tre e la capacità utile è pari alla somma delle capacità (minima) dei dischi utilizzati, con l’esclusione della capacità di un’intera unità. Se, ad esempio, si costruisce il RAID 5 con tre dischi da 1 Tbyte, la capacità complessiva sarà quindi di 2 Tbyte. La logica di questo livello deriva da un concetto classico nell’informatica, quello della parità. L’algoritmo del RAID 5 prevede una suddivisione dei dati in maniera simile a quella del RAID 0 – la dimensione tipica dei blocchi logici è di 64 Kbyte – distribuiti in seguito su tutti i dischi appartenenti alla catena ad eccezione di uno. Su quest’ultimo, nella stessa posizione logica in cui sono contenuti i dati negli altri dischi, il controller provvede a scrivere una sequenza di bit definiti "di parità". Nella pratica la sequenza è la somma logica sul singolo bit (XOR logico) dei dati presenti in quella specifica posizione sugli altri dischi. L’operazione di XOR restituisce come valore 1 se il numero di "1" sommati è dispari, mentre ha valore 0 se il numero di "1" sommati è pari; questo comporta che il numero totale di 1 – compreso il bit di parità – sia sempre pari. Il bit di parità non è utilizzato durante le normali operazioni di lettura, ma solo in caso di guasto di un disco. In questa situazione il controller, non riuscendo a recuperare un dato presente su un disco in particolare, può effettuare l’operazione di XOR logico sui bit presenti (compreso quello di parità), contando in pratica quanti "1" sono presenti sugli altri dischi in quella particolare posizione. Per via della parità del valore 1 imposta proprio tramite il bit di parità è possibile recuperare il dato corrotto: se il numero di 1 è pari risulterà che il dato mancante è uno "0", mentre se è dispari è un "1". Il RAID 5 funziona di conseguenza anche in caso di rottura di un disco appartenente alla catena. La ricostruzione della catena è un procedimento semplice, ma che può richiedere molto tempo: collegando un nuovo disco in sostituzione di quello guasto il controller provvede a ricostruirne l’intero contenuto effettuando l’operazione di XOR su tutti i dati presenti negli altri dischi, scrivendo di conseguenza sul nuovo arrivato sia i dati persi sul disco precedente sia i valori di parità di quelli salvi sui dischi restanti. Oltre all’implementazione base è possibile implementare un livello RAID definito come 5e, dove la "e" identifica la modalità Enhanced che prevede l’utilizzo di un disco supplementare chiamato spare; quest’ultimo interviene in automatico in caso di rottura e permette di una più rapida ricostruzione della catena RAID.

 

RAID 10

Il livello 10, conosciuto anche come 1+0, è la più semplice catena RAID di tipo annidato disponibile, tanto che è stata una delle prime ad essere supportata anche dai controller del chipset delle schede madri in quanto non richiede il calcolo della parità da parte del processore – in caso di un desktop – o di un motore XOR dedicato. Il RAID 10 utilizza delle sicure catene RAID 1 come elementi costituenti di un veloce RAID 0. Questo permette di avere prestazioni di altissimo livello (in base ai rami della catena RAID 0) con un livello di accessibilità molto elevato (in base al numero di rami delle catene RAID 1). A differenza di un RAID 0 tradizionale, il cui inconveniente principale è rappresentato da una notevole vulnerabilità ai guasti – la rottura di un solo disco compromette l’intera catena e i dati contenuti – il RAID 10 adotta elementi base con prestazioni simili a quelle di un singolo disco, ma con una tolleranza ai guasti ben superiore. A differenza del RAID 5 non sono necessari calcoli particolari per il salvataggio dei dati e la rottura di un elemento non pregiudica le prestazioni generali. La tolleranza al guasto dipende dal numero di elementi presenti nelle catene RAID 1; il sistema continua a funzionare finché in ogni ramo del RAID 0 è attivo almeno un disco. Le configurazioni più diffuse prevedono l’utilizzo di quattro dischi (due rami RAID 0 con elementi composti da due dischi in RAID 1) oppure sei dischi, con due o tre rami RAID 0 in base alle prestazioni e alla sicurezza desiderata.

 

Fonte:

PC Professionale Ottobre 2017 - pp.98-103