I sei livelli di archiviazione dei dati primari

Poiché i nostri dati continuano a crescere a un ritmo quasi esponenziale, i fornitori di storage hanno risposto con prodotti sempre più economici e capaci. Ma la spinta per una maggiore capacità e prezzi più bassi ha confuso le acque.

Non molto tempo fa, se avessi acquistato un dispositivo di archiviazione multiterabyte, sarebbe stato quasi sicuramente una SAN di classe enterprise altamente affidabile, ad alte prestazioni. Oggi puoi bloccare la stessa quantità di spazio di archiviazione in un desktop tower per una piccola frazione del costo. Di conseguenza, molti prodotti di storage vengono commercializzati come storage "SAN" quando non sono molto migliori di un desktop in termini di prestazioni e affidabilità.

[Passa direttamente alle notizie chiave per lo sviluppo tecnologico e la gestione IT con il nostro riepilogo una volta al giorno delle principali notizie tecnologiche. Iscriviti alla newsletter quotidiana. ]

Più che mai, è importante avere una solida comprensione di quali forme può assumere lo storage primario e cosa le differenzia. In termini approssimativi, la scala di stoccaggio principale può essere suddivisa in sei gradini distintivi. Chi sei e cosa fai determinerà la tua migliore opzione.

Archiviazione dati primaria, ramo 1: Peer to peer

Utenti: da 2 a 10

Costo: Bupkus

Ridondanza: nessuna

Il concetto di archiviazione primaria peer-to-peer dovrebbe essere familiare a chiunque possieda un computer. In sostanza, la stazione di lavoro di ogni utente memorizza i propri dati. Nel caso in cui i dati debbano essere condivisi, la tecnologia integrata nel sistema operativo consente ad altri di vedere quei dati. È economico e incredibilmente semplice.

Per i privati ​​e le aziende molto piccole, questa è spesso l'opzione migliore. Dato che ci sono oltre 5 milioni di aziende solo negli Stati Uniti con meno di 10 dipendenti, lo storage peer-to-peer rappresenta un'enorme percentuale di tutto lo storage dei dati. Man mano che un'azienda cresce, la gestione di più isole di archiviazione inaffidabili può diventare sempre più difficile. Anche la maggior parte dei sistemi operativi desktop non offre molto in termini di sicurezza unificata, quindi questo modello è difficile da supportare in modo sicuro al di là di pochi utenti.

Archiviazione dati primaria, ramo 2: il file server

Utenti: da 10 a centinaia

Costo: da $ 2.000 a $ 5.000

Ridondanza: bassa

Esempi: Microsoft Windows Server, Buffalo TeraStation III

Il prossimo passo logico oltre l'archiviazione primaria decentralizzata basata su workstation è la combinazione di tutti i dati condivisi su un unico server dedicato. In questo modo, le aziende possono standardizzare i propri modelli di protezione e sicurezza dei dati su tutti i dati mission-critical. La centralizzazione dei dati rende anche più economico investire in ridondanza, sia che si tratti di array di dischi ridondanti o di alimentatori.

La maggior parte dei file server è esattamente questo: un server standard del settore con un sistema operativo server generico e molti dischi collegati direttamente dedicati alla condivisione dei file. Tuttavia, anche molti dispositivi NAS di fascia bassa rientrano in questa categoria. Poiché questo tipo di dispositivo NAS diventa sempre più diffuso nelle aziende di tutte le dimensioni, è importante notare che sono essenzialmente gli stessi di un file server.

A un certo punto, però, un'azienda diventerà troppo grande per un singolo file server o dispositivo NAS. Di solito, l'approccio più comune consiste nell'aggiungere più file server. Man mano che questa pratica continua, emergono di nuovo gli stessi problemi che affliggono lo storage peer-to-peer. Invece di mantenere un unico pool di archiviazione, ora hai il compito di gestirne molti. Allo stesso modo, l'esposizione alla perdita di dati dovuta a guasti hardware si moltiplica all'aumentare del numero di dispositivi.

Anche i file server e i dispositivi NAS sono poco adatti per l'archiviazione di dati strutturati a livello di blocco come database ed e-mail. Queste applicazioni sono generalmente costruite sui propri server con il proprio storage collegato direttamente, il che complica ulteriormente la sfida della gestione dello storage.

Archiviazione dati primaria, ramo 3: SAN di fascia bassa (un file server con qualsiasi altro nome)

Utenti: da 10 a centinaia

Costo: da $ 2.000 a $ 20.000

Ridondanza: bassa

Esempi: derivati ​​di Microsoft Windows Storage Server, Overland SnapServer

Nel tentativo di affrontare la sfida della gestione simultanea di dati aziendali strutturati e non strutturati, molti fornitori di storage sono usciti con dispositivi SAN di fascia bassa che consentono di archiviare dati a livello di blocco e file sullo stesso dispositivo. Il vantaggio dell'utilizzo di questo tipo di dispositivo è che tutti i dati di un'azienda - condivisioni di file, database, posta elettronica, infrastrutture di virtualizzazione e così via - possono essere combinati nello stesso pool di archiviazione e gestiti e protetti insieme.

Ma questi dispositivi, sebbene tecnicamente SAN (la maggior parte di essi supporta iSCSI per consentire l'accesso remoto allo storage a livello di blocco), in realtà non sono altro che un server standard con un software diverso per consentire al dispositivo di servire le richieste iSCSI oltre al file serving . In generale, non offrono più ridondanza di un normale server, né scalano oltre un normale server in termini di prestazioni.

In breve, questi dispositivi possono consentire di gestire in modo efficiente tutte le esigenze di archiviazione, ma mancano delle prestazioni, della scalabilità e dell'affidabilità delle SAN di classe enterprise.

Archiviazione dati primaria, ramo 4: SAN di classe enterprise

Utenti: da 50 a migliaia

Costo: da $ 20.000 a milioni

Ridondanza: alta

Esempi: EMC Clariion / Symmetrix, Netapp FAS, Dell EqualLogic, IBM DS, HP EVA / XP

Invece di utilizzare hardware e software per server standard del settore, le SAN di classe enterprise impiegano architetture a doppio controller altamente ridondanti, che vantano funzionalità come cache con mirroring e interfacce di interconnessione ridondanti. Allo stesso modo, anche le SAN di classe enterprise sono altamente scalabili, supportando un livello di capacità molto più elevato e prestazioni di gran lunga superiori rispetto ai loro fratelli di fascia bassa.

Questo campo di dispositivi include non solo la tipica SAN a livello di blocco, ma anche dispositivi NAS multicontroller di fascia alta in grado di fornire dati a livello di blocco e file con la stessa ridondanza e prestazioni. Inoltre, questi dispositivi consentono agli amministratori di archiviazione di combinare diverse capacità e velocità di supporti di archiviazione fisici (sia dischi che SSD), rendendo possibile presentare il giusto tipo di archiviazione a ciascun consumatore di archiviazione pur mantenendo un'architettura di gestione unificata.

Solo pochi anni fa, il livello di accesso per questo tipo di dispositivo era ben superiore a $ 50.000. Quel prezzo è caduto precipitosamente. Di conseguenza, il numero di aziende che possono permettersi di possedere una SAN è notevolmente aumentato.

Archiviazione dati primaria, ramo 5: virtualizzazione dell'archiviazione basata sulla rete

Utenti: da migliaia a decine di migliaia (e oltre)

Costo: il limite è il cielo

Ridondanza: Cadillac

Esempi: EMC Invista, HP SVSP, NetApp V-series

Per quanto scalabili e ridondanti siano le SAN di classe enterprise, le aziende più grandi finiranno per diventare troppo grandi per una singola piattaforma SAN e dovranno mettere in campo più SAN per raggiungere i livelli di prestazioni e affidabilità di cui hanno bisogno. Mentre questo accade, le stesse inefficienze - sia in termini di capacità che di gestione - fanno nuovamente capolino. Per combattere questo problema, le grandi aziende spesso utilizzano la virtualizzazione dello storage basata sulla rete per unificare piattaforme di storage SAN eterogenee in un'unica infrastruttura logica.

In sostanza, la virtualizzazione dello storage implica l'introduzione di un livello di astrazione tra i consumatori di storage (sia singoli utenti che server di tutte le forme e dimensioni) e dispositivi di storage fisici. Questo livello di astrazione consente una maggiore libertà nella gestione di infrastrutture di archiviazione di grandi dimensioni consentendo agli amministratori di replicare e migrare in modo trasparente i dati senza che i consumatori di archiviazione se ne rendano conto. La virtualizzazione dello storage fornisce anche capacità quasi illimitate e scalabilità delle prestazioni.

Archiviazione dati primaria, ramo 6: Wild card - il cloud

Utenti: variabile

Costo: variabile

Ridondanza: variabile

Esempi: Amazon S3, Mosso / Rackspace Cloud Files

Il nuovo arrivato nel campo dello storage primario non è tanto una nuova forma di hardware o software di storage, ma un modello di consegna dello storage completamente diverso. Invece di acquistare un dispositivo di archiviazione adatto alle esigenze della tua organizzazione e quindi inevitabilmente aggiornarlo in fasi man mano che cresci, la promessa dell'archiviazione basata su cloud è che ti consente di pagare per lo spazio di archiviazione che stai utilizzando quando lo stai utilizzando e scalare elasticamente senza limiti.

Sebbene lo storage basato su cloud non sia ampiamente utilizzato dalle aziende, pochi dubitano che maturerà e alla fine giocherà un ruolo enorme nel futuro dello storage. Le sfide attuali includono convincere i clienti che le alternative basate sul cloud sono sufficientemente affidabili da supportare le esigenze mission-critical dell'azienda - gli accordi sul livello di servizio tendono ad essere meno che rassicuranti - e superare gli ostacoli di sicurezza e normativi che sorgono quando i dati sensibili sono archiviati presso terzi.

Questo articolo, "I sei livelli di archiviazione dati primaria", è apparso originariamente su .com. Leggi di più sul blog di Matt Prigge sul sovraccarico delle informazioni e segui gli ultimi sviluppi nello storage di rete e nella gestione delle informazioni su .com.