Cosa significa davvero archiviazione iperscalabile

Sia chiaro: Hyperscale non riguarda quanto sei grande.

Le organizzazioni non devono essere enormi per sfruttare soluzioni iperscalabili. Ma questo è esattamente ciò che pensano molti professionisti dell'infrastruttura IT, delle operazioni e del devops quando apprendono per la prima volta l'iperscalabilità.

La convinzione prevalente è che l'architettura hyperscale sia pensata per infrastrutture estremamente grandi, come quelle gestite da LinkedIn, Amazon o Netflix, perché si adatta a migliaia di istanze e petabyte di dati. A quanto pare, è meglio pensare all'iperscalabilità come a descrivere un approccio piuttosto che alle dimensioni . Si tratta di automazione, orchestrazione e creazione di IT che si ridimensiona in modo intelligente quando l'azienda ne ha bisogno. Le distribuzioni iperscalabili possono e devono iniziare in piccolo, quindi scalare indefinitamente. Dovrebbero anche consentire di ridimensionare in modo indipendente solo la parte dell'infrastruttura che ne ha bisogno, il che è in contrasto con un'altra tendenza emergente dei data center aziendali, l'iperconvergenza.

Ancora confuso? Se è così, non sei solo. Immergiamoci un po 'più a fondo.

Definizione di iperscalabilità

Il concetto di costruire un'architettura iperscalare è confuso da molti termini tangenziali. In particolare, vediamo i clienti confusi riguardo all'infrastruttura iperconvergente, iperscalabile (o su scala Web), convergente, definita dal software e basata sulle merci.

Prendiamoci un momento per chiarire le definizioni su questi termini ingrediente:

  • Definito dal software: infrastruttura in cui la funzionalità è completamente disaccoppiata dall'hardware sottostante ed è sia estensibile che programmatica. Leggi questo post per la nostra elaborazione in particolare sull'archiviazione definita dal software.
  • Commodity-based: infrastruttura costruita su una commodity o un'infrastruttura standard del settore, solitamente un server blade o rack x86. Come abbiamo scritto in passato, non confondere la merce con il basso costo.
  • Convergenza: un'architettura scale-out in cui i componenti di server, storage, rete e virtualizzazione / containerizzazione sono collegati insieme come una soluzione pretestata e pre-integrata. I componenti sono ancora distinti in questa architettura.
  • Iperconvergente: un'architettura scale-out che porta l'infrastruttura convergente un passo avanti combinando componenti definiti dal software su hardware di base, confezionata come un'unica soluzione, spesso una singola appliance. I componenti non sono più distinti.
  • Hyperscale: un'architettura scale-out che è anche definita dal software e basata su commodity, ma in cui le risorse di server, storage, rete e virtualizzazione / containerizzazione rimangono separate. Ogni componente è distinto e può essere ridimensionato in modo indipendente.

In sintesi, pensa all'infrastruttura iperconvergente come l'estremo logico e moderno dei sistemi convergenti, mentre l'iperscalabilità è l'estremo logico e moderno di come costruiamo data center da 30 anni. Entrambi hanno senso per ambienti specifici, come mostrato di seguito.

Iperscalabile e iperconvergente

In Hedvig, ci sforziamo di fornire una soluzione di archiviazione che possa essere adattata in modo flessibile per qualsiasi carico di lavoro, dai cloud privati, inclusi Docker e OpenStack, alle distribuzioni di big data che eseguono Hadoop o NoSQL alla virtualizzazione del server più tradizionale, ripristino di emergenza, backup e archiviazione. La piattaforma di archiviazione distribuita Hedvig virtualizza e aggrega flash e dischi rotanti in un cluster di server o cloud, presentandoli come un unico sistema di archiviazione elastico a cui è possibile accedere tramite interfacce di file, blocchi o oggetti.

La piattaforma di archiviazione distribuita Hedvig è composta da tre componenti:

  • Servizio di archiviazione Hedvig: un motore di sistemi distribuiti brevettato che scala le prestazioni e la capacità di archiviazione con server x86 e ARM standard. Il servizio di archiviazione Hedvig può essere eseguito in locale o su cloud pubblici come AWS, Azure e Google. Fornisce tutte le opzioni e le funzionalità di archiviazione necessarie per un'implementazione aziendale, tra cui deduplicazione in linea, compressione in linea, snapshot, cloni, thin provisioning, autotiering e caching.
  • Proxy di archiviazione Hedvig: una VM o un contenitore leggero che consente l'accesso al servizio di archiviazione Hedvig tramite protocolli standard del settore. Hedvig attualmente supporta NFS per file e iSCSI per blocco, così come i driver OpenStack Cinder e Docker. Hedvig Storage Proxy consente anche la memorizzazione nella cache e la deduplicazione lato client con risorse flash SSD e PCIe locali per letture locali veloci e trasferimenti di dati efficienti.
  • API Hedvig: API REST e basate su RPC sia per l'archiviazione di oggetti che per le operazioni Hedvig. Hedvig attualmente supporta Amazon S3 e Swift per l'archiviazione di oggetti. Gli sviluppatori e gli amministratori delle operazioni IT possono utilizzare le API di gestione per consentire l'accesso a tutte le funzionalità di archiviazione Hedvig per automatizzare il provisioning e la gestione con portali, applicazioni e cloud self-service.

Hedvig supporta l'iperconvergenza raggruppando Hedvig Storage Proxy e Hedvig Storage Service come appliance virtuali in esecuzione su un commodity server con un hypervisor o un container OS. Per l'iperscalabilità, il servizio di archiviazione Hedvig viene distribuito su server bare metal per formare un livello di archiviazione dedicato mentre il proxy di archiviazione Hedvig viene distribuito come macchina virtuale o contenitore su ogni server a livello di elaborazione.

Perché scegliere l'iperscalabilità per l'archiviazione

I dati stanno crescendo molto più velocemente dei budget di archiviazione. L'economia è paralizzante per le imprese che non hanno le risorse dei giganti di Internet come Amazon, Google e Facebook. Pertanto, le aziende devono adottare uno storage basato su software e commodity per ridurre i costi e mantenere la flessibilità e la scalabilità necessarie per stare al passo con i requisiti aziendali.

In Hedvig, abbiamo notato che circa l'80% delle volte i clienti scelgono un'architettura iperscalabile anziché iperconvergente, nonostante supportiamo entrambe. Ciò che è ancora più interessante è che molti dei nostri clienti vengono da noi pensando esattamente l'opposto. Circa l'80% inizialmente richiede una soluzione iperconvergente, ma dopo aver fatto i compiti, opta per l'approccio iperscalabile.

Perché? In poche parole, perché prediligono la flessibilità (o l'agilità, se si deve usare questo termine) prima di ogni altra cosa nella progettazione della propria infrastruttura. Considera quanto segue:

  • Un sistema iperconvergente offre un approccio "building block" semplificato all'IT. Per le organizzazioni IT snelle che cercano di ridurre il sovraccarico di implementazione ed espansione di un'infrastruttura simile al cloud, l'iperconvergenza fornisce una buona soluzione. Ma richiede un insieme relativamente prevedibile di carichi di lavoro in cui la "località dei dati" è una priorità assoluta, il che significa che l'applicazione o la VM deve essere posizionata il più vicino possibile ai dati. Questo è il motivo per cui VDI è stato un manifesto per l'iperconvergenza. Gli utenti vogliono che la loro "unità C: virtuale" sia locale. Ma non è flessibile, poiché implica il ridimensionamento di tutti gli elementi in blocco.
  • Un sistema iperscalabile mantiene lo storage indipendente dal calcolo, consentendo all'IT aziendale di scalare la capacità quando l'azienda lo richiede. L'approccio iperscalabile al data center e all'infrastruttura cloud offre un elevato livello di elasticità, aiutando le organizzazioni a rispondere rapidamente alle mutevoli esigenze di archiviazione delle applicazioni e dei dati. È anche un'architettura che si adatta meglio ai carichi di lavoro moderni come Hadoop e NoSQL, nonché a quelli progettati con piattaforme cloud come OpenStack e Docker. Tutti questi sono esempi di sistemi distribuiti che traggono vantaggio dallo storage condiviso su scala indipendente.

Ciò che abbiamo sperimentato con i nostri clienti è una conferma radicale di ciò che notiamo da un po 'di tempo: che l'iperconvergente è una risposta e non la risposta quando si esplorano le moderne architetture di archiviazione. A dire il vero, l'industria sta assistendo a una grande oscillazione del pendolo verso l'iperconvergente a causa della sua semplicità. Ma se i tuoi dati crescono in modo esponenziale e le tue esigenze di calcolo non lo sono, allora hai un disadattamento di impedenza che non è adatto per l'iperconvergenza.

Iperscalabile o iperconvergente?

L'iperconvergente può essere un approccio più semplice ed economico. Tuttavia, ciò che i nostri clienti scoprono con Hedvig è che supportiamo una funzionalità che rende l'iperscalabilità appropriata per quasi tutti i carichi di lavoro: il caching lato client. Hedvig può sfruttare i dispositivi SSD e PCIe locali nel tuo livello di elaborazione per creare una cache write-through. Ciò migliora notevolmente le prestazioni di lettura e, cosa più importante, risolve il problema della località dei dati. Lo storage è ancora disaccoppiato e viene eseguito nel proprio livello iperscalabile dedicato, ma le applicazioni, le VM e i contenitori possono trarre vantaggio dai dati memorizzati nella cache locale a livello di calcolo. Questo risolve anche il problema di come aumentare il livello di memorizzazione nella cache, ma questo è un argomento per un altro articolo.

Come esempio di questo vantaggio, un cliente ha scelto l'approccio iperscalabile di Hedvig per VDI, un carico di lavoro tradizionalmente riservato alle soluzioni iperconvergenti come discusso sopra. In questo caso, il cliente disponeva di "utenti avanzati" che richiedevano 16 vCPU e 32 GB di memoria da dedicare a ciascun desktop ospitato. Di conseguenza, l'azienda è stata costretta a implementare un gran numero di nodi iperconvergenti per supportare i requisiti di elaborazione e memoria, aumentando al contempo inutilmente la capacità di archiviazione in blocco.

Con la piattaforma Hedvig, il cliente è stato in grado di creare nodi dedicati per eseguire la farm Citrix XenDesktop su robusti server blade con CPU e RAM adeguate. I dati sono stati conservati su un cluster Hedvig iperscalabile separato su server montati su rack, con i dati memorizzati nella cache sui server XenDesktop in SSD locali. Il risultato? Una soluzione notevolmente meno costosa (60 percento in meno). Più significativo, ha anche fornito un ambiente più flessibile in cui la società poteva rispettare la legge di Moore e acquistare i server più potenti necessari per aggiornare le prestazioni del desktop senza dover aggiornare i server di archiviazione.

Sulla base della nostra esperienza, ci sono alcune semplici regole pratiche per determinare quale architettura è giusta per te.

  • Scegli l'iperscalabilità quando ... la tua organizzazione ha 5.000 dipendenti o più, più di 500 terabyte di dati, più di 500 applicazioni o più di 1.000 VM.
  • Scegli iperconvergente quando ... sei al di sotto di questi numeri di filigrana, hai cinque o meno dipendenti che gestiscono la tua infrastruttura virtuale o ti trovi in ​​una filiale o in una filiale.

La buona notizia è che non deve essere una decisione o / o. Puoi iniziare in un ambiente iperconvergente, quindi passare all'iperscalabilità oppure puoi combinare e abbinare i due. La nostra filosofia è che le tue applicazioni dettino quale dovresti usare. E poiché le esigenze dell'applicazione cambieranno nel tempo, anche la tua distribuzione dovrebbe cambiare.

Nelle imprese moderne, il cambiamento e la crescita sono obbligatori. Sempre più spesso, non c'è modo di risolvere questo enigma senza l'architettura iperscalabile che i giganti del Web hanno aperto la strada. Ciò che è cambiato è che qualsiasi azienda può ora beneficiare dell'approccio iperscalabile.

Rob Whiteley è il vicepresidente del marketing di Hedvig.

Il New Tech Forum offre un luogo per esplorare e discutere la tecnologia aziendale emergente in profondità e ampiezza senza precedenti. La selezione è soggettiva, in base alla nostra scelta delle tecnologie che riteniamo importanti e di maggiore interesse per i lettori. non accetta materiale di marketing per la pubblicazione e si riserva il diritto di modificare tutti i contenuti forniti. Invia tutte le richieste a [email protected]