Gli 8 errori del calcolo distribuito stanno diventando irrilevanti

Nel 1969, il Dipartimento della Difesa degli Stati Uniti ha creato ARPANET, il precursore di Internet di oggi. Nello stesso periodo è stato anche istituito il protocollo SWIFT utilizzato per i trasferimenti di denaro. Questi sono entrambi i primi esempi di sistemi distribuiti: una raccolta di computer indipendenti che appaiono agli utenti come un unico sistema coerente.

Molti vengono a sapere di avere un sistema distribuito quando il crash di un computer di cui non hanno mai sentito parlare colpisce l'intero sistema. Questo è spesso il risultato di ipotesi che gli architetti e i progettisti di sistemi di distribuzione potrebbero fare.

Nel 1994, Peter Deutsch, che lavorava alla Sun Microsystems, scrisse su questi presupposti per esplorare cosa può andare storto nei sistemi distribuiti. Nel 1997, James Gosling ha aggiunto a questo elenco per creare quelli che sono comunemente noti come gli otto errori del calcolo distribuito. Gli approcci tradizionali, che utilizzano la replica basata sul tempo per progettare e costruire sistemi distribuiti, soffrono di molti di questi errori e si traducono in sistemi inefficienti, insicuri e costosi da mantenere. Gli approcci moderni, che utilizzano una matematica complessa come l'algoritmo Paxos, superano molti di questi ostacoli significativi.

1.  La rete è affidabile

2. La  latenza è zero

3. La  larghezza di banda è infinita

4.  La rete è sicura

5. La  topologia non cambia

6.  C'è un amministratore

7.  Il costo di trasporto è zero

8.  La rete è omogenea

Conclusioni

Sono passati più di 20 anni dalla prima stesura degli errori del calcolo distribuito e più di 40 anni da quando abbiamo iniziato a costruire sistemi distribuiti. La tecnologia ha continuato ad evolversi da allora, rendendo questi errori sempre più irrilevanti.

Google Spanner, ad esempio, supera molti degli errori utilizzando la replica basata su Paxos, insieme a un sacco di fibra scura, per superare i problemi di latenza e sincronizzazione dell'ora assistita dall'hardware dall'utilizzo di satelliti dedicati, orologi GPS e orologi atomici.

L'algoritmo Paxos può anche essere esteso per garantire la coerenza globale attraverso Active Transactional Data Replication senza hardware aggiuntivo e senza requisiti di larghezza di banda aggiuntivi. Di conseguenza, le reti WAN odierne sono sempre più sicure, convenienti e con la giusta tecnologia brevettata, possono funzionare senza tempi di inattività e senza interruzioni: qualcosa che l'informatica ha affermato per molti anni è impossibile.