Ieri abbiamo assistito al terzo incidente nel datacenter di Aruba ad Arezzo, sempre per via di un problema alla corrente elettrica, qui il comunicato ufficiale.
Il più importante service provider italiano (specializzato in housing e hosting a basso prezzo) non è estraneo a questo tipo di problemi (qui e qui gli altri).

La qualità di un DC

Da un punto di vista puramente tecnico è molto difficile poter fare dei commenti o cercare delle spiegazioni, i comunicati sono sempre molto attenti a non divulgarle, e questo fa si che i dubbi non possano far altro che aumentare. E’ certo che se in due anni questo datacenter si è fermato tre volte per problemi di corrente (anche il fail degli UPS lo possiamo annoverare sui fra i problemi di impianto elettrico), non è difficile immaginare dove intervenire per migliorare. Fra l’altro, devo aggiungere, che il DC è in una zona industriale, adiacente ad altri capanonni, quindi, senza un livello di sicurezza degli accessi adeguato (molto al di sotto degli standard Telecom, BT/i.net o altri).
E’ vero che Aruba, al contrario di molti altri ISP Italiani, ha un vero DC ma è vero anche che il DC in questione non è più all’altezza del suo compito. Fra le righe del comunicato si legge comunque che stanno lavorando per migliorare l’impianto e ridondare i servizi su un secondo DC.

I Datacenter possono essere certificati a diversi livelli, il livello (tier) di certificazione va da 1 a 4 e indica il livello di ridondanza/sicurezza del DC.
Il livello più basso (1) indica un DC senza ridondanze mentre il 4 prevede una totale ridondanza di tutti gli impianti e gli apparati tale per cui qualsiasi tipologia di guasto (anche durante le attività di manutenzione) non perturba la normale operatività del DC. Va da se che i livelli intermedi prevedono una parziale ridondanza.
Non so quale sia il tier di certificazione di aruba ma è molto probabile che si posizioni fra il 2 e il 3.
Questo tipo di informazioni, ad esempio, è molto importante per chi deve fare scelta strategiche su dove posizionare il proprio sito di e-commerce, ma aruba non la fornisce (anche se immagino che in pochi dei suoi clienti la recepirebbero).

La mancanza di informazioni

Quello che ha fatto arrabbiare di più gli utenti, per la stragrande maggioranza privati e piccoli attività commerciali (senza servizi particolarmente “business critical” da gestire ovviamente) è stata la mancanza di informazioni!
Già, perchè l’account twitter di Aruba, ad esempio, è muto dal 29/6 e non ha emesso un “cinguettio” neanche ieri, facendo montare la protesta durante tutto il giorno. Lo stesso vale per gli altri social network e per la mancanza di una press release!
Quando ci fu il problema su Amazon (una zona intera rimase bloccata per quasi 4 giorni), le informazioni si sprecavano e gli aggiornamenti erano costanti: Amazon ha un cruscotto molto semplice (e facile da realizzare per un ISP) con tutte le informazioni sullo stato dei servizi e, nel caso specifico, riportava le attività in corso (qui e qui). Vorrei anche aggiungere che appena finita l’emergenza Amazon ha pubblicato una dettagliatissima spiegazione sul suo blog di quanto successo.

Nota Finale

I guasti accadono in tutto il mondo anche in posti dove non dovrebbero accadere (es.: le Poste hanno fatto una figuraccia qualche giorno fa) ed è sempre difficile fare valutazioni dall’esterno. E’ certo però che se l’infrastruttura e le risorse umane fossero pronte a reagire agli imprevisti e aziende come Aruba (e le poste) fossero anche più trasparenti con i propri utenti (come ad esempio Amazon) non sarebbe male.