Il Disaster Recovery (DR) è un argomento che, in molte aziende italiane, è sottovalutato. Spesso, quando parlo con i clienti di nuove infrastrutture o aggiornamenti, uno dei punti nella lista delle richieste è “prevedere la possibilità di DR”.
L’affermazione di cui sopra non significa nulla in se ma, in pratica, nel lessico dei clienti, è la possibilità di creare una infrastruttura che, in un futuro più o meno lontano (di solito nell’intorno del “mai”), possa essere replicata remotamente con l’auspicio di creare un sito di DR… ma anche questo, purtroppo, non significa nulla se non correttamente supportato da un piano per il Disaster Recovery che ne preveda il corretto utilizzo!
L’obiettivo di questa breve serie di articoli è quindi quello di spiegare nel modo più semplice possibile alcuni aspetti di base del “recupero da disastri” e fare un po di luce in modo da fornire alcuni semplici strumenti e terminologie per una miglior valutazione dell’argomento.
dopo è troppo tardi
Infatti, una delle cose più “comiche” del mio lavoro, sta proprio nel ricevere telefonate da clienti disperati che hanno appena subito, o stanno subendo, un disservizio causato da un disastro e che sarebbero disposti a pagare qualsiasi cifra per risolvere il problema (spesso insolvibile). Questi clienti, superata l’urgenza, diventano degli interlocutori perfetti per l’eventuale realizzazione di un progetto di DR… sempre che la cosa non cada nell’oblio un’altra volta perchè c’è qualche cosa di più importante da fare!
Molto spesso, la problematica DR viene sottovalutata perchè il management/proprietà dell’azienda non ha ben chiare le dinamiche dell’IT aziendale e, soprattutto, il fatto che è l’IT a mandare avanti il business, a regolare la produzione e a dare il supporto per l’assistenza ai clienti!
La perdita dei dati aziendali e l’impossibilità di potervi accedere per dare servizio può provocare danni anche seri e, in alcuni casi, la chiusura dell’azienda stessa. Non a caso, nelle valutazioni di rischio per gli investitori che vengono fatte su aziende quotate in borsa (o in fase di quotazione), istituti finanziari e grandi organizzazioni è sempre prevista una importante sezione che riguarda proprio a come viene affrontata la problematica DR. Un’azienda senza un solido (e verificabile) piano di DR è come un’auto senza assicurazione RC: tu la guideresti!
DR, Business Continuity e 7×24
Le aziende che si attrezzano per fornire servizi 7×24 sono sempre più diffuse. La globalizzazione, lo spostamento di attività produttive nell’estremo oriente o la commercializzazione dei prodotti negli altri continenti, porta con se una visione dell’IT diversa da quella che si poteva ipotizzare anche solo qualche anno fa. Per quanto l’IT sia un servizio da erogare continuamente e senza fermi (soprattutto quelli non pianificati) in pochi, nella media azienda italiana, si preoccupano di valutare a fondo i livelli di servizio che effettivamente si possono garantire e i rischi/costi che un fermo può procurare!
Un fermo di pochi istanti, nella maggior parte delle imprese, non ha nessun impatto mentre uno stop di pochi minuti può essere considerato come fastidioso (se non è frequente!), ma le cose iniziano a cambiare drasticamente quando l’IT si ferma per un’ora o più. Sono sicuro che, come per tutte le aziende, potrete verificare facilmente che un fermo non pianificato del servizio IT creerà un danno in modo esponenziale in funzione al tempo di disservizio. I danni saranno sicuramente difficili da quantificare “in denaro contante” ma sono altrettanto sicuro che tutti i responsabili dell’azienda saranno in grado di darvi una visione chiara di cosa succede se ipotizzate di metterli di fronte ad un black-out di un minuto, di un ora, di un giorno o di una settimana (oltre forse non serve neanche perchè, in molte aziende, non penso che un fermo più lungo sia sopportabile).
Prima di iniziare un qualsiasi processo di redazione di un piano di DR sarà bene quindi confrontarsi con tutta l’azienda (o almeno con tutti i reparti che contribuiscono alla vita e al business dell’azienda stessa) per verificare con cura tutto quello che è “mission critical” e “business critical”: mettere in sicurezza un servizio costa, scegliere quelli giusti è fondamentale!
non tutti i “disastri” sono uguali
Esistono diversi tipi di disastro e, mi preme aggiungere che, alcuni degli eventi che possono creare un potenziale disastro vengono presi in considerazione solo in particolari casi, ad es. un attacco terroristico può minare l’operatività di una banca israeliana ma sicuramente ha un indice di rischio molto basso se devo fare un progetto di DR per una azienda emiliana che produce salumi.
Alcuni eventi sono di tipo naturale e di larga scala (terremoti, alluvioni/esondazioni, tifoni, ecc.) ma sono anche i più rari e, da certi punti di vista, i più facili da aggirare (es. mai costruire un nuovo DC vicino agli argini di un fiume, soprattutto se la storia ci dice che è a rischio).
Esistono anche disastri più localizzati, magari sempre di carattere naturale ma più contenuti e più difficili da prevedere/aggirare (esempi possono essere il fulmine che isola la cabina elettrica, un esplosione dovuta ad una fuga di gas, attentato terroristico, ecc). In questi casi, come dicevo, è più difficile circoscrivere il rischio ma la possibilità di gestire il disastro è relativamente più semplice.
Oltre agli eventi totalmente imprevedibili e fuori dal nostro controllo esistono una serie di altre possibilità che sono anche le più probabili, solo per citarne alcune: l’impianto antincendio che impazzisce, i condizionatori d’aria che si fermano, insomma danni legati alle infrastrutture aziendali ed anche, teoricamente, più facilmente controllabili.
Da ultimo, mi preme segnalare che il “disastro umano” è il più diffuso! Da quando è nato il computer è l’uomo quello che ha creato più danni nella vita di dati e computer… da quello che spegne la corrente per sbaglio alla cancellazione di dati sensibili per errore! Un buon piano di DR deve quindi partire da una attenta analisi dei rischi. A volte, quando non è possibile avvalersi di consulenti esterni o se si ha un budget limitato, può essere già un buon inizio ripercorrere la storia dell’azienda e dei luoghi in cui opera per avere una buona base di valutazione sugli eventi che si sono verificati o ripetere e le loro conseguenze!
Nel prossimo articolo inizierò a parlare più in dettaglio di: Disaster Recovery plan, RPO e RTO, priorità di ripristino dei servizi.