Questo articolo fa parte di una serie (1, 2, 3, 4, 5 e qui uno sullo storage tradizionale) che ha l’obiettivo di informare il lettore su come sta evolvendo lo storage enterprise e cosa si deve aspettare per la sua futura infrastruttura. Questa è l’ultima parte che riguarda le caratteristiche software:
Automazione
L’automazione ricade sempre nella necessità di ridurre l’intervento umano ed aumentare il numero di TB gestiti per amministratore. La regina delle automazioni è sicuramente l’”automated tiered storage”, ma in questa area esistono molte innovazioni che si stanno affacciando e che permettono appunto di automatizzare operazioni che altrimenti, se eseguite a mano, hanno un costo in termini di tempo che diventerà sempre più insostenibile. Esempi pratici vanno da meccanismi di snapshot dei NAS che permettono agli utenti di recuperare file senza la necessità di un operatore fino a meccanismi che schedulano attività sugli host di recupero dello spazio inutilizzato!
Automated tiered storage
L’Automated storage tiering è una delle funzionalità dello storage che sono state più discusse negli ultimi tempi. E’ la capacità dell’array di muovere blocchi di dati fra diversi tipi di dischi e livelli raid, in autonomia, per raggiungere il miglior bilanciamento fra performance e spazio usato eliminando quelli che in gergo vengono detti hot-spots.
Un dei vantaggi più tangibili dell’ATS è la possibilità di utilizzare una piccola quantità di dischi SSD come primo tier veloce e dischi meccanici per ottenere lo spazio, in questo modo si possono ottenere configurazioni particolarmente performanti a costi limitati. Inoltre, proprio per la natura di questa tecnologia e del ciclo di vita che normalmente hanno i dati, è molto probabile che le espansioni del sistema di storage avverranno principalmente nella parte più lenta e capiente dell’array (dischi SATA) con conseguenti vantaggi di carattere economico.
Schedulazione
Molti array moderni hanno uno schedulatore interno che può istanziare delle particolari operazioni (job) in funzione dell’orario o, in alcuni casi specifici, al verificarsi di eventi. Questi schedulatori vengono spesso usati per pianificare snapshot, recuperare risorse inutilizzate, lanciare operazioni di compressione, ecc. Molte di queste operazioni occupano la CPU in maniera impegnativa e quindi è bene poter decidere di lanciarle in orari in cui il sistema è più scarico.
Recupero dello spazio
Una caratteristica molto importante delle diverse implementazioni di thin provisioning è la capacità di rimanere “thin”. Infatti, se non è prevista una funzionalità di recupero dello spazio inutilizzato c’è il rischio concreto che il sistema continui a richiedere di allocare nuovo spazio e, dopo poco tempo, ci si ritrova con un volume diventato “full provisioned” anche se nel frattempo sono stati cancellati dati o file. Una buona implementazione di thin provisioning ha quindi anche una funzionalità di recupero spazio. Questa può essere lanciata ad intervalli regolari oppure, se i controller sono abbastanza potenti, anche in background durante la normale attività. I sistemi operativi, e gli hypervisor, di ultima generazione prevedono la possibilità di avvisare l’array dello spazio liberato attraverso appositi comandi SCSI mentre in altri casi è necessario installare un agente sui server che si occupa di colloquiare con lo storage.
Nel prossimo, e ultimo, articolo parlerò di integrazioni con gli hypervisor, federazione e del concetto di unified/converged storage.