Το storage αποτελεί μια από τις αγορές που παρουσιάζει συνεχώς αύξηση καθώς οι εταιρείες προσπαθούν να αντεπεξέλθουν στις ολοένα και μεγαλύτερες απαιτήσεις αποθήκευσης δεδομένων. Συμπληρωματικά στα πλέον εξελιγμένα συστήματα έρχονται να λειτουργήσουν μια σειρά από τεχνολογίες.

Σύμφωνα με έρευνα της IDC, η οποία είχε παραγγελθεί από την EMC, τα δεδομένα σε όλο τον κόσμο διπλασιάζονται σε όγκο κάθε δυο χρόνια. Το νούμερο για το 2011 ήταν της τάξης των 1,8 zettabytes. Αντίστοιχα σημαντική αύξηση της τάξης του 50% σε σχέση με το 2005 έχουν εμφανίσει οι επενδύσεις στο ψηφιακό σύμπαν – όπως το αποκαλεί η EMC – φτάνοντας τα 4 τρις δολάρια.

Αυτό αποτελεί μια συνολική εικόνα, την οποία αντιμετωπίζει σε μικρότερο βαθμό το τμήμα IT μιας επιχείρησης ανεξαρτήτως μεγέθους. Τα δεδομένα είναι πάρα πολλά και η τάση είναι απλά να αυξάνουν. Μάλιστα, όσο οι επιχειρήσεις – επηρεασμένες από το consumerization του IT – υιοθετούν νέους τύπους δεδομένων, όπως για παράδειγμα το video, η αύξηση αναμένεται είναι εκθετική.

Την ίδια στιγμή, οι επιχειρήσεις ζητούν ολοένα και περισσότερο επιχειρηματική αξία μέσα από αυτά τα δεδομένα, ενώ οι κανόνες συμμόρφωσης απαιτούν σε πολλές περιπτώσεις τη διατήρηση συγκεκριμένων δεδομένων για μεγάλο χρονικό διάστημα, όπως και τη δυνατότητα ιδιαίτερα γρήγορης ανάκτησή τους σε περίπτωση που κάτι τέτοιο απαιτηθεί από κάποιον έλεγχο. Ολα αυτά δημιουργούν μια πολύ ιδιόμορφη εικόνα, αφού η αγορά του storage συνεχίζει να κινείται ανοδικά.

Την ίδια στιγμή όμως οι κατασκευαστές, αναγνωρίζοντας από τη μια τις ανάγκες των εταιρειών για επιπλέον αποτελεσματικότητα, και έχοντας την ανάγκη να διαφοροποιηθούν μεταξύ τους, εισάγουν νέες τεχνολογίες, οι οποίες επιτρέπουν την καλύτερη δυνατή εκμετάλλευση του αποθηκευτικού χώρου. Ανάμεσα σε αυτές ξεχωρίζουν το tiering των δεδομένων ή το storage virtualization, στις οποίες θα αναφερθούμε στη συνέχεια.

Μια αγορά με θετικό πρόσημο
Οι επιχειρήσεις, αλλά και οι εταιρείες παροχής υπηρεσιών, συνεχίζουν να αγοράζουν storage, σύμφωνα με τα στοιχεία για το δεύτερο τρίμηνο του 2011 της IDC. Η αύξηση στο storage έχει έρθει παράλληλα με τις επενδύσεις για το cloud computing και το virtualization στο data center. Σύμφωνα με την IDC, οι επιχειρήσεις αναβαθμίζουν τα συστήματα storage που διαθέτουν για την εποχή που θα χαρακτηρίζεται από τα big data, ώστε να μπορέσουν να διαχειριστούν τους τεράστιους και συνεχώς αυξανόμενους όγκους πληροφοριών.

Η συνολική αγορά των συστημάτων storage αυξήθηκε πάνω από 10% σε σχέση με το δεύτερο τρίμηνο του 2010, φτάνοντας τα 5,7 δις δολάρια σε έσοδα. Θα πρέπει να σημειωθεί σε αυτό το σημείο, ότι η IDC καταμετρά σαν αποθηκευτικό σύστημα το άθροισμα τουλάχιστον τριών δίσκων, είτε βρίσκονται στο εσωτερικό, είτε συνδέονται εξωτερικά στο server. Τα εξωτερικά συστήματα αποθήκευσης είχαν μια αύξηση της τάξης του 12,2% σε ετήσια βάση, με αποτέλεσμα το σύνολο της αγοράς να ξεπεράσει ελαφρώς τα 5,6 δις δολάρια.

Η αύξηση των εσόδων προέρχεται από την άνοδο των ήδη πολύ καλών αποτελεσμάτων του δευτέρου τριμήνου του 2010, όταν ο χώρος (εκτός Ελλάδας βέβαια) ανέκαμπτε από την ύφεση του 2008-2009. Το συνολικό ποσό της χωρητικότητας που δόθηκε στην αγορά συνέχισε να αυξάνεται κάτι που είχε σαν αποτέλεσμα, ο συνολικός αποθηκευτικός χώρος που πωλήθηκε να φτάνει τα 5.353 petabytes, παρουσιάζοντας αύξηση της τάξης του 46,7% σε σχέση με ένα έτος πριν. Το αντίστοιχο τρίμηνο του 2010, είχαν πωληθεί περί τα 3.645 petabytes, μια αύξηση της τάξης του 54,6%.

Οι πωλήσεις έχουν παρουσιάσει αύξηση σε όλες τις βασικές κατηγορίες προϊόντων, συμπεριλαμβανομένων των συστημάτων NAS (Network Attached Storage) και όλων των τύπων SAN (Storage Area Networks). Τα νούμερα αυτά δεν αφορούν σε mainframe συστήματα.  Η αγορά αυτή παρουσίασε αύξηση της τάξης του 15% φτάνοντας τα 4,8 δις δολάρια σε έσοδα σύμφωνα με την έρευνα της IDC. Η ECM βρέθηκε στην κορυφή της κατηγορίας, συγκεντρώνοντας το 31,9% των συνολικών εσόδων, ακολουθούμενη από τη NetApp, η οποία απέσπασε ένα ποσοστό που φτάνει στο 15%.

Η EMC διατήρησε τα πρωτεία και στην αγορά open SAN η οποία περιλαμβάνει όλες τις διαφορετικές εκδοχές των συστημάτων SAN εκτός των mainframe συστημάτων. Η εταιρεία κράτησε το 25,7% της αγορά, ακολουθούμενη από την IBM με 16,7% και την HP με 13,4% σύμφωνα με τα στοιχεία της IDC.

Τα συνολικά έσοδα στην αγορά των open NAS παρουσίασαν αύξηση 14,3% σε σχέση με την ίδια περίοδο του 2010. Ακόμα και τα συστήματα που χρησιμοποιούν συνδέσεις Fibre Channel – που παραδοσιακά αφορούν σε πιο ακριβά συστήματα, παρουσίασαν αύξηση. Αλλο ένα κομμάτι της αγοράς που παρουσίασε αύξηση σε αυτό το διάστημα ήταν αυτό των συστημάτων iSCSI SAN, με ποσοστό 21%. Η Dell οδηγεί τη συγκεκριμένη αγορά με ποσοστό 32,1%, ακολουθούμενη από την EMC και την HP. Τα έσοδα των συστημάτων NAS αυξήθηκαν κατά 16,9% σε σχέση με το προηγούμενο έτος και η EMC κυριάρχησε στην αγορά με 42,7%. Η NetApp ακολουθεί με 30,7%.

Ανάμεσα στους κατασκευαστές, η EMC έχει τα πιο σημαντικά κέρδη τόσο στο σύνολο των αποθηκευτικών μέσων, όσο και στο τμήμα της αγοράς των εξωτερικών αποθηκευτικών μέσων. Η Oracle, η οποία το 2009 εξαγόρασε τη Sun Microsystems, και κατ’ επέκταση και τα storage συστήματα, είδε τα έσοδά της να πέφτουν σημαντικά και στις δυο κατηγορίες storage. Η Oracle έχει όμως πλέον επαναπροσδιορίσει το συγκεκριμένο business unit, σταματώντας αρκετά συστήματα της εταιρείας, ώστε να εστιάσει καλύτερα στο Oracle Exadata Database Machine, που συνδυάζει το data warehousing με το OLTP (Online Transaction Processing).


Οτι πρέπει να ξέρετε για το Tiering
Σε πρόσφατη έρευνα της Enterprise Strategy Group (ESG), υπάρχει η πρώτη προσπάθεια κατάταξης των συστημάτων tiering, που συναντάμε σε διάφορα συστήματα storage. Μεταξύ άλλων, η έρευνα εξετάζει τι ισχύει για το tiering στα συστήματα storage, τους τύπους και τι θα πρέπει να προσέξουν οι αγοραστές. Η έρευνα αναφέρει τις διάφορες υλοποιήσεις και τις επιλογές που υπάρχουν στην αγορά.

Στην ουσία, με τον όρο storage tiering, αναφερόμαστε στη διαδικασία της τοποθέτησης διαφορετικών δεδομένων σε διαφορετικούς τύπους μέσων αποθήκευσης. Πρόκειται για ένα ιεραρχικό μοντέλο, το οποίο στηρίζεται σε μια σειρά από παράγοντες. Κλειδί σε αυτό το μοντέλο πάντως είναι ο τρόπος με τον οποίο ο χρήστης αξιολογεί συγκεκριμένα δεδομένα. Οι παράγοντες, οι οποίοι επηρεάζουν τα δεδομένα περιλαμβάνουν τη σημασία των δεδομένων σε θέματα όπως η απόδοση, η ανάγκη διατήρησης ή η επιχειρησιακή αξία.

Πέρα από αυτό όμως, η τοποθέτηση των δεδομένων εξαρτάται και από το επίπεδο εξυπηρέτησης που απαιτείται από τους χρήστες, τους πελάτες, τις εφαρμογές ή τις επιχειρηματικές μονάδες, ενώ σε κάθε περίπτωση δεν θα πρέπει να αφήνουμε απέξω ζητήματα χωρητικότητας και διαχείρισης αλλά και τη δυνατότητα επένδυσης σε νέα συστήματα.

Η έρευνα της εταιρείας περιλαμβάνει ανάλυση 23 κατασκευαστών που, όσο και αν ακούγεται παράξενο, αποτελούν ένα υποσύνολο της συνολικής αγοράς. Η έρευνα διαχωρίζει την αγορά σε πέντε βασικές κατηγορίες και είναι: migration που βασίζεται στα arrays, caching βάσει arrays, βάσει file system, εργαλείων software και, τέλος, λύσεις που δίνουν έμφαση στο archiving.

Αυτό που καθίσταται σαφές από την έρευνα είναι ότι όλα καταλήγουν στο κόστος. Αν το storage δεν είχε κόστος, το tiering δεν θα ήταν απαραίτητο. Αλλά η πραγματικότητα είναι ότι οι ανάγκες για storage μπορούν να κοστίσουν, και μάλιστα πολύ ακριβά. Αυτό οδηγεί σε δυο συμπεράσματα. Πρώτα από όλα, το tiering είναι κάτι που δεν θα το δούμε μόνο στο high end, αλλά σε όλα τα προϊόντα, ξεκινώντας από τη βάση. Το δεύτερο είναι ότι οι χρήστες θα πρέπει να σκέφτονται τα δεδομένα βάσει δυο διαφορετικών ιεραρχικών δομών.

Η μία αφορά στο Input/Output και η δεύτερη στη διατήρησή τους για μεγάλο χρονικό διάστημα. Ακόμα και μέσα στο ίδιο σύνολο κατασκευαστών που συμπεριλήφθηκε στην ανάλυση, υπάρχει ένας μεγάλος αριθμός διαφορετικών λύσεων. Σε κάθε περίπτωση πάντως, η αξία είναι ξεκάθαρη και δεδομένη και αρκεί μια ματιά στα αποτελέσματα τόσο των ερευνών όσο και στα δεδομένα που παρέχουν οι vendors, ώστε να πειστούν οι σκεπτικιστές αλλά και όσοι κωλυσιεργούν στη λήψη της απόφασης.

Τα αποτελέσματα της έρευνας κατέδειξαν ότι με τη χρήση του tiering επιτυγχάνεται επιτάχυνση σε πολλές εφαρμογές από τέσσερις ως και 10 φορές, ενώ το κόστος του storage έπεσε κατά 71%, μειώνοντας το χρόνο που απαιτείται για το administration στο μισό.

Storage Virtualization
Η διαχείριση του αποθηκευτικού χρόνου ήταν σε πρώτη φάση μια ιδιαίτερα απλή διαδικασία. Αν κάποιο σύστημα χρειαζόταν περισσότερο χώρο, απλά αγοραζόταν ένα νέος μεγαλύτερος σκληρός δίσκος. Αλλά οι απαιτήσεις σε χώρο άρχισαν να αυξάνονται με ιδιαίτερα μεγάλους ρυθμούς, οπότε απλά άρχισαν να προστίθενται επιπλέον δίσκοι. Η εύρεση και διαχείριση της πληροφορίας άρχισε να γίνεται πιο δύσκολη και να παίρνει περισσότερο χρόνο, για αυτό το λόγο προέκυψαν τεχνολογίες και προϊόντα όπως οι RAID, NAS και SAN. Βέβαια αυτό περιέπλεξε ακόμη περισσότερο τα πράγματα, αφού η διαχείριση ενίοτε και χιλιάδων δίσκων είναι εξαιρετικά επίπονη και δύσκολη διαδικασία.

Την απάντηση σε αυτό το δίλημμα παρέχει το storage virtualization, στην ουσία η προσθήκη ενός επιπλέον layer ανάμεσα στα συστήματα storage και του servers έτσι ώστε να μην είναι απαραίτητο για τις εφαρμογές να «γνωρίζουν» σε ποιο συγκεκριμένο δίσκο βρίσκονται τα δεδομένα. Οι άνθρωποι του IT, μπορούν να αναγνωρίσουν, διαθέσουν και διαχειριστούν το διανεμημένο storage σαν έναν ενιαίο πόρο.

Ενα επιπλέον πλεονέκτημα που σχετίζεται με το storage virtualization αφορά στη διαθεσιμότητα των εφαρμογών, από τη στιγμή που δεν είναι περιορισμένες σε συγκεκριμένους πόρους και για αυτό το λόγο είναι απομονωμένες από τα περισσότερα προβλήματα. Επιπλέον, το storage virtualization συνήθως βοηθά στην αυτοματοποίηση της επέκτασης του αποθηκευτικού χώρου, μειώνοντας την ανάγκη για χειροκίνητη διάθεση του χώρου.

Καθώς το virtualization λειτουργεί σαν ένα ενδιάμεσο layer, καθίσταται το βασικό interface ανάμεσα στους servers και το storage. Οι servers βλέπουν το virtualization σαν μια συσκευή αποθήκευσης. Αυτό κάνει πιο απλές τις διαδικασίες ομαδοποίησης διαφορετικών συστημάτων storage και, κατά περίπτωση, ακόμη και διαφορετικών κατασκευαστών.

Το εν λόγω layer αποτελεί και είδος προστασίας για τους servers και τις εφαρμογές από αλλαγές που συμβαίνουν στο περιβάλλον storage, επιτρέποντας για παράδειγμα μια αλλαγή σε πραγματικό χρόνο ενός δίσκου. Η διαχείριση διαδικασιών όπως είναι η αντιγραφή δεδομένων γίνεται σε επίπεδο virtualization. Αυτό σημαίνει ότι το replication των δεδομένων, είτε πρόκειται για snapshot, είτε για disaster recovery, γίνεται από το σύστημα virtualization συνήθως στο background, με ένα ενιαίο interface διαχείρισης.