Τόσο το backup όσο και το archiving είναι σημαντικά, αλλά και αλληλοσυμπληρούμενα σε μια στρατηγική προστασίας δεδομένων. Η παράλληλη αξιοποίησή τους αποτελεί έναν εξαιρετικό τρόπο για την εξασφάλιση της επιχειρησιακής συνέχειας, για να είναι μια επιχείρηση σίγουρη ότι δεν θα χάσει ποτέ τα πολύτιμα δεδομένα της.

Πηγή: ESG, Απόδοση: Γιώργος Φετοκάκης, gfetokakis@boussias.com

To backup αποτελεί μια διεργασία που, πρακτικά, έχει απασχολήσει όλους τους διαχειριστές του ΙΤ, είτε τους αρέσει είτε όχι. Το archiving από την άλλη συχνά δεν θεωρείται το ίδιο αναγκαίο όπως το backup, αλλά κάτι το οποίο είναι θεμιτό να κάνει το ΙΤ – με τους IT Managers να επικαλούνται την έλλειψη χρόνου, το ανεπαρκές budget ή οποιεσδήποτε άλλες δικαιολογίες για να το αποφύγουν. Η πραγματικότητα, ωστόσο, είναι ότι οι οργανισμοί χρειάζονται το archiving τόσο πολύ όσο και το backup. Όταν αρχειοθετείτε τα δεδομένα τα προστατεύετε – χρησιμοποιώντας, απλώς, μια πρόσθετη ασφαλιστική δικλείδα έναντι του backup. Μετά την αρχειοθέτησή των δεδομένων δεν χρειάζεται, πλέον, να παίρνετε backup κάθε ώρα ή κάθε νύχτα.

Και δεν χρειάζεται να αποθηκεύετε ακόμα περισσότερα διπλότυπα τους στο storage που χρησιμοποιείτε για τη λήψη του backup. Για να συνειδητοποιήσει κανείς το πώς ένα περιβάλλον backup μπορεί να επωφεληθεί από μια λύση αρχειοθέτησης αρκεί να σκεφτεί ένα data center όπου το protection storage είναι τέσσερις φορές μεγαλύτερο από το production storage, με τους δύο τύπους να αυξάνονται σημαντικά κάθε χρόνο, με ότι αυτό συνεπάγεται στο κόστος. Αν, ωστόσο, σε ένα data center εφαρμοστεί μια λύση αρχειοθέτησης, όπου τα παλιά και λιγότερο χρήσιμα δεδομένα αφαιρεθούν από την παραγωγή (production storage) για να αρχειοθετηθούν, τότε θα διαπιστωθεί μια σημαντική μείωση του production storage (και το εξαρτώμενο από αυτό protection storage), αποκτώντας ένα περισσότερο βιώσιμο και πιο αποδεκτού κόστους περιβάλλον storage.

Τα τρία “Rs”
Η αρχειοθέτηση αποτελεί ένα ακόμα τρόπο για τη φύλαξη των δεδομένων και η απόφαση για το αν προβεί κανείς σε αρχειοθέτηση ή σε backup μπορεί να παρθεί με βάση τα ακόλουθα: To κίνητρο για το backup των δεδομένων σχετίζεται με την επίτευξη ενός θετικού επιχειρησιακού αντίκτυπου. Για παράδειγμα, ένας οργανισμός μπορεί να εκμεταλλευτεί το backup για να επαναφέρει τη λειτουργία του μετά από μια καταστροφή ή βλάβη. Το κίνητρο για την αρχειοθέτηση των δεδομένων είναι «ευγενέστερο». Για παράδειγμα, με την αρχειοθέτηση φυλάει κανείς τα μη ενεργά δεδομένα του, καθώς θεωρεί ότι αυτά έχουν μια εγγενή μακροπρόθεσμη στρατηγική αξία, όπως καθορίζεται αυτή από τον ίδιο τον οργανισμό ή τους εξωτερικούς ρυθμιστικούς φορείς. Το κλειδί σε κάθε περίπτωση είναι να ταιριάξουν οι απαιτήσεις με τη λύση. Το recovery, π.χ., ταιριάζει με το backup. Όταν ένα ενεργό σετ δεδομένων χάνει τη βιωσιμότητά του λόγω ενός τυχαίου σβησίματός, βλάβης, ανακρίβειας κ.λπ.. το ΙΤ θα χρειαστεί να επαναφέρει μια προγενέστερη έκδοση αυτού του σετ. Και, εξ ορισμού, μια προηγούμενη έκδοση σημαίνει backup. H φύλαξη (retenttion) δεδομένων ταιριάζει στην αρχειοθέτηση.

Ο οργανισμός μπορεί να διατηρεί κάπου δεδομένα, καθώς αυτά έχουν μακροπρόθεσμη σημασία εσωτερικά ή εξωτερικά για τους ελεγκτικούς μηχανισμούς. Αυτή η κατάσταση σχετίζεται με τη συντήρηση του αρχείου, όπου τα δεδομένα αποθηκεύονται για μεγάλο χρονικό διάστημα, χωρίς να χρειάζεται να χρησιμοποιηθούν για καιρό. Η βελτιστοποίηση χρήσης του storage (reclamation) ταιριάζει με την αρχειοθέτηση. Σε αυτήν την περίπτωση, το ζητούμενο είναι να μεταφερθούν τα στάσιμα δεδομένα από το ακριβές primary storage στο δευτερεύον και πιο φθηνό storage, ώστε να επιτραπεί η περισσότερο αποτελεσματική χρήση των ακριβών storage arrays. Ως επακόλουθο, τα στάσιμα δεδομένα θα διατηρούνται μόνο μέσα στην πλατφόρμα αρχειοθέτησης. Η μεταφορά και όχι η αντιγραφή δεδομένων αποτελεί τη συνήθη προσέγγιση για την μακροχρόνια αποθήκευση δεδομένων,.

Σχεδόν τα 2/3 των οργανισμών που διατηρούν κάποια από τα δεδομένα για τουλάχιστον τρία χρόνια αναφέρουν ότι μεταφέρουν αυτά τα δεδομένα από το πρωτεύον storage παραγωγής σε δευτερεύοντες πόρους για να μειώσουν την κατανάλωση ακριβών πόρων, όπως καταγράφει η ESG σε πρόσφατη έρευνά της. Η δουλειά του ΙΤ έγκειται στο να αντιληφθεί στο ποιο από τα τρία “Rs” (recovery, retention ή reclamation) είναι ο στόχος και στη συνέχεια να χρησιμοποιήσει το σχετικό σετ εργαλείων. Με άλλα λόγια, να ξεκινήσει με το επιθυμητό αποτέλεσμα και στη συνέχεια να καθορίσει σε τι ενέργειες χρειάζεται να προβεί.

Καθορισμός ενεργειών
O καθορισμός του στόχου και η σύνδεσή του με ένα συγκεκριμένο σετ εργαλείων αποτελεί την μία πλευρά του ζητήματος. Η άλλη έχει να κάνει με το ποιος θα αναλάβει να διεκπεραιώσει τη διαδικασία backup ή αρχειοθέτησης. Το backup αποτελεί σχεδόν πάντα μέρος των λειτουργιών του ΙΤ. Αυτό σημαίνει ότι οι ίδιοι άνθρωποι που είναι αρμόδιοι για τους servers και το storage παραγωγής είναι εκείνοι που έχουν έννομο συμφέρον στο να εξασφαλίσουν ότι θα μπορούν να ανακτήσουν ανά πάσα στιγμή αυτά τα παραγωγικά assets. Ένα μεγάλο ποσοστό του προσωπικού των IT Operations εστιάζει περισσότερο στα φυσικά κουτιά από τα ηλεκτρονικά «μηδέν και ένα» στο εσωτερικό τους. Η διατήρηση λειτουργίας της «μεταλλικών κουτιών» αποτελεί μία από τις κυριότερες αρμοδιότητές τους.

Αντίθετα, οι αρμόδιοι για τις επιχειρηματικές εφαρμογές όπως και οι διευθυντές των επιχειρηματικών τμημάτων τείνουν να είναι περισσότερο ακτιβιστές. Νοιάζονται περισσότερο για τα ψηφιακά assets εντός αυτών των κουτιών, για την πολύτιμη πληροφορία που φιλοξενούν. Αυτή η ομάδα έχει διαφορετικό κίνητρο. Ενώ το βασικό κίνητρο των διαχειριστών backups είναι να διασφαλίσουν την ανθεκτικότητα και τη δυνατότητα επαναφοράς των υποδομών, το κίνητρο της τελευταίας ομάδας είναι να διατηρήσει τα δεδομένα ώστε να υποστηρίξει τις απαιτήσεις συμμόρφωσης, τις νομικές απαιτήσεις και τις επιχειρηματικές λειτουργίες του οργανισμού.

Στην πραγματικότητα, οι ειδικοί του backup και οι προσανατολισμένοι στο archiving διαχειριστές των εφαρμογών, όπως και οι διευθυντές τμημάτων απαιτείται να συνεργαστούν μεταξύ τους. Ο ειδικός του backup μπορεί να νιώθει απογοητευμένος από τα στάσιμα δεδομένα που απομυζούν την παραγωγική χωρητικότητά του storage. Θέλει να τα ξεφορτωθεί, αλλά δεν μπορεί να το κάνει αυτό μόνος του, καθώς δεν ξέρει τι είναι αυτά τα δεδομένα. Οπότε, χρειάζεται να συνεργαστεί με τη δεύτερη ομάδα, με κάποιον που να καταλαβαίνει ακριβώς τι είναι αυτά τα δεδομένα. Μαζί, λοιπόν, μπορούν να αποφασίσουν τι να αρχειοθετήσουν. Τουτέστιν, η ερώτηση “ποιος θέλει να προστατέψει τα δεδομένα» απαντάει και στο πρακτικό του θέματος «πώς θα γίνει αυτό».

Διάρκεια
Σε μια τυπική εταιρεία δεν συμβαίνει συχνά να χρειάζεται να ανακτηθεί ένας server χρησιμοποιώντας backups που πάρθηκαν ένα χρόνο πριν. Στην πραγματικότητα, αυτό το σενάριο ίσως να μην έχει συμβεί ποτέ. Ωστόσο δεν είναι ασύνηθες να χρειάζεται κανείς δεδομένα που είχαν δημιουργηθεί χρόνια πριν. Έτσι, είναι σημαντικό να χρησιμοποιηθεί το κατάλληλο είδος εργαλείου για τη διατήρησή τους. Αν ένας υπάλληλος χρειάζεται να αποκτήσει πρόσβαση σε ένα αντίγραφο δεδομένων που είχε παρθεί πριν από ένα, δύο ή επτά χρόνια – για να ανατρέχει, π.χ., σε ένα email που είχε σταλθεί παλιά – τότε η αρχειοθέτηση και όχι το backup είναι η κατάλληλη τεχνολογία που πρέπει να χρησιμοποιηθεί. Ωστόσο, υπάρχει αρκετή σύγχυση ανάμεσα στο τι συνιστά ένα backup και στο τι η αρχειοθέτηση. Το backup δημιουργείται ως ένα εργαλείο ανάκτησης.

Αλλά όσο περνάει ο καιρός, αυτό το αντίγραφο μπορεί να είναι το μόνο διαθέσιμο. Ακόμα και μετά από πέντε ή επτά χρόνιο, αυτό το backup παραμένει το μέρος που θα ανατρέξει κανείς για να αποκτήσει ένα παλιό αντίγραφο αναφοράς των δεδομένων. Και εξαιτίας αυτής της κατάστασης, πολλοί τείνουν να χειρίζονται τα backups ως αρχεία. Το πρόβλημα μιας “backup-as-archive” προσέγγισης είναι ότι πολλά από τα δεδομένα που περιέχονται σε αυτά τα πενταετίας tapes δεν έχουν καμία άξιας αναφοράς αξία. Σε αντίθεση με τα αρχεία που διατηρούνται σε ένα δεόντως ευρετηριοποιημένο, αναζητήσιμο και τελευταίας τεχνολογίας αρχείο, τα “backup pools” αποτελούν μεγάλα κομμάτια από κλασικά deduplicated δεδομένα που έχουν σχεδιαστούν πρωταρχικά για πλατφόρμες backup και όχι για εργαζόμενους που θέλουν να τα διαβάσουν.

Ιδανικά, ένας οργανισμός θα πρέπει να είναι σε θέση ώστε να απολάψει τα καλύτερα από τους δύο κόσμους. Θα πρέπει να αρχειοθετεί ένα κατάλληλο υποσύνολο των δεδομένων παραγωγής και να τα φυλάσσει μακροπρόθεσμα με πολύ μεγαλύτερη αποτελεσματικότητα. Τα backups θα μπορούν, έτσι, να εκπνέουν γρηγορότερα, εξοικονομώντας χρόνο και χρήμα. Θυμηθείτε ότι τα backup δεν διαθέτουν την μακροχρόνια αξία που έχει η αρχειοθέτηση.

Τα backups ως αρχειοθέτηση
Αν και η απόκτηση μιας ειδικής λύσης αρχειοθέτησης μπορεί να φέρει το επιθυμητό αποτέλεσμα, αρκετές φορές δεν γίνεται αυτό για διάφορους λόγους. Όπως καταγράφει η ESG στη μελέτη της, σχεδόν των 83% των οργανισμών χρησιμοποιούν τις λειτουργίες αρχειοθέτησης που τους παρέχουν τα προϊόντα backup, ως μέρος, αν όχι πλήρως, της λύσης αρχειοθέτησης που χρησιμοποιούν. Αυτό σημαίνει ότι χρησιμοποιούν διάφορες αποδεκτές λειτουργίες αρχειοθέτησης που οι κατασκευαστές λύσεων backup έχουν ενσωματώσει στα προϊόντα τους. Αυτές οι λειτουργίες αποτελούν συνήθως ένα υποσύνολο του σετ λειτουργιών ενός προϊόντος αρχειοθέτησης και πλασάρονται ως μια αρκετά καλά λύση αρχειοθέτησης μέσα σε ένα προϊόν backup.


Αναπτύσσοντας μια στρατηγική προστασίας δεδομένων
Οι οργανισμοί προστατεύουν τα επιχειρηματικά δεδομένα για να πετύχουν μια πληθώρα από στόχους:

Ανθεκτικότητα (Resiliency): δημιουργία μιας ανθεκτικής υποδομής, ώστε οι τελικοί χρήστες σχεδόν ποτέ να μην βιώνουν δυσλειτουργίες στις εργασίες τους. Η ανθεκτικότητα μπορεί να επιτευχθεί χρησιμοποιώντας τις κατάλληλες τεχνολογίες διαθεσιμότητας των δεδομένων. Ανάκτηση (Recovery): αν προκύψει μια κρίση απώλειας δεδομένων, ένα δεύτερο αντίγραφο μπορεί να χρησιμοποιηθεί για να επαναφέρει έναν server ή μια αποθηκευτική συστοιχία σε ένα προηγούμενο χρονικά σημείο, που αντιπροσωπεύει μια καλή κατάσταση λειτουργίας. Για μια σχεδόν άμεση επανέναρξη της λειτουργίας το καλύτερο που μπορεί να γίνει είναι το shapshotting του primary storage. Αποκατάσταση (Restoration): λειτουργώντας παρόμοια με την ανάκτηση, η αποκατάσταση επαναφέρει τα επιλεγμένα δεδομένα σε ένα προηγούμενο επιλεγμένο σημείο. Στην προκειμένη περίπτωση αυτό μπορεί να επιτευχθεί με το backup σε ένα δευτερεύον σύστημα. Διατήρηση (Retention): φύλαξη των δεδομένων για μεγάλα χρονικά διαστήματα για συμμόρφωση με κανονιστικές απαιτήσεις ή για την ικανοποίηση μακροχρόνιων επιχειρησιακών στόχων. Εδώ γίνεται αντιγραφή των επιθυμητών δεδομένων για μακροχρόνια αποθήκευσή τους. Ανακατανομή/Βελτιστοποίηση (Reclamation): μεταφορά των στάσιμων δεδομένων από το primary storage, ώστε να μπορεί γίνει καλύτερη διαχείριση αυτού του ακριβού asset. Αυτή η διαδικασία επιτυγχάνεται συνήθως βέλτιστα με την αρχειοθέτηση, όπου, στην προκειμένη περίπτωση, δεν γίνεται αντιγραφή, αλλά μεταφορά δεδομένων από το πρωτεύουν storage σε ένα σιλό προστασίας δεδομένων.

To κόστος αν…
Είναι σημαντικό να αναγνωριστεί το οικονομικό ρίσκο, όταν δεν ληφθούν οι προαναφερόμενες διαδικασίες προστασίας δεδομένων. Αν παραλείψει κανείς να πάρει αυτά τα μέτρα τότε θα επωμιστεί ένα σημαντικό κόστος. Το βάρος της ευθύνης πέφτει στο ΙΤ το οποίο θα χρειαστεί να προθυμοποιηθεί για να επενδύσει σε μια υπηρεσία ή μια πλατφόρμα σήμερα για να γλιτώσει το κόστος χιλιάδων ευρώ αύριο. Τελικά, τα περισσότερα από τα “R” που αναφέρθηκαν προηγουμένως δεν προβλέπονται ρητά στους προϋπολογισμούς που δομεί το ΙΤ. Ούτε το κόστος αυτής της αδράνειας εμφανίζεται στo ΙΤ budget.

Ωστόσο, θα πρέπει να έχετε κανείς κατά νου τα εξής: H αποτυχία χειρισμού της ανθεκτικότητας (χρησιμοποιώντας τεχνολογίες διαθεσιμότητας των δεδομένων), της ανάκτησης (με μηχανισμούς snapshotting) ή της αποκατάστασης (μέσω του backup) θα αυξήσει το χρόνο downtime ενός οργανισμού λόγω θεμάτων που σχετίζονται με τα δεδομένα ή την κατάσταση του συστήματος. To downtime μεταφράζεται σε μειωμένη παραγωγικότητα και κατ’ επέκταση σε συρρίκνωση της κερδοφορίας, αύξηση του κόστους και διαρραγή της ικανοποίησης των τελικών χρηστών.

Η αποτυχία ανάπτυξης τεχνολογιών αρχειοθέτησης για τη διαχείριση της φύλαξης των δεδομένων με έναν ευέλικτο και οικονομικά αποτελεσματικό τρόπο θα ανεβάσει το κόστος και θα επισύρει, ενδεχομένως, οικονομικά πρόστιμα λόγω παραβίασης των κανονιστικών απαιτήσεων. Η αποτυχία βελτιστοποίησης του storage μέσω της μεταφοράς των στάσιμων δεδομένων από τις συστοιχίες του παραγωγικού storage θα έχει ως αποτέλεσμα μια αναποτελεσματική χρήση των πόρων και ενδέχεται ακόμα και να επιβραδύνει τις επιδόσεις του storage παραγωγής και των servers. Όλες οι παραπάνω ενέργειες μπορούν να εφαρμοστούν μαζί ή ανεξάρτητα μεταξύ τους. Το μυστικό σε κάθε περίπτωση είναι αφενός να ποσοτικοποιηθεί το κόστος μιας αποτυχημένης ενσωμάτωσής τους και αφετέρου να εκτιμηθούν οι εξοικονομήσεις σε capex και opex στις οποίες συνεισφέρει η κάθε δραστηριότητα στο σύνολο, όταν αξιοποιηθεί σωστά.

Εν κατακλείδι
Υπάρχουν πολλοί λόγοι για να διατηρεί κανείς αντίγραφα των δεδομένων του. Ωστόσο, δεν μπορούν να ικανοποιηθούν βέλτιστα όλοι αυτοί μόνο από το backup. Υπάρχει η αρχειοθέτηση, το snapshotting και η διαθεσιμότητα, τεχνικές που συμβάλουν στη δημιουργία αντιγράφων δεδομένων. Η Διεύθυνση Πληροφορικής ενός οργανισμού οφείλει να σκεφτεί προσεκτικά γιατί κρατάει συγκεκριμένα σετ δεδομένων και ποιος θα χρησιμοποιήσει αυτά τα σετ. Με αυτόν τον τρόπο οι μάνατζερ θα μπορέσουν να καταλάβουν καλύτερα τι εργαλεία θα χρειαστεί να αναπτύξουν για να δομήσουν μια ευρεία στρατηγική backup και αρχειοθέτησης. Είναι, σημαντικό, λοιπόν για τους επαγγελματίες του ΙΤ να κατανοήσουν το «γιατί» και το «σε ποιον» του backup και του archiving.

Χρειάζεται, επίσης, να κατανοήσουν την ποσοτική επίδραση στην επιχείρηση της αδυναμίας δράσης. Αν δεν το πράξουν, τότε θα περιορίσουν τον οργανισμό τους σε έναν “backup-only” κόσμο. Δύο πράγματα που πρέπει να κάνουν είναι τα εξής; – Nα ξεκινήσουν να εμπλέκουν τη διοίκηση, τους υπεύθυνους διαχείρισης εφαρμογών και δεδομένων, το νομικό τμήμα και την ομάδα συμμόρφωσης με τα κανονιστικά πλαίσια, το προσωπικό του ΙΤ και τις ομάδες διαχείρισης αρχείων σε μια κοινή συζήτηση για το πώς αυτοί που χρησιμοποιούν ή εξαρτώνται από τα δεδομένα μπορούν να επιλέξουν τι θα φυλαχθεί. – Ως επόμενο βήμα, χρειάζεται να ποσοτικοποιηθούν οι επιπτώσεις της αδράνειας και να αξιολογηθούν ποιες είναι οι τρέχουσες δυνατότητες του ΙΤ.

Μόνο αφού ολοκληρωθούν τα δύο παραπάνω μπορεί κανείς να καθορίσει μια ευρύτερη στρατηγική προστασίας και διαχείρισης των δεδομένων, η οποία θα περιλαμβάνει τόσο λύσεις backup όσο και αρχειοθέτησης, χρησιμοποιώντας με ασφάλεια τους on-premise μηχανισμούς ανάκτησης και τους off-premises μηχανισμούς φύλαξης. Η χάραξη μιας τέτοιας ευρείας στρατηγικής προστασίας και διαχείρισης των δεδομένων θα βοηθήσει τον οργανισμό να προχωρήσει μπροστά και να αυξήσει την ανταγωνιστικότητα και αποτελεσματικότητά του.