Η υιοθέτηση του deduplication συνεχίζεται με αμείωτη ένταση για τις σύγχρονες επιχειρήσεις, προσφέροντάς τους εξοικονόμηση χώρου και ενέργειας, αλλά και μείωση του λειτουργικού τους κόστους.

Παλιά, τα tapes αποτελούσαν τη λύση για την αρχειοθέτηση των «βουνών» δεδομένων που κάθε μεγάλος οργανισμός παρήγαγε. Με την πάροδο του χρόνου, ο όγκος των δεδομένων αυξήθηκε σε τέτοιο βαθμό, που δημιούργησε την ανάγκη για κάτι το διαφορετικό. Ετσι γεννήθηκε η τεχνολογία του data deduplication, η οποία, όπως είναι γνωστό, δίνει τη δυνατότητα στους χρήστες να αποθηκεύσουν περισσότερα δεδομένα σε λιγότερους φυσικούς δίσκους. Αυτό δίνει μεγαλύτερη ευελιξία στους οργανισμούς, επιτρέποντάς τους να διαχειριστούν καλύτερα το συσσωρευμένο όγκο δεδομένων.

Ενας ακόμα παράγοντας που ωθεί τις επιχειρήσεις στο deduplication είναι οι ανησυχίες τους για την απώλεια δεδομένων (εξαιτίας φυσικών καταστροφών, κλοπής κ.λπ.), κάτι που δημιουργεί την ανάγκη για την αποθήκευση πολλαπλών αντιγράφων των δεδομένων τους, κρατώντας παράλληλα σε χαμηλά επίπεδα το δεσμευμένο χώρο. Εκτός από την αποτελεσματικότερη διαχείριση των δεδομένων, το data deduplication προσφέρει πρόσθετα πλεονεκτήματα όσον αφορά το κόστος, όπως είναι η μειωμένη κατανάλωση ηλεκτρικής ενέργειας και το μικρότερο φυσικό αποτύπωμα. Ετσι, αν και το deduplication χρησιμοποιήθηκε αρχικά στα συστήματα backup, έχει αρχίσει πλέον να εφαρμόζεται και στα πρωτεύοντα συστήματα αποθήκευσης δεδομένων των οργανισμών.

Σε αυτό παίζει ρόλο και το ότι εκτός από την δραματική μείωση στην κατανάλωση αποθηκευτικού χώρου για backup, οι τεχνολογίες deduplication μπορούν να μειώσουν το χρόνο restore και να εξαλείψουν την ανάγκη για τα incremental backups σε tapes. Tα περισσότερα συστήματα επιτρέπουν την ανάκτηση backup σε συγκεκριμένο χρόνο και ημερομηνία, ενώ μερικά επιτρέπουν το αποκεντρωμένο backup. Πλέον οι λύσεις deduplication έχουν αρχίσει να χρησιμοποιούνται ευρύτερα σε projects βελτίωσης της απόδοσης του storage, σε έργα server virtualization, αλλά και για disaster recovery.

Δεν χρησιμοποιούνται μόνο σε projects μεγάλων οργανισμών, αλλά και σε επιχειρήσεις οποιουδήποτε μεγέθους, οι οποίες βλέπουν την πληροφορία ως περιουσιακό στοιχείο που τους βοηθά να διαφοροποιηθούν επιχειρηματικά και ως εκ τούτου είναι πρόθυμες να αναγνωρίσουν, διαχειριστούν και να προστατέψουν την πληροφορία. Η σημαντικότερη αξία που προσφέρει το deduplication εντοπίζεται στον αποθηκευτικό χώρο και στο bandwidth του δικτύου. Και τα δύο παίζουν μεγάλο ρόλο στον καθορισμό του λειτουργικού κόστους κατά την ενσωμάτωση του disaster recovery, όσον αφορά το χώρο που χρειάζεται το disaster recovery και το bandwidth που απαιτείται, όταν γίνεται ανάκτηση των δεδομένων.

Ζητήματα
Η πρώτη γενιά του deduplication ήρθε την κατάλληλη στιγμή, ωστόσο, η αύξηση των δεδομένων, τα περιορισμένα budgets και η πολυπλοκότητα των virtual περιβαλλόντων απαιτούν από τις τεχνολογίες data deduplication να προσαρμοστούν στις σημερινές ανάγκες. Τα προβλήματα που δημιουργεί η συνεχής αύξηση των δεδομένων υπήρχαν από παλιά. Η διαφορά σήμερα είναι η αυξανόμενη πολυπλοκότητα του περιβάλλοντος ΙΤ σε συνδυασμό με τον όγκο των δεδομένων. Αυτό έχει ως αποτέλεσμα, οι εταιρείες να έρχονται αντιμέτωπες με τα εξής ζητήματα:

Backup. Η Διεύθυνση Πληροφορικής χρειάζεται να κάνει ένα πλήρες backup ανά ένα συγκεκριμένο χρονικό διάστημα το οποίο δεν αλλάζει (συνήθως ανά 12 ώρες). Ούτε αλλάζει το SLA (Service Level Agreement), το οποίο καθορίζει πόσο θα διαρκέσει ένα backup. Οι επιχειρήσεις χρειάζονται μια ταχύτερη, πιο αξιόπιστη μέθοδο για τη λήξη backups η οποία θα ταιριάζει στο budget τους. Oι περισσότεροι IT administrators έρχονται αντιμέτωποι με αυτό το ζήτημα καθημερινά, όταν χρειάζεται να δουν αν το προηγούμενο νυκτερινό backup διεκπεραιώθηκε κανονικά.

• Disaster Recovery. Οι επιχειρήσεις πρέπει να έχουν τη δυνατότητα ανάκτησης δεδομένων από διαφορετικές τοποθεσίες, ώστε να είναι προστατευμένες από αστοχίες υλικών ή φυσικές καταστροφές. Παραδοσιακά, αυτό γινόταν μέσω της αποθήκευσης tapes, ωστόσο όλο και περισσότερες επιχειρήσεις δείχνουν ενδιαφέρον για τη χρησιμοποίηση ηλεκτρονικών μεθόδων μετακίνησης των δεδομένων που δεν απαιτούν την ανθρώπινη επέμβαση. Τέτοια συστήματα απαιτούν ταχύτητα και αποτελεσματικότητα, εξαιτίας της ποσότητας των δεδομένων που εμπλέκονται.

• Remote Office Protection. Οι επιχειρήσεις και οι υπάλληλοι τους είναι σήμερα περισσότερο από ποτέ αποκεντρωμένοι. Η προστασία των δεδομένων στα απομακρυσμένα γραφεία και η δυνατότητα διάθεσης των εταιρικών δεδομένων στους υπαλλήλους, όπου και αν βρίσκονται, αποτελεί μια από τις προκλήσεις που καλείται να αντιμετωπίσει η Διεύθυνση Πληροφορικής καθώς ο όγκος των δεδομένων αυξάνει.

Προοπτικές
Η συνεχής αύξηση του όγκου των δεδομένων βοηθά στην ευρύτερη αποδοχή των λύσεων data deduplication – ως αντιστάθμισμα του κόστους αποθήκευσης και διαχείρισης των δεδομένων. Η υιοθέτηση του deduplication ενισχύεται και από την αυξανόμενη ανάγκη των CIOs να επενδύσουν στα projects backup και την επιχειρηματική συνέχεια. Η ανάγκη τήρησης των κανονισμών και τα συνεπαγόμενα επιχειρηματικά ρίσκα, παρακινούν τους CIOs να λάβουν υπόψη τους τέτοιες τεχνολογίες. Η μείωση της ποσότητας των δεδομένων που ρέει στο εταιρικό δίκτυο μειώνει την καταπόνηση σε αυτό και βελτιώνει τη διαθεσιμότητα του bandwidth.

Παράλληλα, μειώνεται το κόστος που αφορά τη διαχείριση μεγάλου όγκου δεδομένων, ελαττώνονται οι ανάγκες σε χώρο για τις εταιρικές συστοιχίες storage και μειώνεται κατ’ επέκταση η ενεργειακή κατανάλωση. Ενα ακόμα πλεονέκτημα του deduplication είναι ότι υπάρχουν διαθέσιμα περισσότερα δεδομένα σε virtual tape libraries, βοηθώντας τις εταιρείες να κρατήσουν αρκετούς μήνες backups εκεί, διευκολύνοντας την ανάκτηση παλιότερων δεδομένων.

Ανάμεσα στα σημαντικότερα πλεονεκτήματα του deduplication περιλαμβάνονται η μείωση της απαιτούμενης χωρητικότητας για μια συγκεκριμένη ποσότητα δεδομένων, η δυνατότητα αποθήκευσης σημαντικά περισσότερων δεδομένων για ένα συγκεκριμένο χώρο, η ταχύτερη ανάκτηση δεδομένων και η ευκολότερη ικανοποίηση του RTO (Recovery Time Objective), η εξοικονόμηση του δικτυακού bandwidth και η μείωση του κόστους διαχείρισης του storage, ως αποτέλεσμα των μειωμένων απαιτήσεων σε πόρους storage.

H εφαρμογή του data deduplication στην πηγή των δεδομένων εξαλείφει την άσκοπη αποστολή περιττών δεδομένων κατά τη λήψη του backup και restore. Αυτό εκτονώνει την τεράστια ποσότητα δεδομένων που δημιουργούνται καθημερινά στα data centers και στα απομακρυσμένα γραφεία. Eπιπλέον, μειώνει το χρόνο που χρειάζεται για το backup, βελτιώνει την αποδοτικότητα του storage παραγωγής (το κάνει να τρέχει ταχύτερα), ενώ μειώνει αντίστοιχα και το φόρτο του εταιρικού δικτύου. Σήμερα, τα δεδομένα αποτελούν το κλειδί για την ανάπτυξη και την αύξηση της ανταγωνιστικότητας μιας εταιρείας.

Η επιτυχία ή αποτυχία πλέον είναι άμεσα συνυφασμένη με το πόσο καλά μπορεί μια εταιρεία να διαχειριστεί τα δεδομένα της. Η αύξηση του όγκου των δεδομένων, αυξάνει αντίστοιχα το κόστος διαχείρισής τους, με αποτέλεσμα όλο και περισσότερες εταιρείες σήμερα να έχουν αρχίσει να αντιλαμβάνονται τη σημασία που έχει το data deduplication.


Tο data deduplication στην πράξη

O Νίκος Πετρόπουλος, Deputy Director, Group IT Operations του ομίλου Τράπεζας Πειραιώς-Αγροτικής Τράπεζας μιλάει στο netweek για τα οφέλη που προσφέρει το data deduplication στην υποδομή ΙΤ ενός σύγχρονου οργανισμού.

netweek: Για ποιο λόγο χρησιμοποιείτε το data deduplication και ποια οφέλη έχετε αποκομίσει από αυτό;
Νίκος Πετρόπουλος: To data deduplication το χρησιμοποιούμε κυρίως σε τρεις περιοχές. Καταρχήν, για το backup των δεδομένων μας, τα οποία αυξάνονται με εκθετικό ρυθμό. Το data deduplication μας έφερε μια μεγάλη ευκολία, γιατί χρησιμοποιούμε deduplication πάνω στον ίδιο τον host, το οποίο σημαίνει ότι ελέγχονται τα δεδομένα από τον server, πριν φύγουν για το backup. Ετσι, αποφορτίζεται το δίκτυό μας. Επιπλέον, διευκολύνεται το κεντροποιημένο backup από άλλες υπηρεσίες που βρίσκονται μακριά. Ετσι δεν χρειάζεται να συντηρούμε υποδομές σε περιφερειακά κτίρια. Αυτό οδηγεί σε μείωση του κόστους (σε ταινίες, bandwidth και συσκευές backup).

To δεύτερο μεγάλο όφελος για εμάς εντοπίζεται στο data replication που έχουμε με το disaster site μας, το οποίο βρίσκεται στη Θεσσαλονίκη. Η απόσταση είναι μεγάλη, όπως και το σχετικό κόστος, ενώ υπάρχει και κάποιο αναπόφευκτο latency (για τόσο μεγάλες αποστάσεις). Το deduplication και το compression μας έδωσαν μια σημαντική λύση σε αυτή την περίπτωση, απελευθερώντας bandwidth, μειώνοντας το κόστος συντήρησης της γραμμής σύνδεσης με τη Θεσσαλονίκη και επιτρέποντας την προσθήκη και άλλων συστημάτων στο backup μας.

Και τέλος σκοπεύουμε να εκμεταλλευθούμε το deduplication βραχυπρόθεσμα, μέσα στη χρονιά, όπου θα «σερβίρουμε» όλα τα applications μέσω Citrix (application virtualization). Γι΄ αυτό το έργο θα χρειαστούμε τεράστιους χώρους και σε αυτό το σημείο έρχεται πάλι να μας βοηθήσει το deduplication, γιατί σε συνδυασμό με έξυπνες λύσεις archive μπορείς να έχεις πολύ μικρούς χώρους για την αποθήκευση δεδομένων.  

netweek: Πόσο χρήσιμο είναι το deduplication σε περιπτώσεις όπου γίνεται συγχώνευση διαφορετικών data centers και υποδομών;
Νίκος Πετρόπουλος:
Κατά τις συγχωνεύσεις κληρονομείς πάρα πολλά παλιά δεδομένα, τα οποία δεν μπορείς να τα πετάξεις. Πρέπει να τα αρχειοθετήσεις. Εκεί το deduplication παίζει πολύ σημαντικό ρόλο καθώς σε βοηθάει, για παράδειγμα, τα 100 ΤΒ που κληρονομείς να τα κάνεις 10ΤΒ. Αυτό θα γίνει τώρα με την Αγροτική και με τις άλλες τράπεζες που έρχονται.

netweek: Είναι γνωστό ότι ο Ομιλος σας ακολουθεί μια στρατηγική για την κλιματική αλλαγή. Πιστεύετε ότι το data deduplication μπορεί να βοηθήσει σε αυτή την “πράσινη” στρατηγική;
Νίκος Πετρόπουλος:
Ο Ομιλος ακολουθεί μια «πράσινη» στρατηγική, την οποία εφαρμόζει και στα data center του. Οταν κτίσαμε το data center που είμαστε τώρα, ο δείκτης PUE (Power Usage Effectiveness, δείκτης που χαρακτηρίζει πόσο «πράσινο» είναι ένα data center) ήταν πάνω από 2. Τα τελευταία χρόνια καταφέραμε με συνεχείς ελέγχους και βελτιώσεις να μειώσουμε αυτό τον δείκτη λίγο πιο κάτω από το 2. Στο καινούργιο data center που ετοιμάζουμε σκοπεύουμε να είμαστε κοντά στο 1,5, που είναι και το ιδανικό. Σε αυτό θα βοηθήσει πολύ το data deduplication. Kαι αυτό διότι μέσω αυτού έχεις πολύ μικρότερα συστήματα, πολύ λιγότερα δεδομένα, τα οποία χρειάζονται λιγότερη ενέργεια και λιγότερη ψύξη. Αυτό σε βοηθάει να έχεις ένα «πράσινο» data center.

netweek: Πώς βλέπετε το μέλλον όσον αφορά το data deduplication;
Νίκος Πετρόπουλος:
Εχει, ήδη, αρχίσει να συζητιέται, και δειλά-δειλά να επιχειρείται από κάποιους, το πραγματικό storage deduplication. Δηλαδή, να δούμε πραγματικά storages που χρησιμοποιούν deduplication. Αλλά λόγω περιορισμού υπολογιστικής ισχύος, δεν έχει βγει ακόμα κάτι σε παραγωγή. Αν αυτό μπορέσει να υλοποιηθεί,αν κυκλοφορήσει μια τέτοια συσκευή, τότε αυτή θα φέρει επανάσταση στο μέλλον. Με αυτόν τον τρόπο τα κανονικά και όχι τα αρχειοθετημένα δεδομένα θα γίνονται deduplicated σε πραγματικό χρόνο. Κάποιοι κατασκευαστές έχουν υλοποιήσει λύσεις real time compression, αλλά το real time deduplication θα είναι μια επαναστατική λύση, όταν έρθει.