Στην εποχή της «έξυπνης» αξιοποίησης των Big Data, η ηλεκτρονική αρχειοθέτηση των δεδομένων παίζει ολοένα και πιο σημαντικό ρόλο.
Σε πρόσφατη έρευνά της για το «Ψηφιακό Σύμπαν» η IDC προβλέψει ότι το 2020 οι παγκόσμια διαθέσιμες ποσότητες δεδομένων θα ανέρχονται στα 40ΖΒ. Ο όγκος των δεδομένων που συσσωρεύεται σε κάθε επιχείρηση είναι τεράστιος και αυξάνεται μέρα με τη μέρα, ωστόσο πόσο από αυτά, άραγε, χρησιμοποιούνται στην πραγματικότητα; Πώς μπορούν οι παραγωγικές βάσεις δεδομένων να αποφορτιστούν, ώστε να μπορέσουν να επεξεργαστούν την ποικιλία των νέων πληροφοριών;
Μια συστημική βάση αρχειοθέτησης δεν εκπληρώνει μόνο τους κανόνες συμμόρφωσης, αλλά φροντίζει να κάνει χώρο και για τις τεράστιες ποσότητες δεδομένων. Οι επιχειρήσεις που επικεντρώνονται στα νέα δεδομένα και φροντίζουν να τα χρησιμοποιούν στοχευμένα, αποκτούν ένα σαφές ανταγωνιστικό πλεονέκτημα – εφόσον απομακρύνουν από τα παραγωγικά συστήματα τα ανενεργά δεδομένα και τα αρχειοθετήσουν ξεχωριστά. Με αυτόν τον τρόπο αυξάνονται οι επιδόσεις των παραγωγικών συστημάτων και ταυτόχρονα μειώνονται τα κόστη για τα μέσα αποθήκευσης.
Ωστόσο, ποια στρατηγική είναι κατάλληλη για την αρχειοθέτηση των υπαρχόντων βάσεων δεδομένων; Σε αυτήν την περίπτωση σημαντικό ρόλο παίζουν οι κανονισμοί ελέγχου και συμμόρφωσης. Έχει δημιουργηθεί η εντύπωση ότι οι επιχειρησιακά σχετιζόμενες πληροφορίες πρέπει να φυλαχθούν κατά τέτοιο τρόπο, ώστε να μην μπορούν να αλλάξουν αργότερα, αλλά και να είναι διαθέσιμες ανά πάσα στιγμή σε ένα εύλογο χρονικό διάστημα. Σε αυτό ακριβώς το σημείο οι λύσεις δημιουργίας αντιγράφων ασφαλείας για τις βάσεις δεδομένων φθάνουν τα όριά τους.
Ξεπερνώντας τα όρια
Αν, για παράδειγμα, μια εταιρεία αποθηκεύει τα αρχεία backup ή εξαγωγής μόνο σε ένα «μακροπρόθεσμο» σύστημα αποθήκευσης, τότε θα πρέπει να ανακατασκευαστεί όλη η δομή δεδομένων, μόλις χρειαστεί η πρόσβαση σε κάποια πληροφορία. Επιπλέον, οι εταιρείες είναι εξαρτημένες από τον κατασκευαστή της βάσης δεδομένων και το file format που χρησιμοποιείται, κάτι το οποίο, υπό συνθήκες, μπορεί να δημιουργεί προβλήματα συμβατότητας.
Η χρήση διαφορετικών σχημάτων δεδομένων αυξάνει την προσπάθεια αναζήτησης και φέρνει τις λειτουργίες backup και εξαγωγής δεδομένων στα όρια τους. Το επακόλουθο είναι η δημιουργία πολλών προβλημάτων. Παρόμοια προβλήματα δημιουργούν συχνά στις επιχειρήσεις οι λύσεις που αναπτύσσονται εσωτερικά. Στην προκειμένη περίπτωση τα δεδομένα εξάγονται από τις βάσεις δεδομένων των συστημάτων παραγωγής και στη συνέχεια αποθηκεύονται στα δικά τους formats.
Ωστόσο, αυτές οι λύσεις βασίζονται στο υπάρχον σύστημα δεδομένων και συχνά στην εμπειρία αυτού που τις ανάπτυξε. Τα προβλήματα εμφανίζονται σε μια τέτοια περίπτωση, όταν πρέπει κανείς να αποκτήσει πρόσβαση στα δεδομένα. Μια ανεξάρτητη στάνταρ λύση συνδέει την τήρηση των κανόνων συμμόρφωσης στη βάση δεδομένων με μειωμένα κόστη λειτουργίας, καθώς μπορεί να μειώσει σημαντικά τον όγκο της βάσης δεδομένων.
Σε αυτήν την περίπτωση τα δεδομένα αποθηκεύονται αυτόματα σε ένα ανεξάρτητο του κατασκευαστή format. Με αυτόν τον τρόπο, μέσω του SQL, το ΙΤ μπορεί να δώσει τη δυνατότητα στους τελικούς χρήστες να ψάξουν στα δεδομένα με διάφορα κριτήρια αναζήτησης. Τι συμβαίνει με τα δεδομένα από εφαρμογές, οι οποίες δεν χρησιμοποιούνται πλέον σε μια εταιρεία; Αυτό το ερώτημα αντικατοπτρίζει ένα θέμα που απασχολεί όλο και πιο συχνά τη Διεύθυνση Πληροφορικής.
Συχνά για να δοθεί απάντηση σε αυτό το ερώτημα εξετάζεται το ενδεχόμενο να επωμιστεί κανείς πάλι τα κόστη αδειοδότησης και συντήρησης της εφαρμογής, παρόλο που τα αποθηκευμένα από αυτή την εφαρμογή δεδομένα χρησιμοποιούνται μόνο για λόγους τήρησης των κανόνων συμμόρφωσης και αναθεώρησης. Η αποθήκευση των δεδομένων χρήσης και των meta data σε ανοικτά formats εκτός της βάσης δεδομένων, διασφαλίζει την μακροπρόθεσμη πρόσβαση σε αυτά, επειδή αυτά είναι ανεξάρτητα του συστήματος και ακολουθούν την αρχή “back to the roots“.
Ετσι, το παλιό σύστημα δεν χρειάζεται πλέον και μπορεί να απενεργοποιηθεί. Και μπορεί να καταλάβει κανείς το σημαντικό όφελος που προκύπτει, από την εξοικονόμηση των δαπανών για τη λειτουργία και συντήρηση του παλιού συστήματος. Υποθέτοντας ότι κάθε χρόνο ο όγκος δεδομένων τουλάχιστον διπλασιάζεται, η διαχείριση και η αποθήκευση τους αποτελεί ένα κρίσιμο θέμα για κάθε Διευθυντή Πληροφορικής. Οι επιχειρήσεις χρειάζεται να αναπτύξουν για τα Big Data στρατηγικές για την αρτιότερη και αποτελεσματικότερη αρχειοθέτηση των δεδομένων κι έτσι να ενσωματώσουν ένα δομημένο Information Lifecycle Management στην υποδομή τους.