Η φράση “Τα δεδομένα είναι το νέο πετρέλαιο” ειπώθηκε και δημοσιεύτηκε αρκετές φορές την προηγούμενη χρονιά, αν και η πρώτη της εμφάνιση έγινε το 2006. Υπάρχουν αρκετοί λόγοι που κάποιοι θα ήθελαν να ισχύει και αρκετοί άλλοι για τους οποίους δεν ισχύει.

Με ψυχρή λογική, η φράση εύκολα απαξιώνεται, αν σκεφτούμε ότι χωρίς πετρέλαιο, ακόμα και με όλη την “καλή διάθεση” των ανανεώσιμων πηγών, δεν υπάρχει ηλεκτρισμός, και χωρίς ηλεκτρισμό δεν υπάρχουν δεδομένα. Ωστόσο, δε χρειάζεται να γυρίσουμε στην εποχή των σπηλαίων για να αποδείξουμε ότι τα δεδομένα δεν είναι εξίσου πολύτιμα με το πετρέλαιο. Μια ματιά στο σκληρό μας δίσκο ή στο inbox του email αποδεικνύει ότι σε μεγάλο ποσοστό τα δεδομένα μπορεί να είναι άχρηστος “θόρυβος” και η διαχείριση τους άσκοπη κατανάλωση ενεργειακών πόρων. Επίσης, εκτός της συσχέτισης με το πετρέλαιοαρκετά ερωτηματικά εγείρονται αν αναλογιστούμε το ηθικό πλαίσιο της κατοχής δεδομένων, το οποίο συχνά παίρνει διαφορετικά χρώματα, ανάλογα με τον κάτοχο. Για παράδειγμα, ενώ είναι ηθικό εταιρείες, όπως η Google και η Facebook να κατέχουν τεράστιες ποσότητες δεδομένων που δημιουργούν οι χρήστες των υπηρεσιών τους, όπως επίσης είναι ηθικό οι κυβερνητικές υπηρεσίες να κατέχουν τεράστιες ποσότητες δεδομένων για τη δημιουργία των οποίων έχουν πληρώσει οι φορολογούμενοι, είναι ανήθικο ένας hacker να μπαίνει σε μια βάση δεδομένων και να διαθέτει δωρεάν ή με αντίτιμο στο ευρύ κοινό ή σε αγοραστές, τα δεδομένα που κατάφερε να συλλέξει. Το GDPR είναι μια απόδειξη ότι τα πράγματα, όσον αφορά τη διαχείριση των δεδομένων μπορούν να αλλάξουν “από τη μια μέρα στην άλλη”. Επομένως, οι επιχειρήσεις θα πρέπει να είναι προετοιμασμένες για καταστάσεις που τα πολύτιμα δεδομένα τους θα χάσουν την αξία τους, είτε γιατί δεν θα μπορούν να τα κατέχουν, είτε γιατί θα είναι υποχρεωμένες να τα μοιραστούν με όλους και άρα αξία θα τους δώσει αυτός που θα τα αξιοποιήσει με τους πιο ευφυείς τρόπους.

Από το 1 MB στο 1 Petabyte σε λιγότερο από 30 χρόνια
Αν υποθέσουμε ότι μια επιχείρηση το 1980 είχε μια αποθήκη, όπου θα έπρεπε να συσσωρεύσει δεδομένα μεγέθους ενός Petabyte, θα χρειάζονταν 200 εκατομμύρια σκληρούς δίσκους των 5.25 ιντσών, οι οποίοι θα γέμιζαν 245.500 κυβικά μέτρα, δηλαδή οι διαστάσεις της θα ήταν περίπου 100 x 100 x 25 (μέτρα). Σήμερα το 1 Petabyte χωράει σε 0,08 κυβικά μέτρα, οπότε και μόνο αυτό το στοιχείο είναι αρκετό για να συνειδητοποιήσουμε την τεράστια αλλαγή που έχει συμβεί στον τομέα της πληροφορικής που σχετίζεται με τη διαχείριση δεδομένων.

Σε αυτό το χάος των δεδομένων, η εντροπία του οποίου τείνει να αυξάνεται όσο νέες “πύλες” δημιουργούν περισσότερες ροές, όπως για παράδειγμα οι τεχνολογίες IoT, οι άνθρωποι με τη βοήθεια των μηχανών καλούνται να βάλουν μια τάξη. Η διαδικασία τακτοποίησης συνεπάγεται δαπάνη ενέργειας, συχνά πολλαπλάσιας αυτής που χρειάστηκε για τη συλλογή των δεδομένων.

Επομένως, η διάθεση των πόρων σε σχέση με την προσδοκώμενη αξία θα πρέπει να γίνεται με προσεκτικό τρόπο, διαφορετικά το αποτέλεσμα θα είναι ένας “φουσκωμένος” λογαριασμός που θα περιλαμβάνει κόστος αποθήκευσης, διαχείρισης και φύλαξης, ο οποίος δεν θα δικαιολογείται από ανάλογα “φουσκωμένα” έσοδα.

Σε αυτό το πλαίσιο, η διακυβέρνηση των δεδομένων είναι ένα υπερσύνολο διαδικασιών, περιλαμβάνοντας το σύνολο διαδικασιών της διαχείρισης των δεδομένων, της οποίας ως έννοια είναι απόγονος. Η διαχείριση των δεδομένων είναι περισσότερο μια εσωτερική υπόθεση του τμήματος IT και χωρίς αυτό το θεμέλιο λίθο δεν έχει νόημα να κάνουμε σχέδια για διακυβέρνηση. Η διακυβέρνηση δεδομένων είναι κομμάτι της ευρύτερης επιχειρηματικής στρατηγικής, οπότε στη δημιουργία της επιθυμητής διακυβέρνησης εμπλέκονται αρμόδιοι από διαφορετικούς επιχειρηματικούς τομείς, όπως για παράδειγμα το οικονομικό τμήμα, το νομικό τμήμα και την ανώτερη διοίκηση. Μια εταιρεία έχει την επιλογή να διαφυλάξει τα δεδομένα της από οποιονδήποτε πιθανό ανταγωνιστή, όπως οι μεγάλες δυνάμεις φυλάνε τα πυρηνικά τους όπλα, ενώ κάποια άλλη μπορεί να επιλέξει να μοιράζεται ένα ποσοστό των δεδομένων ή και το σύνολο τους με άλλες εταιρείες ή το ευρύτερο κοινό.

Ο σχεδιασμός της διακυβέρνησης δεδομένων μοιάζει περισσότερο με μια δομή που μπορεί να μεταβάλλεται με ευκολία, εξαιτίας εξωτερικών παραγόντων ή εσωτερικών αλλαγών. Η μοντελοποίηση που τελικά θα διαχωρίσει τα δεδομένα σε διαφορετικές ποιότητες, είναι η παράμετρος που θα καθορίσει ότι οι σωστοί παραλήπτες λαμβάνουν τα πιο χρήσιμα δεδομένα με τη λιγότερη δαπάνη ενέργειας.

Σε μια μελέτη της Dataversity, η οποία δημοσιεύτηκε το 2018, αναφέρεται ότι το 42% των διοικητικών εργαζομένων σε επιχειρήσεις δεν έχουν εμπιστοσύνη στην ποιότητα των δεδομένων που κατέχει η επιχείρηση. Αυτό σημαίνει ότι από τα 44 τρισεκατομμύρια gigabytes δεδομένων που θα δημιουργηθούν ή θα αντιγραφούν ετησίως το 2020, σύμφωνα με την IDC, ένα σημαντικό ποσοστό θα είναι από λίγο ως καθόλου χρήσιμα.

Σε μια απλουστευμένη προσέγγιση, ο σχεδιασμός της διακυβέρνησης δεδομένων θα πρέπει να έχει τρεις στόχους: Καλύτερη συμμόρφωση με τα ρυθμιστικά πλαίσια, καλύτερη προστασία και καλύτερη ποιότητα.


Τώρα ξεκινάει το τρένο
Τα καλά νέα είναι ότι ακόμα και σε παγκόσμιο επίπεδο πολύ λίγες ήταν οι εταιρείες που την προηγούμενη χρονιά είχαν εμπειρία σε Data Governance. Μόλις το 1/4 των εταιρειών που συμμετείχαν στην έρευνα της Dataversity έχουν δημιουργήσει κάποιες μετρήσιμες διαδικασίες για να ελέγχουν την αποτελεσματικότητα της διακυβέρνησης δεδομένων. Σύμφωνα με τον Andy Hayler, CEO της εταιρείας αναλύσεων The Information Differnce “Καθώς ο όγκος των δεδομένων αυξάνεται εκθετικά, πολλές από τις διαδικασίες διαχείρισης δεδομένων θα υπολειτουργούν και ενδεχομένως θα αποτυγχάνουν, εάν δεν ενταχθούν στο ευρύτερο πλαίσιο του Data Governance”.

Οι επιχειρήσεις που κάνουν τώρα τα πρώτα βήματα, χρειάζονται μια λίστα προτεραιοτήτων, η οποία σύμφωνα με την έρευνα της Dataversity, θα μπορούσε να προκύψει από τις διαδικασίες που έβαλαν σε προτεραιότητα εταιρείες που είναι ήδη ώριμες στο Data Governance. Το γράφημα “Ποιες διαδικασίες έχετε ήδη θέσει σε λειτουργία προκειμένου να υλοποιήσετε ένα Data Governance πρόγραμμα;” απεικονίζει μια τέτοια λίστα.

Επιπλέον, η έρευνα αποκάλυψε και μια άλλη ενδιαφέρουσα οπτική των αρμόδιων εργαζόμενων, η οποία εστιάζει περισσότερο στις επιθυμίες τους, για την εξέλιξη του Data Governance. Αν και θα περιμέναμε οι τεχνολογίες τεχνητής νοημοσύνης να είναι στο επίκεντρο του ενδιαφέροντος, κάποιες απαντήσεις δείχνουν ότι θα πρέπει πρώτα να λυθούν πιο βασικά προβλήματα.

Για παράδειγμα, ένας από τους συμμετέχοντες στην έρευνα, προσδοκεί περισσότερη ενσωμάτωση διαδικασιών Data Quality στις εφαρμογές που ήδη αξιοποιούνται από τις επιχειρήσεις. Αυτό ίσως σημαίνει περισσότερα και καλύτερα APIs στα εργαλεία που χρησιμοποιούνται για διαχείριση δεδομένων.

Επίσης, η ιεράρχηση της ποιότητας των δεδομένων απασχολεί πολλούς από τους ενδιαφερόμενους. Υπάρχουν εφαρμογές, όπως για παράδειγμα τα εργαλεία που λειτουργούν σε ιατρικές αποφάσεις, οι οποίες χρειάζονται πρόσβαση σε δεδομένα πραγματικού χρόνου, παράλληλα με παλαιότερα δεδομένα, ενώ κάποιες άλλες εφαρμογές μπορούν να λειτουργήσουν με δεδομένα της “προηγούμενης” μέρας.

Οι προσδοκίες των συμμετεχόντων από την αξιοποίηση τεχνολογιών τεχνητής νοημοσύνης, αναδεικνύουν προβλήματα που εμφανίζονται και σε γενικότερες έρευνες σχετικά με την τεχνητή νοημοσύνη, όπως η αυτοματοποίηση διαδικασιών, η βελτίωση των Smart Data Catalogs και διευκόλυνση των χρηστών να πραγματοποιούν αναλύσεις με αιτήματα που θα ορίζονται σε φυσική γλώσσα.

Μια τάση που φαίνεται να ξεδιπλώνεται από την έρευνα, είναι η σύνδεση των διαδικασιών του Data Governance με τις τεχνολογίες Blockchain.

Ήδη, οι περισσότεροι κατασκευαστές λογισμικού έχουν αρχίσει να διερευνούν αυτό το πεδίο και να παρουσιάζουν λύσεις που συνήθως καλύπτουν εξειδικευμένες ανάγκες. Υπεραισιόδοξοι, τουλάχιστον σε αυτή τη φάση ισχυρισμοί, κάνουν λόγο για κατάρρευση των υπαρχόντων μοντέλων Data Governance, όταν οι τεχνολογίες Blockchain αφομοιωθούν από τις επιχειρήσεις.

Το βασικό επιχείρημα σε αυτούς τους ισχυρισμούς, είναι ότι οι τεχνολογίες Blockchain έχουν τη δυνατότητα να αυτοματοποιήσουν πλήρως την κατηγοριοποίηση των δεδομένων και παράλληλα να εξασφαλίσουν την πιστοποίηση τους με τρόπο οριστικό και αμετάκλητο. Ωστόσο, κάποια επιχειρήματα που συναντάμε στον αντίλογο επιβεβαιώνουν ότι το κάθε νόμισμα έχει δύο όψεις. Έτσι, η “απόλυτη” κατηγοριοποίηση με τεχνολογίες Blockchain, ίσως κρύβει τον κίνδυνο δημιουργίας σιλό δεδομένων. Επίσης σε μια “αυστηρή” αλυσίδα δεδομένων που ταιριάζουν μόνο συγκεκριμένοι κρίκοι, ένα νέο πακέτο δεδομένων με ελαφρά διαφορετική μορφή θα είναι απορριπτέο.

Θετικές και αρνητικές επιπτώσεις των τεχνολογιών Blockchain μένει να ειδωθούν, δεδομένου ότι προσωρινά, η βάση της τεχνολογίας δεν είναι ακόμα αρκετά σταθερή, ώστε να στηριχθούν πάνω της οικοδομήματα.

Οι κατασκευαστές λογισμικού έχουν ακόμα πολύ δουλειά
Σχεδόν το 55% των συμμετεχόντων στην έρευνα δήλωσαν ότι οι εφαρμογές που είναι διαθέσιμες στο εμπόριο, ικανοποιούν τις ανάγκες από καλά μέχρι πολύ καλά. Ωστόσο, μένει ένα σημαντικό ποσοστό, για το οποίο η παρούσα κατάσταση δεν είναι ικανοποιητική. Σχεδόν οι μισοί σε αυτήν την κατηγορία, θεωρούν ότι οι εφαρμογές δυσλειτουργικές και ακριβές σε σχέση με τις απαιτήσεις τους. Ένα δεύτερο πρόβλημα προκύπτει από τη χρήση των εφαρμογών, η οποία απαιτεί εξειδικευμένες γνώσεις και και μια ολιστική εικόνα των δυνατοτήτων της πληροφορικής υποδομής. Στο τρίτο γράφημα φαίνεται ότι η εκπαίδευση στον τομέα του Data Governance είναι σε μεγάλο ποσοστό βασισμένη σε πηγές που δεν εφαρμόζουν μια μεθοδική προσέγγιση. Η νεότητα του αντικειμένου δικαιολογεί ακόμα μια τέτοια προσέγγιση, καθώς λίγο πολύ όλοι ακόμα μαθαίνουν. Ωστόσο, η ταχύτητα με την οποία ωριμάζουν οι διαθέσιμες τεχνολογίες απαιτεί μια ανάλογα γρήγορη προσαρμογή και του συστήματος εκπαίδευσης.

Η στοίβα με τα έγγραφα επάνω στο γραφείο
Ένα απόκομμα εφημερίδας, ένα περιοδικό που περιέχει κάποιο ενδιαφέρον άρθρο, η μπροσούρα από μια έκθεση. Όλα αυτά τα κείμενα περιμένουν να διαβαστούν και μετά από κάποιους μήνες καταλήγουν στην ανακύκλωση με ένα συνοπτικό ξεκαθάρισμα. Μπορεί οι λιγότερο παραδοσιακοί να μην έχουν ένα φορτωμένο με χαρτιά γραφείο, αλλά ακόμα και αυτό συνέβη γιατί η εταιρεία το ζήτησε στο πλαίσιο της εταιρικής πολιτικής και του ψηφιακού μετασχηματισμού.

Ωστόσο, αυτό δε σημαίνει ότι η ίδια εικόνα δεν υπάρχει τώρα στο σκληρό δίσκο του προσωπικού τους υπολογιστή και ότι δεν επεκτείνεται μέχρι τα αποθηκευτικά μέσα του εταιρικού data centre.

Η “απληστία” για την πληροφορία αντιμετωπίζεται μόνο με αυτοσυγκράτηση που είτε θα επιβληθεί, είτε θα την αυτοεπιβάλουμε. Συνήθως συμβαίνει το πρώτο και επειδή η ποσότητα των δεδομένων είναι πλέον τεράστια αναλογικά με τα χαρτιά που είχαμε πριν από 30 χρόνια στο γραφείο μας, το data governacne και τα εργαλεία που θα χρησιμοποιήσει η εταιρεία για να το εφαρμόσει παίζουν καθοριστικό ρόλο τόσο στην εξοικονόμηση πόρων όσο και στην αξία των δεδομένων που αποθηκεύουμε.