Το 2016 ξεκίνησε ως η χρονιά του «εκδημοκρατισμού των δεδομένων». Κι αυτό, καθώς η εκτίμηση ότι θα μπορούσε να «ανοίξει» η πρόσβαση των χρηστών στα insights που προκύπτουν από τα terradata δεδομένων που παράγονται ανά λεπτό. Ωστόσο, τίποτα δεν είναι τόσο απλό όσο φαίνεται.

Τι εννοούμε όταν λέμε «εκδημοκρατισμός των δεδομένων»; Η ιδέα δεν είναι (εντελώς) καινούργια. Από το 2013 άρχισε να ακούγεται ολοένα και περισσότερο η ιδέα του “self-service business intelligence”, η οποία ευαγγελιζόταν την κατάργηση των information silos, την αυτοματοποίηση διαδικασιών και την μειούμενη εξάρτηση των τελικών χρηστών από το IT. Το concept αυτό πολύ γρήγορα εξελίχθηκε στον εκδημοκρατισμό των data analytics, καθώς οι μεγάλες εταιρείες τεχνολογίας δημιουργούσαν εξελιγμένα εργαλεία απλής απεικόνισης των insights που προκύπτουν από τα δεδομένα, σε τελικούς χρήστες που δεν γνωρίζουν καν ότι τα R και Python είναι γλώσσες προγραμματισμού. Η ιδέα λοιπόν αφορά στην πρόσβαση τελικών χρηστών στα δεδομένα, ώστε να μπορούν να δημιουργούν τα δικά τους ερωτήματα και “what-if” σενάρια, λαμβάνοντας επιχειρηματικές αποφάσεις γρηγορότερα και χωρίς την παρέμβαση του ΙΤ (το οποίο μπορεί να βρεθεί σε θέση αδυναμίας να ανταπεξέλθει άμεσα στην πληθώρα των αιτημάτων). Εάν πάρουμε ως παράδειγμα το γενικότερο πεδίο των πωλήσεων, αποφάσεις όπως ποιοι πελάτες δικαιούνται έκπτωση και σε τι ποσοστό, μπορούν (ως έναν βαθμό) να αυτοματοποιηθούν και να λαμβάνονται με βάση πραγματικά μεγέθη κι όχι αδρές εκτίμησεις, γρήγορα και αποτελεσματικά.

«Ανάγκα και θεοί πείθονται»
Τα οφέλη της πρόσβασης περισσότερων τελικών χρηστών στα δεδομένα αφορούν σε περιορισμό του κόστους, βελτιστοποίηση των επιχειρησιακών διαδικασιών και ορθολογικοποίηση των διαδικασιών λήψης αποφάσεων, με βάση τα (πραγματικά) δεδομένα. Όπως αναφέρει το cio.com σε σχετικό άρθρο του, «ο εκδημοκρατισμός των δεδομένων καταρρίπτει τον κανόνα 80/20, όπου το 20% των δεδομένων αξιοποιείται για επιχειρησιακούς σκοπούς και το 80% είναι πολύ περίπλοκα για να χρησιμοποιηθούν». Και είναι μάλλον απίθανο να βρεθεί ένας οργανισμός που θα γυρίσει την πλάτη του σε μια τέτοια υπόσχεση. Στην πραγματικότητα, ο ψηφιακός μετασχηματισμός του επιχειρηματικού κόσμου δεν αφήνει στις επιχειρήσεις την «πολυτέλεια» της επιλογής. Οι αναδυόμενοι «εναλλακτικοί» ανταγωνιστές των μεγάλων και εδραιωμένων οργανισμών μπορούν να αποσπούν μερίδια αγοράς χάρη στην αξιοποίηση των δεδομένων και στην άριστη γνώση των πελατών, κάτι που τους επιτρέπει να σχεδιάζουν προϊόντα και λύσεις προσαρμοσμένα απόλυτα στις ανάγκες τους. Σε αυτό το πλαίσιο, οι οργανισμοί δεν έχουν άλλη επιλογή από το να προσεγγίσουν το agility που επιδεικνύουν πολλές από τις data-driven νεοφυείς επιχειρήσεις, άρα και να απελευθερώσουν την πρόσβαση στα δεδομένα στους τελικούς χρήστες. Σύμφωνα με σχετική έρευνα την Capgemini, «η απελευθέρωση των δεδομένων δίνει το πλεονέκτημα του ‘fail fast’ στους οργανισμούς, επιτρέποντάς τους να δοκιμάζουν εναλλακτικές τακτικές και να αποφασίζουν γρήγορα για εναλλακτικές πορείες, εάν οι πρώτες αποδεικτούν μη αποτελεσματικές». Η ανάγκη για επένδυση σε τεχνολογικά εξελιγμένα εργαλεία, που καθιστούν εφικτή την κατανόηση των insights με απλό τρόπο προκύπτει και από ένα άλλο υπαρκτό πρόβλημα της αγοράς: την έλλειψη ταλαντούχων data scientists. Το 2012, η Gartner προέβλεπε έλλειμμα 100.000 data scientists μέχρι το 2020, για την αγορά των ΗΠΑ μόνο. Επιπλέον,σύμφωνα με στοιχεία του Glassdoor, ο μέσος μισθός για έναν data scientist 113.000 δολάρια, διπλάσιος από αυτόν ενός προγραμματιστή. Εάν υποθέσουμε ότι ένας οργανισμός αποφάσιζε να «φιλτράρει» την πρόσβαση στα δεδομένα, εξαρτώμενος από την εργασία των data scientists για την εξαγωγή στρατηγικών insights, θα έπρεπε να επενδύσει αρκετά στο payroll –και χωρίς εγγύηση ότι θα βρει τους κατάλληλους ανθρώπους. Σε αυτό το πλαίσιο, η ανοιχτή πρόσβαση στα insights φαίνεται ως η πιο συμφέρουσα λύση για τους οργανισμούς –να διευκρινίσουμε ωστόσο ότι η πρόσθετη αξία που φέρνουν οι data scientists σε έναν οργανισμό είναι δεδομένη. Τέλος, η ανοιχτή πρόσβαση στα δεδομένα φαίνεται ότι επιβάλεται και από τη διάδοση του Internet of Things. Εάν λάβουμε υπόψη την πρόβλεψη της Gartner για 50 δις συνδεδεμένες συσκευές μέχρι το 2020 (από 13 δις που είναι σήμερα) και αναλογιστούμε την εκθετική αύξηση των δεδομένων από τους σένσορες μόνο, καθίσταται εμφανές ότι οι οργανισμοί δεν έχουν τη δυνατότητα να δημιουργήσουν αρκετά γρήγορα δομές ελεγχόμενης πρόσβασης στα δεδομένα, ώστε να προλάβουν τις εξελίξεις που δημιουργεί η τεχνολογία.

Ο δύσκολος δρόμος τους εκδημοκρατισμού
Φαινομενικά, το δίλλημα «εκδημοκρατισμός των δεδομένων ή κεντρική εξαγωγή insights» είναι μάλλον ανυπόστατο. Ωστόσο προκύπτει, εάν παρατηρήσει κανείς τον σκεπτικισμό σημαντικής μερίδας των IT (και όχι μόνο) leaders να κάνουν ένα βήμα παραπέρα από την κεντρικοποιημένη δομή επεξεργασίας δεδομένων. Δεν μπορεί κανείς να πάρει ελαφρά τις επιφυλάξεις αυτές, όταν η ανοιχτή πρόσβαση στα δεδομένα μπορεί να δημιουργήσει προβλήματα ασφάλειας, ποιότητας των δεδομένων αλλά και κανονιστικής συμμόρφωσης –υπό τη σκιά του EU General Data Protection Regulation, και ιδιαίτερα στους εποπτευόμενους κλάδους (τηλεπικοινωνίες, χρηματοπιστωτικός τομέας κλπ.). Στην ουσία, δεν έχουμε να κάνουμε με στρατηγική επιλογή για εκδημοκρατισμό των δεδομένων. Το θέμα αφορά στην αποσαφήνιση του όρου «εκδημοκρατισμός», ο οποίος δεν πρέπει να συγχέεται με την… αναρχία. Εκδημοκρατισμός των δεδομένων σημαίνει το να έχει ο κάθε χρήστης τα δεδομένα που χρειάζεται, τη στιγμή που τα θέλει και παρουσιασμένα με τρόπο ανάλογο των γνώσεων και της αρμοδιότητάς του. Προϋποθέτει επίσης το δικαίωμα των χρηστών σε σωστά και ποιοτικά δεδομένα. Μόνο που αυτό δεν μπορεί να επιτευχθεί χωρίς τη θέσπιση μιας αποτελεσματικής data governance πολιτικής, η οποία θα ορίζει:

  • Ποιος κατέχει τα δεδομένα και έχει την ευθύνη αυτών
  • Ποιοι είναι οι οργανωσιακοί ρόλοι και αρμοδιότητες αναφορικά με τα δεδομένα
  • Ποια είναι τα πρότυπα συγκέντρωσης των δεδομένων;
  • Ποιες πολιτικές ισχύουν για την ασφάλεια πληροφοριών και την ιδιωτικότητα των δεδομένων;
  • Ποιος έχει πρόσβαση στα δεδομένα και πώς τα χρησιμοποιεί;

Η χαρτογράφηση ρόλων και αρμοδιοτήτων θέτει τις προϋποθέσεις για πραγματικά ευέλικτες διαδικασίες και διασφάλιση της ποιότητας των δεδομένων. Ωστόσο, οι οργανισμοί θα πρέπει να λάβουν υπόψη το κατά πόσο οι διαδικασίες που θα θεσπίσουν επιτρέπουν την πρόσβαση των χρηστών σε real-time δεδομένα, τα οποία έχουν και τη μεγαλύτερη αξία.

Το «κρυφό» τεχνολογικό δίλημμα
Εν πολλοίς, ο εκδημοκρατισμός των δεδομένων προωθείται ταχύτατα ως έννοια από την ανάπτυξη προηγμένων εργαλείων analytics, τα οποία ενσωματώνουν τις ανάγκες πληροφόρησης των τελικών χρηστών. Η υλοποίηση τέτοιων έργων analytics συνεπάγεται αλλαγές και στην IT αρχιτεκτονική του οργανισμού.

Πολλοί οργανισμοί προωθούν την ιδέα του data lake ως το απαραίτητο στάδιο μετάβασης από το enterprise data warehouse, για τον εκδημοκρατισμό των δεδομένων. Αυτό διότι η εναπόθεση δομημένων και μη δεδομένων σε έναν ενιαίο «χώρο» διευκολύνει την αξιοποίηση δεδομένων που δεν είναι υπό τον έλεγχο του οργανισμού. Η αντίθετη άποψη ωστόσο αναφέρει ότι η δομή των δεδομένων ορίζεται από τις εφαρμογές προέλευσής τους. Όπως αναφέρεται σε σχετικό άρθρο του cio.com, «οι οργανισμοί θα πρέπει να δημιουργήσουν ad hoc ‘μονοπάτια’ για κάθε εφαρμογή». Αυτό μπορεί να αυξήσει την πολυπλοκότητα των διαδικασιών πρόσβασης στα δεδομένα και να παρεμποδίσει (τελικά) τον εκδημοκρατισμό τους. Φυσικά, η IT αρχιτεκτονική εξαρτάται από τις ανάγκες κάθε οργανισμού και δεν υπάρχει “one size fits all” λύση. Οι οργανισμοί θα πρέπει να συνειδητοποιήσουν ότι η «δημοκρατία των δεδομένων» δεν είναι… ουτοπία και ότι απαιτείται πολλή δουλειά και προετοιμασία προκειμένου να επιτευχθεί. Σε αυτό το πλαίσιο, οι οργανισμοί θα πρέπει να οριοθετήσουν και τις προσδοκίες τους αναφορικά με την υιοθέτηση των τεχνολογικών λύσεων analytics, καθώς κανένα εργαλείο δεν μπορεί να εγγυηθεί από μόνο του τη βέλτιστη χρήση των insights.

Άνθρωποι και μηχανές
Ο εκδημοκρατισμός των δεδομένων δεν αφορά μόνο τεχνολογίες, διαδικασίες και IT αρχιτεκτονικές. Είναι πάνω απ’ όλα θέμα κουλτούρας και στρατηγικής. Οι ηγέτες των επιχειρήσεων θα πρέπει να συνειδητοποιήσουν (και να αποδεχτούν) ότι τα data-driven επιχειρησιακά μοντέλα μεταθέτουν την ευθύνη λήψης αποφάσεων σε χαμηλότερα ιεραρχικά επίπεδα. Άρα, ο εκδημοκρατισμός των δεδομένων αναγκαστικά συνάδει με πιο «επίπεδες» οργανωτικές δομές, και πιο συνεργατικά μοντέλα παραγωγής αξίας. Θα μπορούσε να πει κανείς ότι, με την αυξημένη χρήση τεχνολογικών εργαλείων, αλγόριθμων και στατιστικών μοντέλων, η ευθύνη για τη λήψη μιας απόφασης «περνάει» εν μέρει από τον άνθρωπο στη μηχανή. Αυτό διότι η αυξημένη χρήση των analytics σημαίνει ότι οι μηχανές θα κάνουν αυτό στο οποίο είναι καλές: υπολογισμός περίπλοκων σχέσεων με πολλαπλές μεταβλητές. Όμως, σύμφωνα με τη Global Data and Analytics Survey 2016 της PwC, η εξισορρόπηση ανάμεσα σε machine-based και «ανθρώπινες» αποφάσεις είναι μια από τις σημαντικότερες στρατηγικές προκλήσεις για το μεσοπρόθεσμο μέλλον.

Σε αυτό το πλαίσιο, είναι πιο αναγκαίο από ποτέ, οι ηγέτες να ενισχύουν την έννοια του accountability στους ανθρώπους, για τις αποφάσεις τους και την υλοποίηση αυτών. Στην ουσία λοιπόν, το ερώτημα δεν αφορά στο εάν πρέπει να έχουν όλοι πρόσβαση στα δεδομένα, αλλά στο ποιες δικλείδες ασφαλειας θα τεθούν ώστε να λαμβάνονται οι σωστές αποφάσεις.