Τα Big Data δημιούργησαν τα τελευταία χρόνια ένα νέο στέλεχος, τον Data Scientist. Συνδυάζοντας τα προσόντα ενός ικανού προγραμματιστή, ενός στατιστικολόγου κι ενός αφηγητή, επιχειρεί να εντοπίζει τα «χρυσωρυχεία» που κρύβονται στους τεράστιους όγκους δεδομένων.

Σε ένα παλιότερα έξτρα τεύχος του, με θέμα την εφαρμογή τεχνικών ανάλυσης δεδομένων σε, σχεδόν, όλες τις επιστημονικές κατευθύνσεις και επαγγελματικές δραστηριότητες, το The Economist αναφωνούσε “Data, data everywhere!” Επίσης, το Wired Magazine, σε ένα «προφητικό» εξώφυλλό του τον Αύγουστο του 2008, δήλωνε το τέλος των θεωριών: «Η αναζήτηση της γνώσης άρχιζε με ‘μεγάλες’ θεωρίες. Πλέον ξεκινά με τεράστιους όγκους δεδομένων».

Από τότε, ο όρος Big Data εισήλθε στην καθημερινή μας ζωή, με πλήρη κάλυψη από μεγάλες εφημερίδες (π.χ. New York Times), τηλεοπτικά κανάλια (π.χ. BBC) , ακόμα και διεθνή οικονομικά φόρα (π.χ. Davos). Η ανάπτυξη εξελιγμένων εφαρμογών του Web, η επανάσταση των κοινωνικών δικτύων, η μαζική εγκατάσταση δικτύων αισθητήρων και άλλων εφαρμογών που παράγουν δεδομένα έχει οδηγήσει σε μια εκθετική αύξηση του όγκου των δεδομένων, απρόβλεπτους μέχρι πριν μερικά χρόνια. Την ίδια στιγμή, η χρησιμοποίηση διαφορετικών μορφών δεδομένων (δομημένων και αδόμητων, όπως κείμενο, βίντεο, ήχος και εικόνα) στην mainstream ανάλυση τους, μαζί με τον ταχύτατο ρυθμό παραγωγής δεδομένων των μοντέρνων εφαρμογών (velocity), αλλάζουν ριζικά τις θεμελιώδεις έννοιες διαχείρισης δεδομένων. 

Data Scientist: Το επάγγελμα του μέλλοντος
Τα τελευταία δύο με τρία χρόνια έχει αναδειχθεί ένας νέος ρόλος στις εταιρείες και τους οργανισμούς, με την ονομασία Data Scientist. Οπως αναφέρει το Economist στην προαναφερθείσα αναφορά «Mια νέα ιδιότητα στελέχους έχει αναδειχθεί, ο επιστημονικός υπεύθυνος δεδομένων (the data scientist), ο οποίος συνδυάζει τα προσόντα ενός ικανού προγραμματιστή, ενός στατιστικού και ενός αφηγητή, με σκοπό να ανακαλύψει τους ‘σβώλους χρυσού’ που υπάρχουν κάτω από τεράστιους όγκους δεδομένων».

Επίσης, ο Tom Davenport, στο πρόσφατο άρθρο του “Data Scientist: The Sexiest Job of the 21st Century” στο Harvard Business Review, επιχειρηματολογεί για την αναγκαιότητα τέτοιων επαγγελματιών, ενώ επισημαίνει τη μεγάλη έλλειψη ανθρώπων σε αυτόν τον κλάδο. Η McKinsey στη μελέτη της “Big Data: The next frontier for innovation, competition and productivity” (Ιούνιος 2011) προβλέπει ότι θα χρειαστούν 170.000 data scientists και ότι περίπου 1,5 εκατ. μάνατζερ θα πρέπει να εκπαιδευτούν στη χρήση και ανάλυση δεδομένων. Μια πιο πρόσφατη μελέτη της Gartner (Οκτώβριος 2012), είναι ακόμα πιο αισιόδοξη: κάνει λόγο για 1,9 εκατ. θέσεις εργασίας για data scientists και άλλα 4 εκατ. για την  υποστήριξη αυτών, μόνο στις Η.Π.Α.

Ικανότητες και Προσόντα
Yπάρχει μεγάλη συζήτηση για το ποιες είναι οι ικανότητες και γνώσεις που συνθέτουν το υπόβαθρο του data scientist. Καταρχάς, θα πρέπει να έχει πολύ βαθιά γνώση των θεμάτων που αφορούν τη διαχείριση δεδομένων: μοντελοποίηση δεδομένων, γλώσσες ερωτημάτων/ανάκτησης δεδομένων, επεξεργασία, αποθήκευση και ενοποίηση. Θα πρέπει, επίσης, να έχει καλό μαθηματικό υπόβαθρο, ώστε να μπορεί να κατανοήσει/χειριστεί τις στατιστικές μεθόδους και τις τεχνικές “machine learning” που απαιτούνται στην εξαγωγή προτύπων. Τέλος, θα πρέπει να είναι σχετικά ανήσυχο πνεύμα και να γνωρίζει κάποιες αρχές σύγχρονου management, ώστε να ακολουθεί τις εξελίξεις του σημερινού τεχνολογικού κόσμου και να έχει μια αντίληψη του πώς μπορούν να χρησιμοποιηθούν τα δεδομένα στο περιβάλλον του οργανισμού που δραστηριοποιείται.

Κατά τη γνώμη μου – και όπως αναφέρεται συχνά σε ερευνητικά συνέδρια το τελευταίο διάστημα – αυτή είναι η πρώτη φάση των Big Data και του data science (βρεφική περίοδος). Ο όγκος, η διαθεσιμότητα και το εύρος της πληροφορίας (ειδικά με την εισαγωγή των αισθητήρων σε οποιαδήποτε ανθρώπινη δραστηριότητα) θα είναι τέτοια σε μερικά χρόνια, που η ανάλυση δεδομένων και η εξαγωγή προτύπων θα είναι εκ των ουκ άνευ στις επιχειρηματικές διαδικασίες. Συνεπώς, ο μέσο-μακροπρόθεσμος στόχος είναι να δημιουργηθούν απλά, εύχρηστα, καθημερινά εργαλεία (π.χ. σαν το Excel) που θα επιτρέπουν τη συλλογή και ενοποίηση δεδομένων διαφορετικών μορφών και την εξαγωγή προτύπων εύκολα και γρήγορα (democratization of data analysis). Με άλλα λόγια, όλοι μας θα είμαστε λιγότερο ή περισσότερο data scientists.

Εκπαίδευση στην Ελλάδα
Αυτή τη στιγμή, τα πανεπιστήμια διεθνώς που προσφέρουν μεταπτυχιακά προγράμματα στον τομέα των Big Data Analytics είναι ελάχιστα. Τα πρώτα εξειδικευμένα προγράμματα δημιουργήθηκαν στα πανεπιστήμια Northwestern και Carnegie Mellon τον Σεπτέμβριο του 2012. Πολύ σοβαρές προσπάθειες είναι η δημιουργία του Institute of Data Sciences and Engineering στο Columbia University (idse.columbia.edu) και του Data Science Center στο New York University (datascience.nyu.edu).
Και στις δύο περιπτώσεις, σε αυτά τα Ινστιτούτα συμμετέχουν τμήματα όλου του πανεπιστημίου. Στο τμήμα Διοικητικής Επιστήμης και Τεχνολογίας του Οικονομικού Πανεπιστημίου Αθηνών, αναγνωρίζοντας νωρίς την αξία των Big Data και των Business Analytics, αλλά και τη συνάφεια με το αντικείμενο του τμήματός μας, εκπονήσαμε πριν δύο χρόνια μια μελέτη σκοπιμότητας ενός διεθνούς μεταπτυχιακού σε αυτό το θέμα, διερευνώντας και συλλέγοντας απόψεις από καθηγητές σε μεγάλα πανεπιστήμια της Αμερικής.

Τον Οκτώβριο του 2013 θα ξεκινήσει στο Οικονομικό Πανεπιστήμιο Αθηνών το πρώτο πρόγραμμα εξειδίκευσης σε “Big Data and Business Analytics”  στην Ελλάδα – και από τα πρώτα διεθνώς – το οποίο είναι αποτέλεσμα αυτής της προσπάθειας. Τα μαθήματα θα διδάσκονται από καθηγητές των τμημάτων Διοικητικής Επιστήμης και Τεχνολογίας, Πληροφορικής και Στατιστικής, με μεγάλη εμπειρία στο χώρο τους, πλούσια ερευνητική δραστηριότητα και με διδακτορικό δίπλωμα από κορυφαία πανεπιστήμια διεθνώς, όπως είναι τα Columbia University, Imperial University, London School of Economics, Stanford University, University of Frankfurt, University of Maryland και University of Minnesota.

Σκοπός του προγράμματος είναι να προετοιμάσει στελέχη της επιστήμης των δεδομένων (data scientists), τα οποία να μπορούν να συνδυάζουν με τον καλύτερο τρόπο διοικητικές γνώσεις, τεχνικές διαχείρισης δεδομένων και αναλυτικά εργαλεία, βασισμένα κυρίως στη στατιστική και στη μηχανική εκμάθηση, με σκοπό τη βέλτιστη λήψη επιχειρηματικών αποφάσεων. Με άλλα λόγια, να μπορούν να χειριστούν τις πληροφορίες ενός γρήγορα και συνεχώς μεταβαλλόμενου κόσμου, πλούσιου σε δεδομένα, με έναν τρόπο ευέλικτο, αποδοτικό και αποτελεσματικό για το περιβάλλον, στο οποίο δραστηριοποιούνται. Για να επιτευχθεί αυτό θα πρέπει να αποκτήσουν γνώσεις και εμπειρία σε τέσσερις βασικούς τομείς: (α) διαχείριση δεδομένων, (β) στατιστική και μαθηματικά λήψης αποφάσεων, (γ) διοικητική επιστήμη και (δ) εργαλεία και συστήματα παραγωγής analytics.

Big Data and Business Analytics
Το προτεινόμενο υπόβαθρο των υποψηφίων για το πρόγραμμα εξειδίκευσης σε “Big Data and Business Analytics” του Οικονομικού Πανεπιστημίου Αθηνών είναι τεχνολογικό (Πληροφορική, μηχανικοί), με γνώσεις από τις Θετικές Επιστήμες (μαθηματικά, φυσική) και τη Διοικητική Επιστήμη. Ωστόσο, οποιοδήποτε υπόβαθρο θα ληφθεί υπόψη, ανάλογα και με τις επιδόσεις του υποψηφίου. Η προϋπηρεσία δεν είναι απαραίτητη, αλλά επιθυμητή. Το πρόγραμμα θα δεχτεί 35 συμμετέχοντες για το ακαδημαϊκό έτος 2013-2014.

H αίτηση μπορεί να παραληφθεί ηλεκτρονικά στον ιστότοπο analytics.dmst.aueb.gr και να αποσταλεί με email ή fax. Η αίτηση περιλαμβάνει προσωπικά στοιχεία, τίτλους και πληροφορίες σπουδών, βαθμολογίες πτυχίων, απόδειξη γνώσης της αγγλικής γλώσσας, περιγραφή προϋπηρεσίας (αν υπάρχει) και τα στοιχεία δύο ατόμων που θα αποστείλουν συστατικές επιστολές για τον αιτούντα/την αιτούσα.Στους επιτυγχόντες σε όλα τα εξεταζόμενα μαθήματα, το KEK του Οικονομικού Πανεπιστημίου Αθηνών χορηγεί Πιστοποιητικό Επαγγελματικής Εκπαίδευσης και Κατάρτισης, στην οποία αναγράφεται ο μέσος όρος της βαθμολογίας όλων των εξεταζόμενων μαθημάτων και η αντίστοιχη επίδοση. Οι Βαθμοί από 60 έως 75 αποτελούν την κατηγορία «Καλώς», από 76 έως 90 «Λίαν Καλώς» και από 91-100 «Αριστα».

Δρ. Δαμιανός Χατζηαντωνίου
Ο Δρ. Δαμιανός Χατζηαντωνίου είναι Επίκουρος Καθηγητής στο Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας του Οικονομικού Πανεπιστημίου Αθηνών, με αντικείμενο τη Διαχείριση Δεδομένων και την Επιχειρηματική Ευφυΐα. Εκτός των ακαδημαϊκών δραστηριοτήτων, ήταν ιδρυτικό μέλος δύο εταιρειών Πληροφορικής (startups), μία με βάση τη Νέα Υόρκη (Panakea Software Inc., DW&OLAP tools & consulting) και μία στην Αθήνα (Voiceweb, speech & telecom applications), ενώ πρόσφατα ήταν senior research consultant στην Aster Data με έδρα το Σαν Φρανσίσκο (πλέον Sster Teradata).