Τα δεδομένα τείνουν να γίνουν το «πετρέλαιο» της ψηφιακής εποχής μας. Οι εταιρείες που αναλύουν τον τεράστιο όγκο δεδομένων που συσσωρεύεται καθημερινά, εκμαιεύοντας τη σωστή πληροφορία, αποκτούν ένα σαφές ανταγωνιστικό πλεονέκτημα και ξεχωρίζουν στην αγορά.

Ενα τσουνάμι δεδομένων εξαπλώνεται καθημερινά. Κάθε δύο χρόνια διπλασιάζονται οι νέες ποσότητες δεδομένων, όπως καταγράφουν οι oι έρευνες αγοράς της IDC. Η αποτελεσματική εκμετάλλευση των δεδομένων αποτελεί κλειδί για την επιτυχία μιας εταιρείας σήμερα και σε αυτό τα Visual Analytics μπορούν να παίξουν ένα κρίσιμο ρόλο.

Στόχος των Visual Analytics είναι να οδηγήσουν σε ένα ευκολότερο τρόπο κατανόησης ενός τεράστιου όγκου δεδομένων μέσω της οπτικοποίησής τους. Με αυτόν τον τρόπο μπορεί να αναγνωρίζει κανείς τάσεις και άγνωστες συσχετίσεις. Tα Visual Analytics (VA) έχουν σημειώσει μια αξιοσημείωτη ανάπτυξη τα τελευταία χρόνια. Το ενδιαφέρον στα συστήματα VA είχε εντοπιστεί αρχικά στη δημόσια ασφάλεια, αλλά εξαπλώθηκε γρήγορα στα οικονομικά, στις ασφάλειες, στη μετεωρολογία και σε πολλές άλλες περιοχές.

Η ανάγκη των Visual Analytics προέκυψε από τις αυξανόμενες ποσότητες δεδομένων και από μια γενικευμένη απουσία των κατάλληλων μηχανισμών υποστήριξης και ανάλυσής τους. Η μαζική εισροή δεδομένων δημιούργησε την ανάγκη για συστήματα που υποστηρίζουν και βελτιώνουν γνωστικές δραστηριότητες υψηλού επιπέδου, όπως είναι η αναλυτική αιτιολογία, η ανακάλυψη της γνώσης, η πρόβλεψη και η λήψη αποφάσεων.

Εξαιτίας του εκτεταμένου πεδίου των VA, του μεγάλου αριθμού τεχνικών αλληλεπίδρασης και αναπαράστασης και της συνεπαγόμενης πολυπλοκότητας, ένα μεγάλο μέρος της έρευνας στα Visual Analytics εστιάζει στο «χτίσιμο εντυπωσιακών εργαλείων» και, ως αποτέλεσμα, παραμελούνται τα γνωστικά και αντιληπτικά ζητήματα, σχετικά με το πώς οι αναλυτές λύνουν προβλήματα, παίρνουν αποφάσεις, αλλά και το πώς μπορούν να υποστηριχθούν βέλτιστα οι σύνθετες γνωσιακές δραστηριότητες.

Ως εκ τούτου, για να μπορέσει κανείς να σχεδιάσει αποτελεσματικά συστήματα που υποστηρίζουν αποτελεσματικά τα Visual Analytics είναι κρίσιμο να λάβει υπόψη τις γνωσιακές και αντιληπτικές ανάγκες και ικανότητες των αναλυτών. Επιπλέον, πρέπει να υπάρχει μια ισχυρή σύζευξη και μια αρμονική λειτουργία ανάμεσα σε όλα τα συστατικά μέρη του συστήματος VA.

Οι υπολογιστικές μέθοδοι, οι βάσεις δεδομένων, οι υποδομές software, οι συσκευές εξόδου και εισόδου, οι διαδραστικές παραστάσεις και οι χρήστες, όλα αυτά αποτελούν παραδείγματα τέτοιων συστατικών. Αυτό που καθορίζει την ποιότητα αλληλεπίδρασης ανάμεσα στα διαφορετικά συστατικά ενός συστήματος Visual Analytics είναι η διαδραστικότητα (interactivity). Μπορεί να υπάρχει μια αλληλεπίδραση μεταξύ των συστατικών ενός συστήματος VA, αλλά αν η ποιότητα της αλληλεπίδρασης δεν είναι καλή, το σύστημα δεν θα υποστηρίξει αποτελεσματικά τις λειτουργίες ανάλυσης.

Η πρόκληση
Σήμερα, τα δεδομένα παράγονται σε ένα απίστευτο ρυθμό και η ικανότητα συλλογής και αποθήκευσής τους αυξάνεται σε μεγαλύτερο ρυθμό από την ικανότητα ανάλυσής τους. Στην πάροδο του χρόνου αναπτύχθηκε ένας μεγάλος αριθμός μεθόδων αυτοματοποιημένης ανάλυσης. Ωστόσο, η σύνθετη φύση πολλών προβλημάτων κάνει απαραίτητη την εμπλοκή της ανθρώπινης ευφυΐας σε ένα πρώιμο στάδιο ανάλυσης των δεδομένων.

Οι τεχνικές που χρησιμοποιούν τα Visual Analytics δίνουν τη δυνατότητα στους decision makers να συνδυάσουν την ανθρώπινη ευελιξία, τη δημιουργικότητα και το γνωστικό υπόβαθρο με τις τεράστιες αποθηκευτικές και επεξεργαστικές δυνατότητες των υπολογιστών, ώστε να αποκτηθεί η γνώση σε σύνθετα προβλήματα. Χρησιμοποιώντας προχωρημένα οπτικά interfaces, οι άνθρωποι μπορούν να αλληλεπιδρούν απευθείας με τις δυνατότητες ανάλυσης των υπολογιστικών συστημάτων, κάτι που τους επιτρέπει να παίρνουν καλά τεκμηριωμένες αποφάσεις σε πολύπλοκες περιπτώσεις.

Τα Visual Analytics μπορεί να τα δει κανείς ως μια ολοκληρωμένη προσέγγιση, που συνδυάζει το visualization, τους ανθρώπινους παράγοντες και την ανάλυση δεδομένων. Εκτός από την οπτικοποίηση και την ανάλυση δεδομένων, ιδιαίτερα οι ανθρώπινοι παράγοντες, και ειδικά το κομμάτι της γνώσης και της αντίληψης, παίζουν ένα σημαντικό ρόλο στην επικοινωνία ανάμεσα στον άνθρωπο και στους υπολογιστές, όπως και στη διαδικασία λήψης αποφάσεων. Οσον αφορά το visualization, τα Visual Analytics σχετίζονται με εκείνες τις περιοχές των Information Visualization και Computer Graphics, ενώ η ανάλυση δεδομένων επωφελείται από μεθοδολογίες που έχουν αναπτυχθεί στον τομέα της ανάκτησης πληροφοριών, διαχείρισης δεδομένων και την αναπαράσταση της γνώσης.

Η σύνθετη ανάλυση
Η διαδικασία των Visual Analytics συνδυάζει μεθόδους αυτόματης και οπτικής ανάλυσης με μια στενή εμπλοκή της ανθρώπινης αλληλεπίδρασης, έχοντας ως στόχο την εκμαίευση της πληροφορίας από τα δεδομένα. Σε αρκετά σενάρια εφαρμογής αυτής της λογικής, οι ετερογενείς πηγές δεδομένων χρειάζεται να ενσωματωθούν πριν λάβει χώρα μια οπτική ανάλυση. Ως εκ τούτου, το πρώτο βήμα είναι συχνά να προεργαστεί κανείς και να μετατρέψει τα δεδομένα για να αντλήσει διαφορετικές αναπαραστάσεις για περαιτέρω εξερεύνηση.

Αλλες τυπικές εργασίες «προεπεξεργασίας» περιλαμβάνουν το καθάρισμα των δεδομένων, την κανονικοποίηση, την ομαδοποίηση ή την ενσωμάτωση ετερογενών πηγών δεδομένων. Αφού ο αναλυτής δώσει στα δεδομένα τη μορφή που επιθυμεί, μπορεί να επιλέξει ανάμεσα στη εφαρμογή οπτικών ή αυτοματοποιημένων μεθόδων ανάλυσης. Αν μια αυτοματοποιημένη ανάλυση χρησιμοποιηθεί πρώτα, εφαρμόζονται μέθοδοι data mining για να παράγουν μοντέλα από τα αρχικά δεδομένα. Απαξ και δημιουργηθούν τα μοντέλα, ο αναλυτής προβαίνει σε μια αξιολόγηση, για να βελτιώσει και να επιλέξει εκείνα τα μοντέλα τα οποία θα μπορούν να του επιτρέψουν να αλληλεπιδράσει καλύτερα με τα δεδομένα.

Οι οπτικοποιήσεις επιτρέπουν στους αναλυτές να αλληλεπιδράσουν με τις αυτοματοποιημένες μεθόδους, τροποποιώντας παραμέτρους ή επιλέγοντας άλλους αλγόριθμους ανάλυσης. Η εναλλαγή μεταξύ οπτικών και αυτόματων μεθόδων είναι χαρακτηριστική για τη διαδικασία του Visual Analytics και οδηγεί σε ένα συνεχιζόμενο φιλτράρισμα και επαλήθευση των προκαταρκτικών αποτελεσμάτων. Τα παραπλανητικά αποτελέσματα ενός ενδιάμεσου βήματος μπορούν, έτσι, να εντοπιστούν σε ένα προκαταρκτικό στάδιο, οδηγώντας σε καλύτερες και πιο αξιόπιστες εκτιμήσεις.


Visual Data Mining
Για την ανάλυση ενός τεράστιου όγκου δεδομένων, οι κλασικές μέθοδοι δεν είναι πάντα γρήγορες και αποτελεσματικές. Συν τις άλλοις, δεν είναι εφικτή η απεικόνισή τους με τα κλασικά μέσα, καθώς επηρεάζονται από πολλές παραμέτρους, με αποτέλεσμα η αναπαράστασή τους σε ένα πολυδιάστατο διάγραμμα να μην μπορεί να γίνει κατανοητή, αλλά και επεξεργάσιμη από τους χρήστες.

Γι’ αυτό το σκοπό, η ανάλυση τέτοιων «βουνών» δεδομένων γίνεται με το λεγόμενο Data Mining, στο οποίο αναζητούνται πρότυπα ή ανωμαλίες με στατιστικές μεθόδους. Αυτό λειτουργεί κατά κανόνα μόνο, όταν το πρόβλημα έχει γίνει τόσο καλά κατανοητό, ώστε να είναι εφικτός ο προγραμματισμός του κατάλληλου αλγορίθμου ανάλυσης. Σε πολλές περιπτώσεις, μάλιστα, δεν ξέρει κανείς που πρέπει να ψάξει.

Τα Visual Analytics εκμεταλλεύονται το γεγονός ότι οι άνθρωποι είναι καλύτερα εκπαιδευμένοι, ώστε να αναγνωρίζουν πρότυπα κάθε είδους. Οταν κοιτά κανείς σε γραφικά και χρώματα, μπορεί να αντλήσει πολύ περισσότερες πληροφορίες, από ότι κατά την ανάγνωση κειμένου ή ενός πίνακα, για παράδειγμα. Και όταν τα γραφικά είναι περισσότερο interactive, οι παρατηρητές τους μπορούν να εντοπίσουν γρηγορότερα τις ιδιαιτερότητές τους.
Έχοντας μια άποψη των δεδομένων στο σύνολό τους, οι χρήστες ανακαλύπτουν πιθανώς εντυπωσιακά μοτίβα ή σχηματισμούς.

Στο επόμενο βήμα μπορούν να εστιάσουν περισσότερο σε αυτά τα δεδομένα ή να τα φιλτράρουν. Και να αναλύσουν λεπτομερέστερα αυτά που ξεχωρίζουν. Αυτή η τακτική μπορεί να αποδώσει ιδιαίτερα αποτελέσματα στις γραφικές αναπαραστάσεις δεδομένων, που δεν φαίνεται να έχουν άμεση χωρική συσχέτιση μεταξύ τους.

Ενα πρακτικό παράδειγμα
Ενα παράδειγμα οπτικής ανάλυσης ενός σύνθετου όγκου δεδομένων αποτελεί η αναγνώριση περιπτώσεων εξαπάτησης με πιστωτικές κάρτες. Κάθε πληρωμή που γίνεται με πιστωτικές κάρτες αποτελείται από περισσότερα μεμονωμένα πεδία, όπως το ποσό, ο αριθμός κάρτας, ο τόπος συναλλαγής, το κατάστημα και ο χρόνος αγοράς.

Ερευνητές από το Ινστιτούτο του Fraunhofer δημιούργησαν από χιλιάδες τιμολογημένες αγορές σε βάσεις εβδομάδων, ένα μεγάλο χάρτη KVMap. Αυτός αποτελείται από μικρά τετράγωνα. Κάθε τετράγωνο αντιπροσωπεύει ένα συγκεκριμένο συνδυασμό από δεδομένα κράτησης – για παράδειγμα, πληρωμές στην Ισπανία που έγιναν με μια γερμανική κάρτα Visa. Το KVMap επιτρέπει την ταυτόχρονη απεικόνιση έξι, επτά ή και περισσότερων χαρακτηριστικών από πληρωμές.

Από τον αριθμό των διαπιστωμένων περιπτώσεων απάτης οι ερευνητές υπολόγισαν για κάθε έναν από τους συνδυασμούς, για το αν υπάρχει ένας αυξημένος, μειωμένος ή μεσαίος κίνδυνος εξαπάτησης. Στην προκειμένη περίπτωση, τα τετράγωνο χρωματίζονται κόκκινα (αυξημένος κίνδυνος), μπλε (μειωμένος κίνδυνος), άσπρα (κανονικός κίνδυνος) ή γκρι (δεν υπάρχουν στοιχεία). Αν οι απατεώνες δρούσαν τυχαία, τότε το KVMap θα εμφανίζονταν σαν την εικόνα που εμφανίζεται στην τηλεόραση όταν δεν υπάρχει σήμα.

Καθώς οι απατεώνες δεν δρουν σχεδόν ποτέ χωρίς σύστημα πάντα αφήνουν κάποια ίχνη, τα οποία μπορούν να χρησιμοποιηθούν στην οπτικοποίηση ως μοτίβα – για παράδειγμα, εναλλασσόμενες μπλε και κόκκινες γραμμές ή στήλες. Οταν οι ερευνητές εντοπίσουν στο KVMap τέτοια μη τυχαία χρωματικά δείγματα, τότε πρόκειται κατά πάσα πιθανότητα για τον εντοπισμό μιας περίπτωσης απάτης. Καθώς υπάρχουν διαφορετικά γκρουπ απατεώνων που συμπεριφέρονται με το δικό τους τρόπο, μπορούν να εμφανιστούν σε διαφορετικές περιοχές του KVMap διαφορετικά μοτίβα. Οι χρήστες του συστήματος μπορούν στη συνέχεια να επιλέξουν με ένα κλικ αυτά τα μοτίβα και να εξετάσουν αναλυτικότερα τις πληρωμές. Αυτή η μέθοδος είναι αντίστοιχη, θα έλεγε κανείς, με το να φωτίζει κανείς μια βελόνα στα άχυρα.

Η γνώση που αποκτάται με αυτό τον τρόπο ανάλυσης μπορεί στη συνέχεια να χρησιμοποιηθεί για νέες αγορές – και να ειδοποιείται η τράπεζα χορήγησης της πιστωτικής κάρτας, για ύποπτες αγορές που γίνονται με πιστωτικές κάρτες πελατών της. Το όλο concept θυμίζει ένα παιχνίδι γάτας-ποντικιού. Οταν ο απατεώνας αποτυχαίνει συχνά, τότε αλλάζει την στρατηγική του – η οποία αποτυπώνεται λίγες εβδομάδες αργότερα ως ένα νέο μοτίβο στον KVMap.

Εν κατακλείδι
Είναι γεγονός ότι μια πλήρως αυτοματοποιημένη αξιολόγηση δεδομένων με τα Visual Analytics δεν θα υπάρξει ποτέ, καθώς αυτή η μέθοδος συνδυάζει τη δύναμη των υπολογιστών με την αντιληπτική ικανότητα των ανθρώπων. Από τη μία πλευρά υπάρχει η συμπυκνωμένη υπολογιστική ισχύς και από την άλλη το καλό μάτι και διαίσθηση εντοπισμού εκείνων των μοτίβων που μπορεί να κρύβουν τη χρήσιμη πληροφορία. Όσο πιο καλά γίνει αυτό το «πάντρεμα» τόσο πιο επιτυχημένη είναι η ανάλυση.