Καθώς ο όγκος και η πολυπλοκότητα των δεδομένων αυξάνεται, οι οργανισμοί έρχονται αντιμέτωποι με «κύματα» πληροφοριών που δεν ήξεραν καν ότι υπάρχουν. Ο δε προσδιορισμός των στρατηγικών στόχων που συνδέονται με το data mining είναι πιο σημαντικός από ποτέ. Αλλιώς, κινδυνεύουν, όπως η Αλίκη στη χώρα των θαυμάτων, να χαθούν «μέσα στην κουνελότρυπα».

Το data mining είναι ένα… τέχνασμα για τους managers που δεν έχουν πτυχίο στατιστικής. Οι σχετικές τεχνολογίες δίνουν τη δυνατότητα στους business ανθρώπους να ανακαλύψουν συσχετίσεις και μοτίβα μέσα στα δεδομένα, ακόμα και αν το μόνο που ξέρουν είναι να υπολογίζουν τον μέσο όρο» δηλώνει η Meta Brown, μια από τις πιο αναγνωρισμένες ειδικούς στο θέμα των data και συγγραφέας του βιβλίου “Data Mining for Dummies”. Σε θεωρητικό επίπεδο, η αξιοποίηση των εργαλείων data mining δίνει στους οργανισμούς τη δυνατότητα να εξερευνήσουν εναλλακτικές των οποίων την ύπαρξη αγνοούσαν. Στην πράξη, είναι πολύ εύκολο για τα στελέχη να χαθούν μέσα στην πληροφορία, εάν δεν έχουν μια ξεκάθαρη στρατηγική στο μυαλό τους.

Δεδεομένα παντού!
Η μεγαλύτερη εξέλιξη σε οτι αφορά την υιοθέτηση και τη χρήση εργαλείων data mining αφορά στην εκθετική αύξηση των user data και την αυξημένη πολυπλοκότητα αυτών. Εάν λάβουμε υπόψη μόνο τα social media, όπου οι χρήστες αυξήθηκαν από 1,96 δισεκατομμύρια σε 2,14 φέτος, αντιλαμβάνεται κανείς τι σημαίνει αυτό για τα δεδομένα που παράγονται και μπορούν να αξιοποιηθούν για εμπορικούς σκοπούς. Καθώς η αξιοποίηση των μη δομημένων δεδομένων (κείμενο, εικόνες, ήχος, video) τείνει να γίνει buzzword, το ζήτημα που προκύπτει αφορά στον βαθμό ευελιξίας των data mining μοντέλων: όπως αναφέρει σε σχετικό άρθρο του το CIO Review, πολλά από τα data mining μοντέλα είναι φτιαγμένα για να αξιοποιούνται σε στατικά, δομημένα δεδομένα. Οι περισσότεροι αναλυτές συμφωνούν ότι, στη δεδομένη στιγμή, είναι σχεδόν αδύνατο να αυτοματοποιηθούν οι διαδικασίες data mining στα μη δομημένα δεδομένα. Απαιτείται η συνδρομή εξειδικευμένων data scientists, οι οποίοι όχι μόνο θα επεξηγούν τα insights, αλλά και θα «ορθολογικοποιούν» τη διαδικασία, με τη βοήθεια των αλγορίθμων, των κατάλληλων metrics και της γνώσης του business. Σύμφωνα με την Meta Brown ωστόσο, στα μοντέλα data mining, ο όγκος δεδομένων δεν έχει τόση σημασία, όσο η σχετικότητα των πληροφοριών με τα business προβλήματα που χρήζουν επίλυσης, η ποιότητα των δεδομένων αυτών και ο βαθμός λεπτομέρειας που απαιτούν οι business χρήστες. Στο πεδίο του data mining, η ποιότητα έχει μεγαλύτερη βαρύτητα από την ποσότητα.

Οι νόμοι του data mining
Σε έναν «ωκεανό» δεδομένων, και με εργαλεία που εκτελούν περίπλοκους αλγόριθμους σε nanoseconds, είναι εύκολο οι οργανισμοί να πέσουν στην παγίδα του “analysis-paralysis”. Σε αυτό το πλαίσιο, ο data mining expert Tom Khabaza διατύπωσε το 2010 του «9 νόμους του data mining». Η κεντρική ιδέα που διέπει τους νόμους του Khabaza αφορά στην άρρηκτη σύνδεση μεταξύ του business και της διαδικασίας. «Οι στρατηγικοί στόχοι του οργανισμού είναι η αφετηρία για κάθε data mining project. Εάν δεν γνωρίζεις το πρόβλημα που θες να λύσεις, δεν θα βρεις ποτέ τη σωστή απάντηση, υποστηρίζει ο Khabaza, προσθέτοντας ότι «η γνώση του business πρέπει να διέπει κάθε στάδιο της data mining διαδικασίας. Δεν υπάρχουν αποκλειστικά ‘τεχνολογικά’ σημεία στη διαδικασία». Από την πλευρά της, η Meta Brown σημειώνει: «Το data mining δεν υπάρχει για να βρίσκει ενδιαφέρουσες πληροφορίες, αλλά για να εξάγει insights χρήσιμα για την επιχείρηση». Η ευελιξία των μοντέλων είναι το δεύτερο πιο σημαντικό στοιχείο στις data mining διαδικασίες, καθώς ο data miner δεν ψάχνει να βρει την απάντηση σε ένα δεδομένο ερώτημα, αλλά διατυπώνει το ερώτημα και την απάντηση ταυτόχρονα. Άλλωστε, η ουσία του data mining είναι να βρίσκεις απαντήσεις εκεί όπου δεν ήξερες ότι υπάρχουν.