Δεν είναι μόνο οι χρήστες που θεωρούν τα συστήματα αυτόματης επικοινωνίας ανεπαρκή, τουλάχιστον στη σημερινή τους μορφή. Πρόσφατη διαφήμιση της Wind βασίζεται σε αυτήν την ανεπάρκεια, ωθώντας τους αγοραστές να αγοράσουν ένα ακριβότερο πακέτο επικοινωνίας, για να έχουν τη δυνατότητα να επικοινωνούν με άνθρωπο, όταν αντιμετωπίζουν κάποιο πρόβλημα, αντί με τη «χαζή» μηχανή. Βέβαια, η εταιρεία χρησιμοποιεί τη «χαζή» μηχανή για πελάτες που έχουν αγοράσει φθηνότερες υπηρεσίες της, αλλά αυτό είναι ένα θέμα που δεν θα μας απασχολήσει τώρα. Η Εθνική Τράπεζα, σε συνεργασία με εταιρεία που ειδικεύεται στον τομέα των analytics, υλοποίησε μια εφαρμογή που της επιτρέπει να διαβάζει τα email που δέχεται από τους πελάτες της και να δίνει αυτόματες απαντήσεις που έχουν το σωστό περιεχόμενο. Το σύστημα εκπαιδεύτηκε διαβάζοντας εκατοντάδες χιλιάδες email και η εκπαίδευση του θα συνεχιστεί επ’ αόριστον, καθώς ο θεωρητικός στόχος είναι μια επικοινωνία, στην οποία ο αποστολέας του μηνύματος δεν θα μπορεί να ξεχωρίσει αν η απάντηση έχει γραφτεί από άνθρωπο ή μηχανή. Σε παγκόσμιο επίπεδο, η Google έχει αναθέσει σε φάρμες υπολογιστών την ανάλογη εκπαίδευση, προκειμένου να γίνεται κατανοητή η έκφραση του ανθρώπινου λόγου, αλλά και να είναι εφικτή η αυτόματη μετάφραση μεταξύ διαφορετικών γλωσσών. Όποιος έχει χρησιμοποιήσει το Google Translate, έχει συνειδητοποιήσει ότι οι αλγόριθμοι της εταιρείας τα καταφέρνουν πολύ καλά. Λίγο πριν το lock down τύχαμε παρόντες σε συνομιλία, ανάμεσα σε Έλληνες και Κινέζους, η οποία ολοκληρώθηκε με επιτυχία μέσω του Google Translate. Η προσπάθεια κατανόησης του ανθρώπινου λόγου από τις μηχανές έχει ιστορία δεκαετιών, η οποία σε επίπεδο πολυεθνικών εταιρειών ξεκινά από το σύστημα Dragon της IBM. Σε αυτήν την ιστορία, αρκετή συμμετοχή έχει και ο νυν Υπουργός Παιδείας, Βασίλης Διγαλάκης, ο οποίος έχει επενδύσει αρκετά χρόνια της καριέρας του στη δημιουργία και εκπαίδευση αλγορίθμων κατανόησης του ανθρώπινου λόγου. Αν θέλουμε να είμαστε πιο ανοιχτοί στον ορισμό της ομιλίας, θα βάζαμε την αρχή κάπου στο 1950, οπότε η Bell είχε αναπτύξει ένα σύστημα που καταλάβαινε αρκετά καλά την εκφώνηση ψηφίων, αν ακουγόντουσαν δυνατά και καθαρά. Αναζητώντας τις αιτίες της αργής εξέλιξης από το 1980 μέχρι σήμερα, θα βρούμε μπροστά μας τις δύο πιο συνηθισμένες για την καθυστέρηση της εξέλιξης της πληροφορικής τεχνολογίας, γενικότερα. Μη επαρκής ποσότητα δεδομένων και περιορισμένη επεξεργαστική ισχύ. Η ανάπτυξη του Internet και των τηλεπικοινωνιακών δικτύων, σε συνδυασμό με την ανάπτυξη των επεξεργαστών, κάνουν καθημερινά τα δύο αυτά εμπόδια ολοένα και χαμηλότερα.

 

«Καλημέρα Siri» (προσπαθήστε να βρείτε ένα ελληνικό αντίστοιχο του ουδέτερου Siri), «ξέμεινα από ταμπλέτες πλυντηρίου»
Αν γράφαμε στον τίτλο «Καλημέρα Κατίνα, ξέμεινα από σαλαμάκι» θα προκαλούσαμε το γέλιο κάποιων και το θυμό των φεμινιστριών. Αν πάλι γράφαμε «Καλημέρα παιδί…» θα ήμασταν πιο ουδέτεροι όσον αφορά το φύλο, αλλά θα προκαλούσαμε το θυμό όσων ανθίστανται στην παιδική εργασία. Οπότε, αφήνουμε αυτό το δισεπίλυτο πρόβλημα σε εσάς και συνεχίζουμε.

Σύμφωνα με τον Marc Neumeyer, Digital Marketing Manager της Accenture Interactive, οι τεχνολογίες αυτόματης επικοινωνίας, αναμένεται να γίνουν πολύτιμοι βοηθοί στην καθημερινή ζωή των καταναλωτών. Αρχικά, η τεχνολογία αναγνώρισης ομιλίας ήταν κλεισμένη στα πληροφορικά συστήματα των εταιρειών που ήθελαν να την αξιοποιήσουν. Πρόσφατα όμως, τα δίκτυα υψηλών ταχυτήτων σε συνδυασμό με τις τεχνολογίες cloud και τη γιγάντωση των πωλήσεων έξυπνων συσκευών, έφεραν σε επαφή με τις τεχνολογίες αυτές, δισεκατομμύρια ανθρώπους. Όταν λέμε στο κινητό μας «Θέλω να πάω Κάνιγγος 24», αυτό στέλνει την πληροφορία σε Google Cloud, όπου εκεί γίνεται η επεξεργασία από τους αλγόριθμους αναγνώρισης ομιλίας και στη συνέχεια, ο υπολογιστής της Google μας επιστρέφει στην οθόνη ένα στίγμα και τη διαδρομή που θα ακολουθήσουμε προς αυτό. Συνδυαστικά, οι Amazon, Google και Apple προσφέρουν υπηρεσίες προσωπικού βοηθού σε περισσότερα από 3,2 δισεκατομμύρια ανθρώπους παγκοσμίως, ενώ στις αρχές του 2019, περίπου 133 εκατομμύρια άνθρωποι σε όλον τον κόσμο είχαν στην κατοχή τους ένα smart speaker.

Αν η Fjord Trends και η CMSWire έχουν δίκιο, σύντομα, οι άνθρωποι θα θέλουν να απαλλάξουν τα χέρια τους από οποιαδήποτε σχέση με πληκτρολόγιο, ποντίκι ή ακόμα και οθόνη αφής. Οπότε, το βασικό μέσο επικοινωνίας με τις μηχανές θα είναι η φωνή. Για τις επιχειρήσεις, αυτή η αλλαγή νοοτροπίας θα συνεπάγεται περισσότερη εξάρτηση από πλατφόρμες ανάλυσης ομιλίας. Ήδη, οι επιχειρήσεις είναι εξαρτημένες από διάφορες πλατφόρμες, για εφαρμογές ERP, CRM και SCM. Όμως, σύμφωνα με αναλυτές, όπως ο εκπρόσωπος της Accenture, η εξάρτηση αυτή θα γίνει ακόμα μεγαλύτερη. Ο λόγος μάλλον είναι ότι οι «ισχυρές» πλατφόρμες τεχνητής νοημοσύνης βρίσκονται ήδη στα χέρια λίγων εταιρειών που έχουν τη δυνατότητα να επενδύουν σε αυτές με επεξεργαστική ισχύ και data scientists, ενώ παράλληλα, επειδή είναι οι πλατφόρμες αυτές είναι οι καλύτερες, συγκεντρώνουν δωρεάν το μεγαλύτερο όγκο δεδομένων. Επομένως, η επιλογή μιας εταιρείας να δεθεί με κάποιο προμηθευτή, θα μοιάζει με ένα γάμο που το διαζύγιο δεν θα είναι εύκολη υπόθεση.

Ένας δεύτερος παράγοντας ρίσκου, θα ήταν η απροθυμία των καταναλωτών να συνεχίσουν να μοιράζονται τα δεδομένα τους. Οι περισσότεροι καταναλωτές δεν έχουν συνειδητοποιήσει ότι με τα δεδομένα που παρέχουν στις πλατφόρμες τεχνητής νοημοσύνης, βελτιώνουν τη λειτουργία τους και κατ’ επέκταση τα κέρδη των εταιρειών που αυτές ανήκουν. Έχουν αρχίσει όμως να συνειδητοποιούν ότι οι πλατφόρμες αυτές έχουν τη δυνατότητα να παραβιάζουν την προσωπική τους ζωή, όποια στιγμή το θελήσουν. Το Facebook στοχεύει πλέον τις διαφημίσεις, βασισμένο ακόμα και σε συναισθηματικούς παράγοντες. Η Google γνωρίζει ότι ψωνίζουμε σε ένα συγκεκριμένο σουπερμάρκετ και μας προτείνει προσφορές, ενώ βρισκόμαστε εκεί.

Η Amazon ξέρει ότι αφού μας αρέσει η ρόκα, μάλλον μας αρέσει και το ξύδι και πάει λέγοντας. Βέβαια, αυτά θα μπορούσαν να είναι πταίσματα, μπροστά σε όσα κάνει η Κίνα για να ελέγξει μειονότητες που κατοικούν στα εδάφη της ή όσα κάνουν οι υποψήφιοι πρόεδροι των ΗΠΑ για να κερδίσουν τις επόμενες εκλογές.
Μπορεί, η απάθεια να παραμένει το κυριότερο χαρακτηριστικό ενός καταναλωτή, αλλά κανείς δεν μπορεί να εγγυηθεί τη διάρκεια της. Επομένως, η επένδυση σε τεχνολογίες ανάλυσης μεγάλων δεδομένων, θα πρέπει να λάβουν υπόψιν ότι γίνονται υπό το πρίσμα ενός μεσοπρόθεσμου ορίζοντα. Αυτό σημαίνει ότι οι εταιρείες που θα ωφεληθούν περισσότερο είναι αυτές που θα επιλέξουν προμηθευτές, οι οποίοι είναι δυνατοί τώρα και όχι τα ερχόμενα δέκα χρόνια.

Η πανδημία κολλάει παντού
Αν δεχτούμε τις προβλέψεις των αναλυτών, ο κόσμος μετά την πανδημία θα είναι περισσότερο ψηφιοποιημένος σε σχέση με πριν. Επομένως, η επικοινωνία εξ αποστάσεως θα είναι συχνότερη και η αξιοποίηση αυτοματισμών που θα διευκολύνουν την επικοινωνία περισσότερο επιτακτική. Σε λιγότερο από 2 χρόνια, οι αγορές μέσω ψηφιακού προφορικού λόγου, αναμένεται να έχουν ξεπεράσει τα 40 δισεκατομμύρια, δολάρια.

Σταγόνα στον ωκεανό του καταναλωτισμού, αλλά μην ξεχνάμε πως η ιστορία έχει δείξει ότι τα πράγματα στο ψηφιακό κόσμο, αναπτύσσονται με εκθετικό ρυθμό. Ας πάρουμε για παράδειγμα την εφαρμογή Teams, η οποία πριν την πανδημία, ήταν γνωστή… σε έναν «κλειστό οικογενειακό κύκλο» και τώρα έχει μπει στις ζωές 200 εκατομμυρίων ανθρώπων σε όλον τον κόσμο. Σε μια μόνο μέρα τον Απρίλιο του 2020, η Microsoft κατέγραψε περισσότερα από 4,1 δισεκατομμύρια λεπτά συναντήσεων μέσω του Teams. Κάτι ανάλογο συνέβη και με τα κέντρα εξυπηρέτησης πελατών των επιχειρήσεων, οι οποίες, στην κυριολεξία μέσα σε μια νύχτα, χρειάστηκε να επενδύσουν στην αγορά εξοπλισμού και υπηρεσιών, προκειμένου να ικανοποιήσουν τον εκθετικά αυξημένο όγκο εισερχομένων αιτημάτων. Η προσπάθεια ήταν στις περισσότερες περιπτώσεις αποτυχημένη, καθώς μεγάλες εταιρείες, κυρίως αεροπορικές, αναγκάστηκαν να βάζουν τα αιτήματα σε αναμονή μέχρι και για 10 ώρες.

Σύμφωνα με το white paper που δημοσίευσαν οι Saurabh Goorha and Raghuram Iyengar, συνεργάτες της Wharton Customer Analytics, δύο είναι οι βασικοί τεχνολογικοί παράγοντες -καθώς όπως είδαμε υπάρχουν και κάποιοι που δεν εξαρτώνται από την τεχνολογία-, οι οποίοι θα κρίνουν την ανάπτυξη των αυτοματισμών αναγνώρισης ομιλίας μετά την έναρξη της πανδημίας. Ένας είναι η αποδοχή τεχνολογιών IoT και Machine Learning.

Ο δεύτερος είναι οι εξελίξεις στην ανάλυση συναισθημάτων, όπως αυτά εκφράζονται μέσω του γραπτού και του προφορικού λόγου.
Η ακαδημαϊκή κοινότητα αναμένεται να παίξει σημαντικό ρόλο στην εξέλιξη των αλγορίθμων που θα συνδυάσουν τη γρήγορη και ακριβή ανάλυση δεδομένων δίνοντας πρωταγωνιστικό ρόλο στο συναισθηματικό παράγοντα. Η Lyle Ungar, από το Πανεπιστήμιο της Πενσιλβανία, σε συνεργασία με την ομάδα της, ανέλυσαν εκατομμύρια δημοσιεύσεις σε μορφή video, ήχου και κειμένου για να αναγνωρίσουν ανάμεσα στο θόρυβο περιπτώσεις που έδειχναν σύνδεση με προβλήματα ψυχικής υγείας. Τα συμπεράσματα από αυτή τη μελέτη και άλλες παρόμοιες που γίνονται κατά εκατοντάδες σε όλον τον κόσμο, θα μπορούσαν να αξιοποιηθούν στη συνέχεια σε επιχειρηματικές εφαρμογές.

Θα παραμείνουν όμως τα σύνορα της επιστήμης και της έρευνας ανοιχτά; Σύμφωνα με τον Paul Krugman, η πανδημία θα επιταχύνει τη νοοτροπία «build and buy local» που είχε αρχίσει να σχηματίζεται πριν την εμφάνισή της. Χώρες, όπως η Κίνα και η Ινδία, αναπτύσσουν τεχνολογίες που ταιριάζουν καλύτερα στις δικές τους αγορές με δισεκατομμύρια καταναλωτές. Η αντίστοιχη κινέζικη Google, για παράδειγμα, θα επενδύσει περισσότερο στην εκπαίδευση της τεχνητής της νοημοσύνης, ώστε η πλατφόρμα της να καταλαβαίνει την κινέζικη γλώσσα και τα συναισθήματα των Κινέζων καταναλωτών.
Επομένως, τα συμπεράσματα που πρώιμα ωριμάζουν είναι τα εξής: α) η χρήση αυτοματισμών είναι αναγκαία περισσότερο σε σχέση με την περίοδο πριν την πανδημία, β) οι χώρες με μικρούς πληθυσμούς που μιλούν την ίδια γλώσσα, είτε θα πρέπει να επενδύσουν σε ανάπτυξη των δικών τους αλγόριθμων, είτε να ασπαστούν μιαν άλλη γλώσσα για τον ψηφιακό κόσμο και γ) οι μεταβολές των καταστάσεων είναι τόσο συχνές που οι επενδύσεις θα πρέπει να γίνονται γρήγορα και με την καλύτερη δυνατή αναλογία κόστους επένδυσης με αξία για την επιχείρηση. NW

Σε ποιον ανήκουν οι αλγόριθμοι και τα δεδομένα;

Η ιδιοκτησία αλγόριθμων και δεδομένων κρίνει την ανάπτυξη επιχειρήσεων που επενδύουν στην αυτοματοποίηση της επικοινωνίας, μέσω προφορικού ή γραπτού λόγου. Ας δούμε δύο διαφορετικά παραδείγματα.
Στην περίπτωση της Εθνικής Τράπεζας, οι αλγόριθμοι ανήκουν στην εταιρεία που της παρέχει το πληροφοριακό σύστημα σε μορφή υπηρεσίας, ενώ τα δεδομένα, μέσω άτυπης συμφωνίας, ανήκουν στην τράπεζα. Αυτή η άτυπη συμφωνία αναμένεται να κρίνει πολλά στο μέλλον, καθώς οι χρήστες έχουν αρχίσει να κατανοούν ότι τα δεδομένα, όπως ο γραπτός λόγος σε ένα email ή ο προφορικός λόγος σε μια τηλεφωνική επικοινωνία, ανήκουν σε αυτούς και επομένως, η τράπεζα χρειάζεται τη συγκατάθεση τους για να τα αξιοποιήσει και ειδικά σε αυτήν την περίπτωση να τα μεταφέρει προς επεξεργασία σε κάποιον τρίτο.

Στην περίπτωση της Google, οι αλγόριθμοι ανήκουν στην ίδια, αλλά και πάλι τα δεδομένα ανήκουν στους χρήστες των υπηρεσιών της. Ας φανταστούμε ποια θα ήταν η ποιότητα των υπηρεσιών πλοήγησης της Google, αν το 50% των χρηστών της υπηρεσίας ΔΕΝ έδιναν τη συγκατάθεσή τους για την επεξεργασία των δεδομένων που σήμερα “χαρίζουν” στη Google μέσω της σχετικής εφαρμογής. Επίσης, ας σκεφτούμε το σενάριο που αυτό το 50% των χρηστών συνασπίζεται και ζητά από τη Google κάποιο αντίτιμο, προκειμένου να δώσουν τη συγκατάθεσή τους για την αξιοποίηση των δεδομένων. Το ίδιο θα μπορούσε να συμβεί σε όλες τις εταιρείες που αξιοποιούν δεδομένα, τα οποία έχουν δημιουργηθεί από τους χρήστες των υπηρεσιών τους ή τους αγοραστές των προϊόντων τους, μεταξύ αυτών και η προαναφερόμενη τράπεζα.

Επομένως, αν και με την πρώτη ματιά φαίνεται ότι η εξέλιξη της τεχνολογίας αυτοματισμών, εξαρτάται σε σημαντικό ποσοστό από το πόσο ευφυείς μπορούν να γίνουν οι αλγόριθμοι και πόσο ισχυροί οι υπολογιστές, στην πραγματικότητα η εξέλιξη εξαρτάται από τη διάθεση των πολιτών και των καταναλωτών να συνεχίζουν να χαρίζουν τα δεδομένα τους.
Αυτός είναι ένας παράγοντας που οι εταιρείες θα πρέπει να λάβουν σοβαρά υπόψιν πριν ξεκινήσουν τις επενδύσεις τους, ειδικά αν δεν έχουν το μέγεθος της Google ή της Facebook, γιατί δεν είναι απίθανο ένα σενάριο που θα χρειαστεί να πληρώσουν αναδρομικά για δεδομένα που χρησιμοποιούν ήδη και στη συνέχεια να καταβάλουν μια τακτική αμοιβή για δεδομένα που θα απολαμβάνουν.