Τεχνητή νοημοσύνη κουβεντιάζει με ανθρώπους, αλλά δεν τα «πιάνει» – Τι πάει στραβά

Δημοσιεύτηκε στις 06/02/2025 19:15

Τεχνητή νοημοσύνη κουβεντιάζει με ανθρώπους, αλλά δεν τα «πιάνει» – Τι πάει στραβά

Στην ταινία «Her» (2013) ο συγγραφέας Θίοντορ αναπτύσσει ερωτικό δεσμό με μια θηλυκή φωνή που βγαίνει από ένα πρόγραμμα υπολογιστή, ονόματι Σαμάνθα. Το δράμα του, όμως, είναι ότι η Σαμάνθα όσο αληθινή κι αν φαίνεται, δεν θα είναι ποτέ άνθρωπος. Το ίδιο ακριβώς όμως συμβαίνει και με την τεχνολογική νοημοσύνη στην πραγματική ζωή: Συστήματα αυτόματης αναγνώρισης ομιλίας εξακολουθούν να μην μπορούν να ανταποκριθούν σε συνομιλίες.

Δημιουργικά εργαλεία τεχνητής νοημοσύνης όπως το ChatGPT και ψηφιακοί βοηθοί όπως το Siri της Apple και το Alexa της Amazon βοηθούν τους ανθρώπους να λαμβάνουν οδηγίες οδήγησης, και πολλά άλλα.

Σύμφωνα όμως με ερευνητές της γλωσσολογίας και της επιστήμης των υπολογιστών έχουν δείξει ότι αυτά τα συστήματα λειτουργούν χειρότερα για μερικούς ανθρώπους απ΄ ότι σε άλλους.

Πολλοί είχαν απογοητευτικές εμπειρίες, όταν καλούσαν την τράπεζά τους ή την εταιρεία κοινής ωφέλειας και να χρειαζόταν να επαναλαμβάνουν τον εαυτό τους, ώστε το ψηφιακό bot εξυπηρέτησης πελατών στην άλλη γραμμή να τους καταλάβει.

Θα υπάρξουν σοβαρές συνέπειες

Όπως αναφέρει σε άρθρο του στο The Conversation ο Ρομπέρτο Ρέι Αγκούντο, επίκουρος καθηγητής Ισπανικών και Πορτογαλικών στο Κολλέγιο Ντάρτμουθ των ΗΠΑ,  τα συστήματα αυτά τείνουν να κάνουν περισσότερα λάθη.

Αυτό συμβαίνει «εάν δεν έχετε προφορά μη γηγενή ή τοπικό, είστε μαύροι, μιλάτε στα αφροαμερικανικά παραδοσιακά αγγλικά, διακόπτετε τον κωδικό, εάν είστε γυναίκα, είστε πολύ νέοι ή έχετε πρόβλημα ομιλίας».

Τα πράγματα είναι ακόμα χειρότερα για όσους δεν μιλάνε αγγλικά

Σε αντίθεση με τους ανθρώπους, τα συστήματα αυτόματης αναγνώρισης ομιλίας δεν προσπαθούν να καταλάβουν τον συνομιλητή τους παίρνοντας άλλες χρήσιμες ενδείξεις, όπως τον τονισμό ή τις εκφράσεις του προσώπου, αλλά τα παρατάνε. Ή κάνουν μια πιθανή εικασία, κάτι που μερικές φορές μπορεί να οδηγήσει σε λάθος, λέει ο ειδικός.

«Καθώς οι εταιρείες και οι δημόσιοι φορείς υιοθετούν όλο και περισσότερο εργαλεία αυτόματης αναγνώρισης ομιλίας για να μειώσουν το κόστος, οι άνθρωποι δεν έχουν άλλη επιλογή από το να αλληλεπιδράσουν μαζί τους. Όμως, όσο περισσότερο αυτά τα συστήματα χρησιμοποιούνται σε κρίσιμους τομείς, που κυμαίνονται από τους πρώτους ανταποκριτές έκτακτης ανάγκης και την υγειονομική περίθαλψη έως την εκπαίδευση και την επιβολή του νόμου, τόσο πιο πιθανό θα υπάρξουν σοβαρές συνέπειες όταν δεν καταλάβουν τι λένε οι άνθρωποι» προειδοποιεί ο Αγκούντο.

Εαν για παράδειγμα σε ένα τροχαίο ατύχημα καλέσουμε το 166 και αντί για άνθρωπο μας μιλήσει ένα bot που έχει σχεδιαστεί για να εξαλείφει τις μη επείγουσες κλήσεις, χρειαστούν αρκετές προσπάθειες για να γίνουμε κατανοητοί, χάνοντας χρόνο και αυξάνοντας το άγχος.

Ποιά η αιτία

Αυτό οφείλεται στις ομάδες γλωσσικών δεδομένων που χρησιμοποιούν οι προγραμματιστές για να δημιουργήσουν μεγάλα γλωσσικά μοντέλα. Οι προγραμματιστές εκπαιδεύουν συστήματα τεχνητής νοημοσύνης ώστε να κατανοούν και να μιμούνται την ανθρώπινη γλώσσα τροφοδοτώντας τους τεράστιες ποσότητες αρχείων κειμένου και ήχου που περιέχουν πραγματική ανθρώπινη ομιλία. Αλλά με ποιανού ομιλία ενημερώνουν το σύστημα;

Το σύστημα θα μπορεί να κουβεντιάζει με 30ηδες εύπορους λευκούς Αμερικανούς, εάν έχει εφοδιαστεί με πολλές ηχογραφήσεις ατόμων που ταιριάζουν σε αυτό το προφίλ. Αλλά τι γίνεται με τόσα άπειρα προφίλ;

«Για να δημιουργηθούν συστήματα τεχνητής νοημοσύνης που μπορούν να κατανοήσουν τις άπειρες παραλλαγές στην ανθρώπινη ομιλία που προκύπτουν από πράγματα όπως το φύλο, η ηλικία, η φυλή, η πρώτη έναντι της δεύτερης γλώσσας, η κοινωνικοοικονομική κατάσταση, η ικανότητα και πολλά άλλα, απαιτούνται σημαντικοί πόροι και χρόνος» τονίζει ο ειδικός.

Τα πράγματα είναι ακόμα χειρότερα για όσους δεν μιλάνε αγγλικά, προσθέτει. «Τα περισσότερα από τα μεγαλύτερα συστήματα παραγωγής τεχνητής νοημοσύνης στον κόσμο κατασκευάστηκαν στα αγγλικά και λειτουργούν πολύ καλύτερα στα αγγλικά από ό,τι σε οποιαδήποτε άλλη γλώσσα. Στα χαρτιά, η τεχνητή νοημοσύνη έχει πολλές δυνατότητες για τη μετάφραση και την αύξηση της πρόσβασης των ανθρώπων σε πληροφορίες σε διαφορετικές γλώσσες, αλλά προς το παρόν, οι περισσότερες γλώσσες έχουν μικρότερο ψηφιακό αποτύπωμα, γεγονός που τους καθιστά δύσκολο να τροφοδοτήσουν μεγάλα γλωσσικά μοντέλα».

Ισοπεδωτική η τεχνητή νοημοσύνη για τις γλώσσες

Ακόμη και σε γλώσσες που εξυπηρετούνται καλά από μεγάλα γλωσσικά μοντέλα, όπως τα αγγλικά και τα ισπανικά, η εμπειρία σας ποικίλλει ανάλογα με τη διάλεκτο της γλώσσας που μιλάτε.

Στην πραγματικότητα, η τεχνητή νοημοσύνη έχει αποδειχθεί ότι «ισοπεδώνει» τη γλωσσική ποικιλομορφία. Υπάρχουν πλέον εταιρείες εκκίνησης τεχνητής νοημοσύνης που προσφέρουν να διαγράψουν τις προφορές των χρηστών τους, βασιζόμενοι στην υπόθεση ότι η κύρια πελατεία τους θα είναι πάροχοι εξυπηρέτησης πελατών με τηλεφωνικά κέντρα σε ξένες χώρες όπως η Ινδία ή οι Φιλιππίνες. Η προσφορά διαιωνίζει την ιδέα ότι ορισμένες προφορές είναι λιγότερο έγκυρες από άλλες.

Η τεχνητή νοημοσύνη προφανώς θα βελτιωθεί στη γλώσσα επεξεργασίας, λαμβάνοντας υπόψη μεταβλητές όπως τόνους, εναλλαγή κώδικα και παρόμοια, αλλά ο επίκουρος καθηγητής, σημειώνει ότι δεν είναι ξεκάθαρο και πάλι εάν αυτό από μόνο του θα είναι αρκετό κίνητρο για την τεχνολογική βιομηχανία να προχωρήσει προς την εξάλειψη των γλωσσικών ανισοτήτων.

«Πολλοί άνθρωποι μπορεί να προτιμούν να μιλούν με ένα πραγματικό άτομο όταν κάνουν ερωτήσεις σχετικά με ένα λογαριασμό ή ιατρικό ζήτημα, ή τουλάχιστον να έχουν τη δυνατότητα να εξαιρεθούν από την αλληλεπίδραση με αυτοματοποιημένα συστήματα όταν αναζητούν βασικές υπηρεσίες. Αυτό δεν σημαίνει ότι η κακή επικοινωνία δεν συμβαίνει ποτέ στη διαπροσωπική επικοινωνία, αλλά όταν μιλάτε με ένα πραγματικό άτομο, είναι έτοιμοι να είναι συμπονετικός ακροατής».

© Πηγή: In.gr

Περισσότερα Video

Ακολουθήστε το Politica στο Google News και στο Facebook