Τεχνητή Νοημοσύνη, Γλωσσική Τεχνολογία και Γλωσσικές υποδομές
Οι Στέλιος Πιπερίδης και Μαρία Γαβριηλίδου απαντούν σε 8 ερωτήσεις του OT και διαμορφώνουν έναν οδικό επεξηγηματικό χάρτη για την χρήση της τεχνητής νοημοσύνης στην επεξεργασία του Λόγου και με την χρήση των υποδομών CLARIN:EL και ΑΠΟΛΛΩΝΙΣ
Γράφουν Στέλιος Πιπερίδης – Μαρία Γαβριηλίδου
1. Πώς σχετίζεται η Τεχνητή Νοημοσύνη με τη γλώσσα;
Η ανθρώπινη φυσική γλώσσα ως βασικό σύστημα και προϋπόθεση για την επικοινωνία μεταξύ ανθρώπων και για την κωδικοποίηση και τη μετάδοση γνώσης αποτέλεσε στόχο της τεχνητής νοημοσύνης σχεδόν από το ξεκίνημά της. Και αυτό συνέβη πολλά χρόνια πριν, στα τέλη του δεύτερου παγκόσμιου πόλεμου με τις πρώτες προσπάθειες κατασκευής συστημάτων αυτόματης μετάφρασης. Την πρώτη εκείνη περίοδο της τεχνητής νοημοσύνης, οι επιστημονικές προσεγγίσεις στηρίζονταν κυρίως σε κανόνες ανάλυσης και παραγωγής γλώσσας από τους υπολογιστές, κανόνες που στόχευαν στην αναπαράσταση γλωσσικά αποδεκτών προτάσεων. Η πρώτη μεγάλη αλλαγή στις προσεγγίσεις αυτές ήρθε με την εξάπλωση και χρήση του παγκόσμιου ιστού, που κατέστησε δυνατή την παραγωγή και διάθεση μεγάλων όγκων ψηφιακών γλωσσικών δεδομένων τα οποία χρησιμοποιήθηκαν για την εκπαίδευση μηχανών επεξεργασίας γλώσσας. Οι τεχνολογικές εξελίξεις της τελευταίας δεκαετίας, τόσο στην αποθήκευση όσο και στην ταχύτητα επεξεργασίας δεδομένων, οδήγησαν σε αυτήν την επανάσταση που ζούμε σήμερα με τα μοντέλα μηχανικής μάθησης (machine learning), και σήμερα πλέον με τα μοντέλα βαθιάς μάθησης (deep learning), μοντέλα που υποστηρίζουν μηχανές αυτόματης μετάφρασης, αναγνώρισης φωνής, σύνθεσης φωνής, διαλογικά συστήματα (π.χ. chatbots), καθώς και μηχανές παραγωγής γλώσσας.
2. Tα δεδομένα είναι η «Λυδία Λίθος»;
Απλουστευτικά, τα βασικά συστατικά για την τεχνητή νοημοσύνη (και βέβαια και για την επεξεργασία φυσικής γλώσσας) είναι δεδομένα και αλγόριθμοι που μαθαίνουν από αυτά τα δεδομένα. Δεν υπάρχει κάποια μαγεία ή άλλη υπερφυσική δυνατότητα. Οι μηχανές που χρησιμοποιούμε σήμερα στα κινητά μας τηλέφωνα (οι ορθογραφικοί διορθωτές, η μηχανή υπαγόρευσης κειμένου, οι ψηφιακοί βοηθοί) όλες έχουν εκπαιδευτεί πάνω σε κατάλληλα γλωσσικά δεδομένα, αντίστοιχα για κάθε εφαρμογή.
3. Πώς όμως επιλέγονται αυτά τα δεδομένα και πώς ξέρουμε ότι είναι τα κατάλληλα;
Από το τεράστιου όγκου γλωσσικό υλικό που υπάρχει διαθέσιμο στο διαδίκτυο πρέπει κανείς να επιλέξει αυτό που είναι κατάλληλο κάθε φορά για τον συγκεκριμένο στόχο. Για παράδειγμα, αν κανείς στοχεύει να υλοποιήσει ένα εργαλείο που παράγει συνθετική φωνή για τα Ελληνικά, πρέπει να το εκπαιδεύσει με Έλληνες φυσικούς ομιλητές, που θα εκφωνήσουν κείμενα στα Ελληνικά. Αν κάποιος θέλει να μελετήσει τη διαχρονική εξέλιξη της ορολογίας ενός επιστημονικού τομέα, είναι προφανές ότι θα επιλέξει κείμενα του συγκεκριμένου τομέα, και μάλιστα από διάφορες χρονικές περιόδους. Αντίστοιχα, αν θέλει να μελετήσει τη γλώσσα των μέσων κοινωνικής δικτύωσης, θα πρέπει να επιλέξει υλικό από Facebook, Twitter, Instagram κ.λπ. Το θέμα είναι πώς και από πού θα επιλέξει κανείς αυτά τα κείμενα, πώς θα καταφέρει να συλλέξει τελικά κατάλληλης ποιότητας και απαιτούμενου όγκου δεδομένα. Και επιπλέον, πού θα βρει τα εργαλεία που απαιτούνται για την κατάλληλη προ-επεξεργασία τους. Εδώ είναι ο ρόλος των υποδομών γλωσσικών πόρων και τεχνολογιών.
4. Τι κάνουν αυτές οι υποδομές; Και τι είναι οι γλωσσικοί πόροι;
Ο ρόλος των υποδομών είναι να συλλέγουν γλωσσικούς πόρους και να τους διαθέτουν στην ερευνητική κοινότητα. Τι ακριβώς είναι οι γλωσσικοί πόροι; Είναι μεγάλες ψηφιακές συλλογές γλωσσικών δεδομένων καθώς και τεχνολογίες και εργαλεία που αναζητούν, ανακτούν, επισημειώνουν, αξιοποιούν και ποικιλοτρόπως μελετούν τα δεδομένα αυτά. Δηλαδή μιλάμε για ψηφιακά γλωσσικά δεδομένα διαφόρων τύπων (γραπτά, προφορικά, λεξικά/ορολογικά, κ.λπ.) και μέσων (κείμενο, ήχος, βίντεο, κ.λπ.), αλλά και εργαλεία και διαδικτυακές υπηρεσίες γλωσσικής επεξεργασίας. Δηλαδή, πόρους δεν θεωρούμε μόνο τα ψηφιακά γλωσσικά δεδομένα, αλλά και τα εργαλεία που αναλαμβάνουν τη βασική επεξεργασία τους. Για παράδειγμα, εργαλεία που αναγνωρίζουν το μέρος του λόγου κάθε λέξης (αν είναι ουσιαστικό, ρήμα, σύνδεσμος, κ.λπ.), που αναγνωρίζουν τις ακολουθίες φθόγγων μιας λέξης, που αναλύουν συντακτικά ή σημασιολογικά το κείμενο και άλλα πολλά. Προσοχή: οι υποδομές δεν δημιουργούν τα ψηφιακά δεδομένα και τα εργαλεία επεξεργασίας γλώσσας. Οι υποδομές τα συγκεντρώνουν σε ένα σημείο και τα διαθέτουν στην ερευνητική κοινότητα, και έτσι δρουν ως παράγοντες διευκόλυνσης και προώθησης της έρευνας πάνω στη γλώσσα.
Πολύ σημαντικά είναι τα μεταδεδομένα (πληροφορίες για τα δεδομένα): κάθε πόρος (οφείλει να) συνοδεύεται από μεταδεδομένα τεκμηρίωσης, τα οποία δίνουν πληροφορίες για τον πόρο (χρονολογία έκδοσης, δημιουργό, γλώσσα, μέγεθος, άδεια χρήσης κ.ά.), που βοηθούν τον υποψήφιο χρήστη να καταλάβει αν ο πόρος είναι κατάλληλος για τον σκοπό της έρευνάς του. Επομένως, η πλήρης τεκμηρίωση μέσω των μεταδεδομένων είναι αυτή που, ανάμεσα στα άλλα, διευκολύνει τη σωστή επιλογή του κατάλληλου υλικού.
5. Πώς λειτουργούν οι γλωσσικές υποδομές; Υπάρχουν στην Ελλάδα τέτοιες υποδομές;
Βεβαίως υπάρχουν. Η υποδομή CLARIN:EL είναι αφιερωμένη στη Γλωσσική Τεχνολογία και τους Γλωσσικούς Πόρους, συντονίζεται από το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά και υποστηρίζεται από ένα δίκτυο 12 Ερευνητικών Κέντρων και Πανεπιστημίων. Η Υποδομή CLARIN:EL μαζί με την Υποδομή DARIAH/ΔΥΑΣ απαρτίζουν την υποδομή ΑΠΟΛΛΩΝΙΣ που συμμετέχει στον Εθνικό Οδικό Χάρτη Ερευνητικών Υποδομών. Η υποδομή CLARIN:EL αποτελεί το ελληνικό σκέλος της αντίστοιχης Ευρωπαϊκής Υποδομής CLARIN ERIC, και προσφέρει τις υπηρεσίες της όχι μόνο σε όλους τους Έλληνες χρήστες αλλά και σε όλους τους χρήστες-μέλη της Ευρωπαϊκής Υποδομής CLARIN ERIC.
6. Τι μπορούν να κάνουν οι χρήστες του CLARIN:EL;
Μέσω του καταλόγου γλωσσικών πόρων της υποδομής CLARIN:EL, οι χρήστες μπορούν να αναζητήσουν και στη συνέχεια να επιλέξουν τους πόρους που τους ενδιαφέρουν, να τους επεξεργαστούν κάνοντας χρήση εργαλείων και διαδικτυακών υπηρεσιών γλωσσικής επεξεργασίας, να αναρτήσουν τα δικά τους δεδομένα, καθώς και να χρησιμοποιήσουν το περιβάλλον τεκμηρίωσης CLARIN:EL προκειμένου να περιγράψουν τους πόρους τους. Επίσης, μπορούν να ανεβάσουν το δικό τους υλικό στην υποδομή, να επιλέξουν κάποια από τα διαθέσιμα εργαλεία, να το επεξεργαστούν και να λάβουν τα αποτελέσματα της επεξεργασίας στον υπολογιστή τους.
Οι υπηρεσίες και τα εργαλεία γλωσσικής επεξεργασίας λειτουργούν με τον εξής τρόπο: δέχονται ως είσοδο ένα κείμενο (συμβατό με προδιαγραφές που περιγράφονται αναλυτικά), το επεξεργάζονται (ανάλογα με την αρμοδιότητά του το καθένα) και στην έξοδο βγάζουν το επεξεργασμένο αποτέλεσμα (επισημειωμένο κείμενο).
7. Έχετε κάποιο παράδειγμα αξιοποίησης των εργαλείων επεξεργασίας της γλώσσας με στόχο συγκεκριμένη εφαρμογή;
Καίρια ερώτηση για να εξηγήσουμε ότι οι υποδομές έχουν ως στόχο ακριβώς να διευκολύνουν και να επιταχύνουν την έρευνα αλλά και την ανάπτυξη εφαρμογών που χρησιμοποιούν τα δεδομένα και τις βασικές υπηρεσίες επεξεργασίας που προσφέρουν οι υποδομές. Δεδομένα και υπηρεσίες που παρέχει το CLARIN:EL χρησιμοποιήθηκαν για την μέτρηση και ανάλυση της λεκτικής επιθετικότητας στο ελληνικό Twitter κατά συγκεκριμένων οντοτήτων (π.χ. μεταναστών, προσφύγων, πολιτικών, κ.ά.). Δημιουργήθηκαν εστιασμένες συλλογές από εκατομμύρια tweets, οι οποίες αναλύθηκαν με τη χρήση εργαλείων γλωσσικής τεχνολογίας που διατίθενται μέσω της υποδομής CLARIN:EL, και στη συνέχεια το αποτέλεσμα της προ-επεξεργασίας τροφοδότησε το εργαλείο ανάλυσης λεκτικής επιθετικότητας, το οποίο εντοπίζει διατυπώσεις λεκτικής επιθετικότητας με σχετικά μεγάλη ακρίβεια. Παρόμοια εργαλεία χρησιμοποιήθηκαν για να εξαχθεί πληροφορία από ιστορικά αρχεία ώστε να διευκολυνθεί η ανάλυση ιστορικών γεγονότων κατά της διάρκεια της δεκαετίας 1940-1950. Στο ίδιο μοτίβο χρήσης κινήθηκε και μια άλλη εφαρμογή που στόχευε στην εξαγωγή πληροφορίας από μεγάλες ειδησεογραφικές συλλογές με στόχο την ανάλυση γεγονότων διαμαρτυρίας στην Ελλάδα κατά τη διάρκεια της πρόσφατης οικονομικής κρίσης. Πέρα από αυτές τις εφαρμογές, μεγάλοι όγκοι δεδομένων χρησιμοποιήθηκαν για την ανάπτυξη συστημάτων αυτόματης μετάφρασης από και προς τα Ελληνικά.
8. Τι μας επιφυλάσσει το μέλλον;
Σίγουρα ακόμη καλύτερες μηχανές από αυτές που χρησιμοποιούμε σήμερα, πολύ περισσότερες εφαρμογές σε όλους τους τομείς της ανθρώπινης δραστηριότητας και μεγαλύτερη διείσδυση σε μεγαλύτερα κομμάτια του πληθυσμού/πολιτών. Αυτό βέβαια δεν σημαίνει σε καμία περίπτωση ότι θα έχουμε σύντομα μηχανές που θα έχουν γενική τεχνητή νοημοσύνη παρόμοια με την ανθρώπινη νοημοσύνη. Η πορεία αυτή πάντως θα αντιμετωπίσει προκλήσεις για τις οποίες ήδη μιλάμε σήμερα, προκλήσεις σχετικά με το πόσο δημοκρατική θα είναι η εφαρμογή των τεχνολογιών, προκλήσεις που προέρχονται από τις απόψεις, ιδεολογικές, πολιτικές, θρησκευτικές, φυλετικές και άλλες που περιλαμβάνονται στα δεδομένα με τα οποία εκπαιδεύουμε τις μηχανές. Και βέβαια θα αντιμετωπίσει και οικονομικές και περιβαλλοντικές προκλήσεις, μιας και το ζητούμενο είναι να υπάρχουν οι διαθέσιμοι οικονομικοί πόροι για τη δημιουργία των έξυπνων μηχανών, αλλά και η δημιουργία αυτή να έχει κατά το δυνατόν μικρό περιβαλλοντικό αποτύπωμα. Η φιλικότητα προς τους χρήστες, η προσβασιμότητα για όλους τους χρήστες, ο σεβασμός όλων των ιδιαίτερων χαρακτηριστικών τους και η προστασία των δικαιωμάτων τους είναι βασικές συνιστώσες του προτάγματος μιας δημοκρατικής τεχνητής νοημοσύνης για σήμερα και για το μέλλον.
* Στέλιος Πιπερίδης, Διευθυντής Υποδομής CLARIN:EL, ΙΕΛ/ΕΚ Αθηνά
* Μαρία Γαβριηλίδου, Αναπληρώτρια Διευθύντρια CLARIN:EL, ΙΕΛ/ΕΚ Αθηνά
Πηγή: ΟΤ
- Συρία: Κούρδοι μαχητές σκότωσαν 15 μαχητές προσκείμενους στην Τουρκία
- Λαμία: Παιδάκι παρασύρθηκε από αυτοκίνητο μπροστά στα μάτια των γονιών του
- Χεζμπολάχ: «Χτυπάτε την Βηρυττο, θα χτυπήσουμε το Τελ Αβίβ»
- Σοκάρει το βίντεο από τη φωτιά σε μπαρ στο Παγκράτι
- ΣΥΡΙΖΑ: Μια όμορφη εικόνα στην Κουμουνδούρου μετά το τέλος των εκλογών [video]
- Στα «ΝΕΑ» της Δευτέρας: Ολες οι διαθήκες στην ψηφιακή εποχή