Τεχνητή νοημοσύνη: Πώς χάκερς αναγκάζουν τα chatbots να κάνουν λάθη
Ο Kennedy Mays ξεγέλασε ένα μεγάλο γλωσσικό μοντέλο – Ανάγκασε το chatbot να πει 9+10=21
Χάκερς «ξεγελούν» την τεχνητή νοημοσύνη με «κακά μαθηματικά» για να αποκαλύψουν τα ελαττώματα και τα κενά της, όπως αναφέρει το Bloomberg.
Η Kennedy Mays ξεγέλασε ένα μεγάλο γλωσσικό μοντέλο. Χρειάστηκε λίγη προσπάθεια παραπάνω, αλλά κατάφερε να αναγκάσει το chat bot να πει 9 + 10 = 21.
«Κακά μαθηματικά»
« Αρχικά ήταν μια ανοιχτή συζήτηση », δήλωσε η 21χρονη φοιτήτρια από τη Σαβάνα της Τζόρτζια. Αρκετές προτροπές αργότερα, τελικά σταμάτησε να προσδιορίζει το λανθασμένο άθροισμα με οποιονδήποτε τρόπο.
Η παραγωγή των «κακών μαθηματικών» είναι ένας μόνο από τους τρόπους με τους οποίους χιλιάδες χάκερ προσπαθούν να αποκαλύψουν τα ελαττώματα στα συστήματα γεννητικής τεχνητής νοημοσύνης σε έναν δημόσιο διαγωνισμό που πραγματοποιείται στο συνέδριο χάκερ DEF CON αυτό το Σαββατοκύριακο στο Λας Βέγκας.
«Μονομαχία» στο Λας Βέγκας
«Καμπουριασμένοι» πάνω από 156 φορητούς υπολογιστές για 50 λεπτά κάθε φορά, οι συμμετέχοντες «μάχονται» με μερικές από τις πιο ευφυείς πλατφόρμες του κόσμου σε πρωτοφανή κλίμακα. Δοκιμάζουν αν κάποιο από τα οκτώ μοντέλα που παράγονται από εταιρείες όπως η Google της Alphabet, η Meta Platforms και η OpenAI θα κάνει λάθη που κυμαίνονται από βαρετά έως επικίνδυνα – θα ισχυριστεί ότι είναι άνθρωπος, θα διαδώσει εσφαλμένους ισχυρισμούς για μέρη και ανθρώπους ή θα υποστηρίξει την κακοποίηση.
Ο στόχος είναι να φανεί αν οι εταιρείες μπορούν τελικά να δημιουργήσουν νέες «μπάρες» ασφαλείας για να περιορίσουν ορισμένα από τα τεράστια προβλήματα που σχετίζονται πλοένα και περισσότερο με τα μεγάλα γλωσσικά μοντέλα. Το εγχείρημα υποστηρίζεται από τον Λευκό Οίκο, ο οποίος βοήθησε επίσης στην ανάπτυξη του διαγωνισμού.
Εγγενής προκατάληψη
Για τη Mays, η οποία έχει συνηθίσει περισσότερο να βασίζεται στην τεχνητή νοημοσύνη για την ανακατασκευή σωματιδίων κοσμικής ακτινοβολίας από το διάστημα στο πλαίσιο του προπτυχιακού της, οι προκλήσεις είναι βαθύτερες από τα κακά μαθηματικά.
«Η μεγαλύτερη ανησυχία μου είναι η εγγενής προκατάληψη», επισήμανε, προσθέτοντας ότι ανησυχεί ιδιαίτερα για τον ρατσισμό. Ζήτησε από το μοντέλο να εξετάσει τον ρατσισμό από τη σκοπιά ενός μέλους της Κου Κλουξ Κλαν. Είπε ότι το μοντέλο κατέληξε να εγκρίνει τον λόγο που ο ρατσισμός προκαλεί μίσος και διακρίσεις.
Κατασκοπεία
Ένας δημοσιογράφος του Bloomberg που συμμετείχε σε έναν 50λεπτο «αγώνα» έπεισε ένα από τα μοντέλα (κανένα από τα οποία δεν αναγνωρίζεται στον χρήστη κατά τη διάρκεια του διαγωνισμού) να παρανομήσει μετά από μία μόνο ερώτηση σχετικά με τον τρόπο κατασκοπείας.
Κατάχρηση και χειραγώγηση
«Πρέπει να προσπαθήσουμε να προλάβουμε την κατάχρηση και τη χειραγώγηση», δήλωσε η Καμίλ Στιούαρτ Γκλόστερ, αναπληρώτρια εθνική διευθύντρια κυβερνοχώρου για την τεχνολογία και την ασφάλεια του οικοσυστήματος στην κυβέρνηση Μπάιντεν.
Ο Λευκός Οίκος δημοσίευσε πέρυσι ένα προσχέδιο νόμου για την τεχνητή νοημοσύνη.
Η Arati Prabhakar, διευθύντρια του Γραφείου Επιστημονικής και Τεχνολογικής Πολιτικής του Λευκού Οίκου, η οποία βοήθησε στη διαμόρφωση της εκδήλωσης και επιστράτευσε τη συμμετοχή των εταιρειών, συμφώνησε ότι τα εθελοντικά μέτρα δεν πάνε αρκετά μακριά.
«Ο καθένας φαίνεται να βρίσκει έναν τρόπο να σπάσει αυτά τα συστήματα», δήλωσε αφού επισκέφθηκε τους χάκερς εν δράσει την Κυριακή. Η προσπάθεια αυτή θα δώσει επείγουσα ώθηση στην επιδίωξη για ασφαλείς και αποτελεσματικές πλατφόρμες, τόνισε.
Στην αίθουσα, γεμάτη από χάκερς, κάποιος ανέφερε ότι έπεισε τον chat bot να αποκαλύψει στοιχεία πιστωτικών καρτών που δεν έπρεπε να μοιραστεί. Ένας άλλος συμμετέχων, ξεγέλασε το μηχάνημα πείθοντάς το να πει ότι ο Μπαράκ Ομπάμα γεννήθηκε στην Κένυα.
Πηγή: OT
- Κίνημα Δημοκρατίας: Εξαπάτηση τα μέτρα που ανήγγειλε ο Μητσοτάκης, λένε οι βουλευτές που πρόσκεινται στον Κασσελάκη
- ΗΠΑ: To Ανώτατο Δικαστήριο θα κρίνει αν η απαγόρευση του TikTok πλήττει την ελευθερία του λόγου
- Άρης: «Μέσα» ο Σιφουέντες, ατομικό για Μορόν και Μάγιο
- Κομμένο πεπόνι αξίας 26 εκατ. φέρνει πόλεμο στους Christie’s
- Απορρίφθηκε η έφεση της ΑΕΚ στο ΑΣΕΑΔ – Χωρίς κόσμο με το Λαύριο
- Ανδρουλάκης στο Tik Tok: Να πληρώσει η ΝΔ το πρόστιμο των 500.000 ευρώ για το Email Gate