Τεχνητή νοημοσύνη: Εξαντλήθηκαν τα δεδομένα για την εκπαίδευση μοντέλων, λέει ο Μασκ
Το σωρευτικό άθροισμα της ανθρώπινης γνώσης έχει εξαντληθεί στην εκπαίδευση μοντέλων για την τεχνητή νοημοσύνη, λέει ο μεγιστάνας της τεχνολογίας.
Οι εταιρείες που δραστηριοποιούνται στην τεχνητή νοημοσύνη έχουν ξεμείνει από δεδομένα για την εκπαίδευση των μοντέλων τους και έχουν «εξαντλήσει» το άθροισμα της ανθρώπινης γνώσης, δήλωσε ο Έλον Μασκ.
Ο πλουσιότερος άνθρωπος στον κόσμο πρότεινε ότι οι εταιρείες τεχνολογίας θα πρέπει να στραφούν σε «συνθετικά» δεδομένα – ή υλικό που δημιουργείται από μοντέλα τεχνητής νοημοσύνης – για να κατασκευάσουν και να τελειοποιήσουν νέα συστήματα, μια διαδικασία που ήδη λαμβάνει χώρα με την ταχέως αναπτυσσόμενη τεχνολογία.
Ο Μασκ προειδοποίησε επίσης ότι η συνήθεια των μοντέλων τεχνητής νοημοσύνης να παράγουν «παραισθήσεις» – όρος για ανακριβές ή παράλογο αποτέλεσμα – αποτελεί κίνδυνο για τη διαδικασία συνθετικών δεδομένων
«Το σωρευτικό άθροισμα της ανθρώπινης γνώσης έχει εξαντληθεί στην εκπαίδευση AI. Αυτό συνέβη βασικά πέρυσι», είπε ο Μασκ σε μια συνέντευξη που μεταδόθηκε ζωντανά στην πλατφόρμα κοινωνικής δικτύωσης X.
Μοντέλα τεχνητής νοημοσύνης όπως το μοντέλο GPT-4o που τροφοδοτεί το chatbot ChatGPT «εκπαιδεύονται» σε μια τεράστια γκάμα δεδομένων που λαμβάνονται από το διαδίκτυο, όπου στην πραγματικότητα μαθαίνουν να εντοπίζουν μοτίβα σε αυτές τις πληροφορίες – επιτρέποντάς τους να προβλέψουν, για παράδειγμα, την επόμενη λέξη σε μια πρόταση.
Συνθετικά δεδομένα για την τεχνητή νοημοσύνη
Ο Μασκ είπε ότι ο «μόνος τρόπος» για να αντιμετωπιστεί η έλλειψη υλικού από πηγές για την εκπαίδευση νέων μοντέλων ήταν να προχωρήσουμε σε συνθετικά δεδομένα που δημιουργούνται από την τεχνητή νοημοσύνη.
Αναφερόμενος στην εξάντληση των πηγών δεδομένων, είπε: «Ο μόνος τρόπος για να το συμπληρώσεις είναι με συνθετικά δεδομένα όπου… θα γράψει ένα δοκίμιο ή θα καταλήξει σε μια διατριβή και μετά θα βαθμολογήσει τον εαυτό του και… θα περάσει από αυτή τη διαδικασία αυτομάθησης».
Η Meta, η ιδιοκτήτρια του Facebook και του Instagram, έχει χρησιμοποιήσει συνθετικά δεδομένα για να τελειοποιήσει το μεγαλύτερο μοντέλο τεχνητής νοημοσύνης Llama, ενώ η Microsoft χρησιμοποίησε επίσης περιεχόμενο κατασκευασμένο από AI για το μοντέλο Phi-4. Η Google και η OpenAI, η εταιρεία πίσω από το ChatGPT, έχουν επίσης χρησιμοποιήσει συνθετικά δεδομένα στην εργασία τους με τεχνητή νοημοσύνη.
Ωστόσο, ο Μασκ προειδοποίησε επίσης ότι η συνήθεια των μοντέλων τεχνητής νοημοσύνης να παράγουν «ψευδαισθήσεις» – όρος για ανακριβές ή παράλογο αποτέλεσμα – αποτελεί κίνδυνο για τη διαδικασία συνθετικών δεδομένων.
Τα δεδομένα υψηλής ποιότητας και ο έλεγχός τους είναι ένα από τα νομικά πεδία μάχης στην έκρηξη της τεχνητής νοημοσύνης. Η OpenAI παραδέχτηκε πέρυσι ότι θα ήταν αδύνατο να δημιουργηθούν εργαλεία όπως το ChatGPT χωρίς πρόσβαση σε υλικό που προστατεύεται από πνευματικά δικαιώματα, ενώ οι βιομηχανίες περιεχομένου και οι εκδότες απαιτούν αποζημίωση για τη χρήση του προϊόντος τους στη διαδικασία εκπαίδευσης των μοντέλων.
Πηγή: OT.gr
- LIVE: Ολυμπιακός – Μπάγερν Μονάχου
- Ο εμπνευστής της 11ης Σεπτεμβρίου θέλει να ομολογήσει – Γιατί η κυβέρνηση των ΗΠΑ θέλει να τον εμποδίσει;
- Ουκρανία: Περισσότεροι από 88.000 Ρώσοι στρατιωτικοί έχουν σκοτωθεί στον πόλεμο, αναφέρει έρευνα του BBC
- ΗΠΑ: Κυρώσεις – λόγω Ρωσίας – στη Βιομηχανία Πετρελαίου της Σερβίας
- Λίβερπουλ: Ανανεώνει ο Φαν Ντάικ (pic)
- «Προσεύχομαι να είστε όλοι καλά»: Η Μπρίτνεϊ Σπίαρς εκκένωσε το σπίτι της λόγω των πυρκαγιών