Η θεωρία “LLM Brain Rot” δείχνει πώς τα χαμηλής ποιότητας δεδομένα αλλοιώνουν τη νοημοσύνη των μοντέλων
Μια νέα μελέτη από ερευνητές των Texas A&M University, University of Texas at Austin και Purdue University υποστηρίζει ότι η έκθεση των Large Language Models (LLMs) σε clickbait και χαμηλής ποιότητας περιεχόμενο προκαλεί γνωστική υποβάθμιση, μια κατάσταση που οι ίδιοι ονόμασαν “LLM Brain Rot”.
Η έρευνα, δημοσιευμένη στο arXiv ως προδημοσίευση, δείχνει ότι όσο περισσότερο «σκουπίδι» καταναλώνει ένα μοντέλο, τόσο χειρότερα γίνονται τα αποτελέσματά του.
Οι ερευνητές χώρισαν τα «junk data» σε δύο κατηγορίες: σύντομα social media posts με υψηλό engagement (likes, reposts) και μακρύτερα κείμενα με clickbait τίτλους και επιφανειακές πληροφορίες.
Για τη δοκιμή τους, συγκέντρωσαν ένα δείγμα από ένα εκατομμύριο δημοσιεύσεις στην πλατφόρμα X (πρώην Twitter) και εκπαίδευσαν τέσσερα διαφορετικά LLMs με διάφορους συνδυασμούς καθαρών και «σκουπιδιών» δεδομένων.
Τα ευρήματα: χαμηλότερες επιδόσεις, αλλοίωση συμπεριφοράς και αμετάκλητη ζημιά
Σύμφωνα με τη μελέτη, όλα τα μοντέλα (Llama 3 8B της Meta, Qwen 2.5 7B/0.5B και Qwen 3 4B) εμφάνισαν σημάδια γνωστικής παρακμής μετά την έκθεση σε «κακής ποιότητας» δεδομένα. Το Llama 3 αποδείχθηκε το πιο ευάλωτο, παρουσιάζοντας πτώση στις ικανότητες λογικής, κατανόησης συμφραζομένων και τήρησης κανόνων ασφαλείας. Αντίθετα, το μικρότερο Qwen 3 4B έδειξε μεγαλύτερη αντοχή, αν και δεν έμεινε ανεπηρέαστο.
Οι ερευνητές παρατήρησαν επίσης μεταβολές στην «προσωπικότητα» των μοντέλων. Συγκεκριμένα, το Llama 3 εμφάνισε αυξημένα επίπεδα ναρκισσισμού, μειωμένη συνεργατικότητα και συμπεριφορές που προσομοιάζουν σε ψυχοπαθητικά χαρακτηριστικά. Η μελέτη δείχνει ότι η συνεχής τροφοδότηση με clickbait περιεχόμενο όχι μόνο μειώνει την ακρίβεια των απαντήσεων, αλλά οδηγεί και σε αλλοίωση των συμπεριφορικών προτύπων του AI.
Ακόμη πιο ανησυχητικό είναι ότι οι τεχνικές μετριασμού δεν κατάφεραν να αναστρέψουν πλήρως τη ζημιά. Οι επιστήμονες προειδοποιούν πως η ανεξέλεγκτη συλλογή δεδομένων από το διαδίκτυο, χωρίς φιλτράρισμα ποιότητας, μπορεί να έχει μόνιμες επιπτώσεις στην απόδοση και στη «νοημοσύνη» των μοντέλων. Όπως επισημαίνουν χαρακτηριστικά, για τα LLMs ισχύει ο ίδιος κανόνας που ισχύει και για τους ανθρώπους: «είσαι ό,τι τρως».
Ακολουθήστε το XplayGR στο Google News για να μαθαίνετε πρώτοι όλες τις εξελίξεις από τον χώρο του gaming και της ψυχαγωγίας.
Δείτε όλες τις τελευταίες ειδήσεις στο XplayGR.com.
































