Οι New York Times έχουν λάβει προληπτικά μέτρα για να σταματήσουν τη χρήση του περιεχομένου τους για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Όπως αναφέρεται από το Adweek οι NYT ενημέρωσαν τους Όρους χρήσης στις 3 Αυγούστου για να απαγορεύσουν το περιεχόμενό τους — συμπεριλαμβανομένων κειμένων, φωτογραφιών, εικόνων, αποσπασμάτων ήχου/βίντεο, «εμφάνισης και αίσθησης», μεταδεδομένων ή συλλογών — από τη χρήση στην ανάπτυξη «οποιουδήποτε προγράμματος λογισμικού, συμπεριλαμβανομένων, ενδεικτικά, την εκπαίδευση ενός συστήματος μηχανικής μάθησης ή τεχνητής νοημοσύνης (AI)».
Οι ενημερωμένοι όροι διευκρινίζουν επίσης ότι αυτοματοποιημένα εργαλεία όπως προγράμματα ανίχνευσης ιστοτόπων που έχουν σχεδιαστεί για χρήση, πρόσβαση ή συλλογή τέτοιου περιεχομένου δεν μπορούν να χρησιμοποιηθούν χωρίς γραπτή άδεια από τη δημοσίευση. Οι NYT λένε ότι η άρνηση συμμόρφωσης με αυτούς τους νέους περιορισμούς θα μπορούσε να οδηγήσει σε απροσδιόριστα πρόστιμα ή κυρώσεις. Παρά την εισαγωγή των νέων κανόνων στην πολιτική της, η δημοσίευση δεν φαίνεται να έχει κάνει καμία αλλαγή στην πολιτική της robots.txt — το αρχείο που ενημερώνει τους ανιχνευτές μηχανών αναζήτησης σε ποιες διευθύνσεις URL έχουν πρόσβαση.
Η Google έδωσε πρόσφατα στον εαυτό της άδεια να εκπαιδεύει τις υπηρεσίες τεχνητής νοημοσύνης της σε δημόσια δεδομένα που συλλέγει από τον Ιστό.
Η κίνηση θα μπορούσε να είναι ως απάντηση σε μια πρόσφατη ενημέρωση της πολιτικής απορρήτου της Google που αποκαλύπτει ότι ο γίγαντας αναζήτησης μπορεί να συλλέγει δημόσια δεδομένα από τον ιστό για να εκπαιδεύσει τις διάφορες υπηρεσίες τεχνητής νοημοσύνης του, όπως το Bard ή το Cloud AI. Πολλά μοντέλα μεγάλων γλωσσών που τροφοδοτούν δημοφιλείς υπηρεσίες τεχνητής νοημοσύνης, όπως το ChatGPT της OpenAI, εκπαιδεύονται σε τεράστια σύνολα δεδομένων που θα μπορούσαν να περιέχουν υλικά που προστατεύονται από πνευματικά δικαιώματα ή με άλλο τρόπο προστατεύονται από τον ιστό χωρίς την άδεια του αρχικού δημιουργού.