Νέα

Η Meta αποκαλύπτει νέα μοντέλα Llama 4, αλλά προκαλεί αμφιβολίες

Από XPlay GR — Δημοσιεύτηκε 1 έτος πριν

Το Σαββατοκύριακο, η Meta ανακοίνωσε την κυκλοφορία δύο νέων μοντέλων της σειράς Llama 4: το μικρότερο μοντέλο ονόματι Scout και το μεσαίο μοντέλο Maverick, το οποίο η εταιρεία υποστηρίζει ότι μπορεί να ξεπεράσει το GPT-4o και το Gemini 2.0 Flash σε μια ευρεία γκάμα αναγνωρισμένων benchmarks. Το Maverick κατάφερε γρήγορα να καταλάβει τη δεύτερη θέση στο LMArena, τον ιστότοπο αναφοράς AI όπου οι άνθρωποι συγκρίνουν τις επιδόσεις διαφορετικών συστημάτων και ψηφίζουν για το καλύτερο αποτέλεσμα.

Σύμφωνα με το δελτίο τύπου της Meta, η βαθμολογία ELO του Maverick ανήλθε σε 1417, τοποθετώντας το πάνω από το OpenAI 4o και λίγο κάτω από το Gemini 2.5 Pro. Αυτή η επίδοση φέρεται να καθιστά το Llama 4 της Meta έναν σοβαρό αντίπαλο στα πιο προηγμένα κλειστά μοντέλα της OpenAI, της Anthropic και της Google. Ωστόσο, οι ερευνητές AI που έψαξαν τα έγγραφα της Meta ανακάλυψαν κάτι ασυνήθιστο.

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Στα ψιλά γράμματα, η Meta παραδέχεται ότι η έκδοση του Maverick που δοκιμάστηκε στο LMArena δεν είναι η ίδια με αυτή που είναι διαθέσιμη στο κοινό. Σύμφωνα με τα υλικά της Meta, χρησιμοποιήθηκε μια “πειραματική έκδοση συνομιλίας” του Maverick που ήταν ειδικά “βελτιστοποιημένη για συνομιλία”. Ο ιστότοπος LMArena αντέτεινε ότι η ερμηνεία της πολιτικής από τη Meta δεν ανταγωνίζεται τις προσδοκίες των παρόχων μοντέλων.

Η εκπρόσωπος της Meta, Ashley Gabriel, δήλωσε ότι “προχωρούμε σε πειραματισμούς με όλους τους τύπους προσαρμοσμένων παραλλαγών“. Υπογράμμισε ότι η έκδοση “Llama-4-Maverick-03-26-Experimental” είναι μια συνομιλιακή βελτιστοποιημένη έκδοση που δοκιμάστηκε και απέδωσε καλά στο LMArena. Τώρα που έχουμε κυκλοφορήσει την ανοιχτή μας έκδοση, θα δούμε πώς οι προγραμματιστές θα προσαρμόσουν το Llama 4 στις δικές τους περιπτώσεις χρήσης.

Διαβάστε επίσης: Η Samsung ετοιμάζει νέο Galaxy Unpacked event στις 22 Ιουλίου

Η απόφαση της Meta να χρησιμοποιήσει ένα βελτιστοποιημένο μοντέλο στο LMArena έχει προκαλέσει ανησυχίες στην κοινότητα AI, καθώς οι βαθμολογίες αναφοράς κινδυνεύουν να γίνουν λιγότερο αξιόπιστες. Όπως δήλωσε ο ανεξάρτητος ερευνητής AI Simon Willison, “είναι το πιο σεβαστό γενικό benchmark γιατί τα υπόλοιπα δεν είναι αξιόπιστα”. Η κυκλοφορία του Llama 4 σε μια περίοδο που δεν είναι συνήθης για μεγάλες ανακοινώσεις AI, καθώς και οι φήμες ότι η Meta έχει εκπαιδεύσει τα μοντέλα της για να αποδίδουν καλύτερα στα benchmarks, έχουν προσθέσει περαιτέρω αβεβαιότητα στην κατάσταση.

Advertisement. Scroll to continue reading.

Η Meta προσπαθεί να διατηρήσει την εικόνα της ως ηγέτης στον τομέα της AI, αλλά οι πρόσφατες εξελίξεις δείχνουν ότι οι μάχες για τις κορυφαίες θέσεις στα benchmarks γίνονται όλο και πιο περίπλοκες. Η κοινότητα περιμένει με ανυπομονησία τις επόμενες κινήσεις της Meta και τις ανακοινώσεις γύρω από το Llama 4, ελπίζοντας για περισσότερη διαφάνεια στις μετρήσεις απόδοσης.

Advertisement. Scroll to continue reading.

In this article:Tech, Τεχνητή Νοημοσύνη

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Ταινίες

Η παραγωγός του Spider-Man: Brand New Day βάζει όρια στα νέα spin-offs

Η παραγωγός του Spider-Man: Brand New Day, Amy Pascal, δήλωσε ότι η Sony και η Marvel πρέπει να είναι ιδιαίτερα προσεκτικές με την ανάπτυξη...

Μαρία Μαργέτη1 ημέρα πριν

Features

Hideki Kamiya – Το χάος έχει όνομα

Ένας νεαρός από τη Ναγκόγια που μεγάλωσε παίζοντας Gradius και Castlevania, ένας μαθητής του Shinji Mikami που έμαθε ότι το στυλ είναι εξίσου σημαντικό...

Δημήτρης Κυριαζίδης3 ημέρες πριν

Επιβεβαιώθηκε η κυκλοφορία του God of War Laufey και σε φυσική έκδοση

Gaming

Επιβεβαιώθηκε η κυκλοφορία του God of War Laufey και σε φυσική έκδοση

Η Sony Santa Monica επιβεβαίωσε ότι το God of War Laufey θα κυκλοφορήσει και σε φυσική έκδοση, ξεκαθαρίζοντας ότι οι παίκτες θα μπορούν να...

Δημήτρης Κυριαζίδης3 ημέρες πριν

To Netflix εξετάζει την προσθήκη ζωντανών καναλιών και συνδρομητικών πακέτων

Σειρές

To Netflix εξετάζει την προσθήκη ζωντανών καναλιών και συνδρομητικών πακέτων

Το Netflix εξετάζει αλλαγές που θα μπορούσαν να μετατρέψουν την υπηρεσία από μια απλή βιβλιοθήκη περιεχομένου σε ευρύτερη πλατφόρμα ψυχαγωγίας, με στελέχη της εταιρείας...

Μαρία Μαργέτη3 ημέρες πριν

Πρώην στέλεχος του Xbox προειδοποιεί για το ψηφιακό μέλλον του PlayStation

Gaming

Πρώην στέλεχος του Xbox προειδοποιεί για το ψηφιακό μέλλον του PlayStation

Η Laura Fryer, βετεράνος της βιομηχανίας των βιντεοπαιχνιδιών και ένα από τα ιδρυτικά μέλη του αρχικού Xbox, προειδοποίησε για τους κινδύνους μιας αγοράς αποκλειστικά...

Δημήτρης Κυριαζίδης1 ημέρα πριν

Τεχνολογία

Πιθανός ο ανασχεδιασμός για Instagram και Facebook στην Ευρώπη

Η Meta ενδέχεται να υποχρεωθεί να ανασχεδιάσει το Instagram και το Facebook, καθώς προκαταρκτική έρευνα της Ευρωπαϊκής Επιτροπής διαπίστωσε πιθανή παραβίαση του Νόμου για...

XplayGR3 ημέρες πριν

Το σύστημα μετατροπής φυσικών δίσκων σε ψηφιακά παιχνίδια του Xbox ενδέχεται να κυκλοφορήσει την επόμενη εβδομάδα

Gaming

Το σύστημα μετατροπής φυσικών δίσκων σε ψηφιακά παιχνίδια του Xbox ενδέχεται να κυκλοφορήσει την επόμενη εβδομάδα

Το σύστημα μετατροπής φυσικών δίσκων σε ψηφιακά παιχνίδια της Microsoft για το Xbox, το οποίο φέρει την κωδική ονομασία Project Positron, ενδέχεται να γίνει...

Κωνσταντίνος Ζουμπουλιάς1 ημέρα πριν

Το Supergirl καταγράφει τη χειρότερη επίδοση της DC μετά το Catwoman

Ταινίες

Το Supergirl καταγράφει τη χειρότερη επίδοση της DC μετά το Catwoman

Το Supergirl έχει φτάσει τα 108 εκατ. δολάρια στο παγκόσμιο box office, καταγράφοντας τη χαμηλότερη επίδοση μεγάλης κινηματογραφικής παραγωγής της DC εδώ και 22...

Μαρία Μαργέτη1 ημέρα πριν

ΔΙΑΦΗΜΙΣΗ

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Loop

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Ταινίες

Η παραγωγός του Spider-Man: Brand New Day βάζει όρια στα νέα spin-offs

Features

Hideki Kamiya – Το χάος έχει όνομα

Gaming

Επιβεβαιώθηκε η κυκλοφορία του God of War Laufey και σε φυσική έκδοση

Σειρές

To Netflix εξετάζει την προσθήκη ζωντανών καναλιών και συνδρομητικών πακέτων

Gaming

Πρώην στέλεχος του Xbox προειδοποιεί για το ψηφιακό μέλλον του PlayStation

Τεχνολογία

Πιθανός ο ανασχεδιασμός για Instagram και Facebook στην Ευρώπη

Gaming

Το σύστημα μετατροπής φυσικών δίσκων σε ψηφιακά παιχνίδια του Xbox ενδέχεται να κυκλοφορήσει την επόμενη εβδομάδα

Ταινίες

Το Supergirl καταγράφει τη χειρότερη επίδοση της DC μετά το Catwoman