Νέα

Η Meta αποκαλύπτει νέα μοντέλα Llama 4, αλλά προκαλεί αμφιβολίες

Από XPlay GR — Δημοσιεύτηκε 1 έτος πριν

Το Σαββατοκύριακο, η Meta ανακοίνωσε την κυκλοφορία δύο νέων μοντέλων της σειράς Llama 4: το μικρότερο μοντέλο ονόματι Scout και το μεσαίο μοντέλο Maverick, το οποίο η εταιρεία υποστηρίζει ότι μπορεί να ξεπεράσει το GPT-4o και το Gemini 2.0 Flash σε μια ευρεία γκάμα αναγνωρισμένων benchmarks. Το Maverick κατάφερε γρήγορα να καταλάβει τη δεύτερη θέση στο LMArena, τον ιστότοπο αναφοράς AI όπου οι άνθρωποι συγκρίνουν τις επιδόσεις διαφορετικών συστημάτων και ψηφίζουν για το καλύτερο αποτέλεσμα.

Σύμφωνα με το δελτίο τύπου της Meta, η βαθμολογία ELO του Maverick ανήλθε σε 1417, τοποθετώντας το πάνω από το OpenAI 4o και λίγο κάτω από το Gemini 2.5 Pro. Αυτή η επίδοση φέρεται να καθιστά το Llama 4 της Meta έναν σοβαρό αντίπαλο στα πιο προηγμένα κλειστά μοντέλα της OpenAI, της Anthropic και της Google. Ωστόσο, οι ερευνητές AI που έψαξαν τα έγγραφα της Meta ανακάλυψαν κάτι ασυνήθιστο.

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Στα ψιλά γράμματα, η Meta παραδέχεται ότι η έκδοση του Maverick που δοκιμάστηκε στο LMArena δεν είναι η ίδια με αυτή που είναι διαθέσιμη στο κοινό. Σύμφωνα με τα υλικά της Meta, χρησιμοποιήθηκε μια “πειραματική έκδοση συνομιλίας” του Maverick που ήταν ειδικά “βελτιστοποιημένη για συνομιλία”. Ο ιστότοπος LMArena αντέτεινε ότι η ερμηνεία της πολιτικής από τη Meta δεν ανταγωνίζεται τις προσδοκίες των παρόχων μοντέλων.

Η εκπρόσωπος της Meta, Ashley Gabriel, δήλωσε ότι “προχωρούμε σε πειραματισμούς με όλους τους τύπους προσαρμοσμένων παραλλαγών“. Υπογράμμισε ότι η έκδοση “Llama-4-Maverick-03-26-Experimental” είναι μια συνομιλιακή βελτιστοποιημένη έκδοση που δοκιμάστηκε και απέδωσε καλά στο LMArena. Τώρα που έχουμε κυκλοφορήσει την ανοιχτή μας έκδοση, θα δούμε πώς οι προγραμματιστές θα προσαρμόσουν το Llama 4 στις δικές τους περιπτώσεις χρήσης.

Διαβάστε επίσης: Η Apple φέρεται να κρατά σχεδόν ίδιο σχεδιασμό με το iPhone 17 για το iPhone 18

Η απόφαση της Meta να χρησιμοποιήσει ένα βελτιστοποιημένο μοντέλο στο LMArena έχει προκαλέσει ανησυχίες στην κοινότητα AI, καθώς οι βαθμολογίες αναφοράς κινδυνεύουν να γίνουν λιγότερο αξιόπιστες. Όπως δήλωσε ο ανεξάρτητος ερευνητής AI Simon Willison, “είναι το πιο σεβαστό γενικό benchmark γιατί τα υπόλοιπα δεν είναι αξιόπιστα”. Η κυκλοφορία του Llama 4 σε μια περίοδο που δεν είναι συνήθης για μεγάλες ανακοινώσεις AI, καθώς και οι φήμες ότι η Meta έχει εκπαιδεύσει τα μοντέλα της για να αποδίδουν καλύτερα στα benchmarks, έχουν προσθέσει περαιτέρω αβεβαιότητα στην κατάσταση.

Advertisement. Scroll to continue reading.

Η Meta προσπαθεί να διατηρήσει την εικόνα της ως ηγέτης στον τομέα της AI, αλλά οι πρόσφατες εξελίξεις δείχνουν ότι οι μάχες για τις κορυφαίες θέσεις στα benchmarks γίνονται όλο και πιο περίπλοκες. Η κοινότητα περιμένει με ανυπομονησία τις επόμενες κινήσεις της Meta και τις ανακοινώσεις γύρω από το Llama 4, ελπίζοντας για περισσότερη διαφάνεια στις μετρήσεις απόδοσης.

Advertisement. Scroll to continue reading.

In this article:Tech, Τεχνητή Νοημοσύνη

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

GTA 6: Πρώην developer της Rockstar εκτιμά ότι έχει γίνει πλήρες rebuild της RAGE Engine

Gaming

GTA 6: Πρώην developer της Rockstar εκτιμά ότι έχει γίνει πλήρες rebuild της RAGE Engine

Η μακρά αναμονή για το GTA 6 ίσως να συνδέεται με μια πολύ μεγαλύτερη τεχνική αλλαγή στα παρασκήνια, σύμφωνα με τον Rob Carr, πρώην...

Δημήτρης Κυριαζίδης4 ημέρες πριν

Η Apple φέρεται να κρατά σχεδόν ίδιο σχεδιασμό με το iPhone 17 για το iPhone 18

Τεχνολογία

Η Apple φέρεται να κρατά σχεδόν ίδιο σχεδιασμό με το iPhone 17 για το iPhone 18

Η σειρά iPhone 18 ίσως να μην φέρει μεγάλες αλλαγές στην εμφάνιση σε σχέση με το iPhone 17, σύμφωνα με νέα φήμη από την...

XplayGR4 ημέρες πριν

Ένα post του Robert Downey Jr. ίσως αποκαλύπτει την συμμετοχή του Spider-Man στο Avengers: Doomsday

Ταινίες

Ένα post του Robert Downey Jr. ίσως αποκαλύπτει την συμμετοχή του Spider-Man στο Avengers: Doomsday

Ο Robert Downey Jr. φαίνεται πως έδωσε ένα ακόμη μυστηριώδες στοιχείο για το Avengers: Doomsday, μέσα από μια πασχαλινή ανάρτηση αφιερωμένη στον Doctor Doom....

Μαρία Μαργέτη3 ημέρες πριν

Καθυστερεί η έκδοση του 007 First Light για το Nintendo Switch 2

Gaming

Καθυστερεί η έκδοση του 007 First Light για το Nintendo Switch 2

Η IO Interactive ανακοίνωσε ότι η έκδοση του 007 First Light για το Nintendo Switch 2 δεν θα κυκλοφορήσει τελικά τον Μάιο μαζί με...

Δημήτρης Κυριαζίδης23 ώρες πριν

Παίκτης τερμάτισε το Dark Souls στο level 1 χωρίς roll και χωρίς ούτε ένα χτύπημα

Gaming

Παίκτης τερμάτισε το Dark Souls στο level 1 χωρίς roll και χωρίς ούτε ένα χτύπημα

Ένας παίκτης κατάφερε να ολοκληρώσει το Dark Souls με έναν από τους πιο ακραίους περιορισμούς που έχουν εμφανιστεί ποτέ στην κοινότητα του παιχνιδιού. Ο...

Δημήτρης Κυριαζίδης4 ημέρες πριν

Η Super Mario Galaxy Movie σπάει νέο ρεκόρ στο παγκόσμιο box office

Ταινίες

Η Super Mario Galaxy Movie σπάει νέο ρεκόρ στο παγκόσμιο box office

Η Super Mario Galaxy Movie έγινε η πρώτη animated σειρά ταινιών που καταφέρνει δύο φορές άνοιγμα άνω των 350 εκατομμυρίων δολαρίων παγκοσμίως. Η νέα...

Μαρία Μαργέτη3 ημέρες πριν

Gaming

Φαίνεται ότι αποκαλύφθηκε ποιος θα ήταν ο πρωταγωνιστής του ακυρωμένου Agent της Rockstar

Ένα νέο εύρημα από την κοινότητα φαίνεται πως έφερε ξανά στο προσκήνιο το ακυρωμένο Agent της Rockstar, με έναν fan να υποστηρίζει ότι εντόπισε...

Δημήτρης Κυριαζίδης4 ημέρες πριν

Η πρώτη ματιά του The Punisher: One Last Kill αποκαλύφθηκε στο νέο τρέιλερ του Daredevil: Born Again

Σειρές

Η πρώτη ματιά του The Punisher: One Last Kill αποκαλύφθηκε στο νέο τρέιλερ του Daredevil: Born Again

Η Marvel αποκάλυψε τις πρώτες εικόνες από το The Punisher: One Last Kill, το νέο Special Presentation με πρωταγωνιστή τον Jon Bernthal. Το πρώτο...

Μαρία Μαργέτη3 ημέρες πριν

ΔΙΑΦΗΜΙΣΗ

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Loop

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Gaming

GTA 6: Πρώην developer της Rockstar εκτιμά ότι έχει γίνει πλήρες rebuild της RAGE Engine

Τεχνολογία

Η Apple φέρεται να κρατά σχεδόν ίδιο σχεδιασμό με το iPhone 17 για το iPhone 18

Ταινίες

Ένα post του Robert Downey Jr. ίσως αποκαλύπτει την συμμετοχή του Spider-Man στο Avengers: Doomsday

Gaming

Καθυστερεί η έκδοση του 007 First Light για το Nintendo Switch 2

Gaming

Παίκτης τερμάτισε το Dark Souls στο level 1 χωρίς roll και χωρίς ούτε ένα χτύπημα

Ταινίες

Η Super Mario Galaxy Movie σπάει νέο ρεκόρ στο παγκόσμιο box office

Gaming

Φαίνεται ότι αποκαλύφθηκε ποιος θα ήταν ο πρωταγωνιστής του ακυρωμένου Agent της Rockstar

Σειρές

Η πρώτη ματιά του The Punisher: One Last Kill αποκαλύφθηκε στο νέο τρέιλερ του Daredevil: Born Again