Νεα

Η Meta αποκαλύπτει νέα μοντέλα Llama 4, αλλά προκαλεί αμφιβολίες

Από XPlay GR — Δημοσιεύτηκε 5 μήνες πριν

Το Σαββατοκύριακο, η Meta ανακοίνωσε την κυκλοφορία δύο νέων μοντέλων της σειράς Llama 4: το μικρότερο μοντέλο ονόματι Scout και το μεσαίο μοντέλο Maverick, το οποίο η εταιρεία υποστηρίζει ότι μπορεί να ξεπεράσει το GPT-4o και το Gemini 2.0 Flash σε μια ευρεία γκάμα αναγνωρισμένων benchmarks. Το Maverick κατάφερε γρήγορα να καταλάβει τη δεύτερη θέση στο LMArena, τον ιστότοπο αναφοράς AI όπου οι άνθρωποι συγκρίνουν τις επιδόσεις διαφορετικών συστημάτων και ψηφίζουν για το καλύτερο αποτέλεσμα.

Σύμφωνα με το δελτίο τύπου της Meta, η βαθμολογία ELO του Maverick ανήλθε σε 1417, τοποθετώντας το πάνω από το OpenAI 4o και λίγο κάτω από το Gemini 2.5 Pro. Αυτή η επίδοση φέρεται να καθιστά το Llama 4 της Meta έναν σοβαρό αντίπαλο στα πιο προηγμένα κλειστά μοντέλα της OpenAI, της Anthropic και της Google. Ωστόσο, οι ερευνητές AI που έψαξαν τα έγγραφα της Meta ανακάλυψαν κάτι ασυνήθιστο.

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Στα ψιλά γράμματα, η Meta παραδέχεται ότι η έκδοση του Maverick που δοκιμάστηκε στο LMArena δεν είναι η ίδια με αυτή που είναι διαθέσιμη στο κοινό. Σύμφωνα με τα υλικά της Meta, χρησιμοποιήθηκε μια “πειραματική έκδοση συνομιλίας” του Maverick που ήταν ειδικά “βελτιστοποιημένη για συνομιλία”. Ο ιστότοπος LMArena αντέτεινε ότι η ερμηνεία της πολιτικής από τη Meta δεν ανταγωνίζεται τις προσδοκίες των παρόχων μοντέλων.

Η εκπρόσωπος της Meta, Ashley Gabriel, δήλωσε ότι “προχωρούμε σε πειραματισμούς με όλους τους τύπους προσαρμοσμένων παραλλαγών“. Υπογράμμισε ότι η έκδοση “Llama-4-Maverick-03-26-Experimental” είναι μια συνομιλιακή βελτιστοποιημένη έκδοση που δοκιμάστηκε και απέδωσε καλά στο LMArena. Τώρα που έχουμε κυκλοφορήσει την ανοιχτή μας έκδοση, θα δούμε πώς οι προγραμματιστές θα προσαρμόσουν το Llama 4 στις δικές τους περιπτώσεις χρήσης.

Διαβάστε επίσης: Ο Elon Musk ιδρύει τη νέα εταιρεία λογισμικού «Macrohard»

Η απόφαση της Meta να χρησιμοποιήσει ένα βελτιστοποιημένο μοντέλο στο LMArena έχει προκαλέσει ανησυχίες στην κοινότητα AI, καθώς οι βαθμολογίες αναφοράς κινδυνεύουν να γίνουν λιγότερο αξιόπιστες. Όπως δήλωσε ο ανεξάρτητος ερευνητής AI Simon Willison, “είναι το πιο σεβαστό γενικό benchmark γιατί τα υπόλοιπα δεν είναι αξιόπιστα”. Η κυκλοφορία του Llama 4 σε μια περίοδο που δεν είναι συνήθης για μεγάλες ανακοινώσεις AI, καθώς και οι φήμες ότι η Meta έχει εκπαιδεύσει τα μοντέλα της για να αποδίδουν καλύτερα στα benchmarks, έχουν προσθέσει περαιτέρω αβεβαιότητα στην κατάσταση.

Advertisement. Scroll to continue reading.

Η Meta προσπαθεί να διατηρήσει την εικόνα της ως ηγέτης στον τομέα της AI, αλλά οι πρόσφατες εξελίξεις δείχνουν ότι οι μάχες για τις κορυφαίες θέσεις στα benchmarks γίνονται όλο και πιο περίπλοκες. Η κοινότητα περιμένει με ανυπομονησία τις επόμενες κινήσεις της Meta και τις ανακοινώσεις γύρω από το Llama 4, ελπίζοντας για περισσότερη διαφάνεια στις μετρήσεις απόδοσης.

Advertisement. Scroll to continue reading.

In this article:Tech

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογία

Ο Elon Musk ιδρύει τη νέα εταιρεία λογισμικού «Macrohard»

Μια σκόπιμη «παρωδία» της Microsoft Ο Elon Musk ανακοίνωσε τη δημιουργία μιας νέας εταιρείας λογισμικού με την ονομασία Macrohard, ένα σατιρικό λογοπαίγνιο που παραπέμπει...

XplayGR1 ημέρα πριν

Τεχνολογία

Το AI μοντέλο της Google προέβλεψε με ακρίβεια τον τυφώνα Erin

Η πρώτη μεγάλη δοκιμή για το DeepMind Weather Lab Η Google DeepMind πραγματοποίησε την πρώτη σημαντική δοκιμή του πειραματικού μοντέλου καιρού που ανέπτυξε με...

XplayGR1 ημέρα πριν

Τεχνολογία

Η Nvidia παρουσίασε το Jetson Thor, ένα νέο «εγκέφαλο» για ρομπότ και αυτόνομα οχήματα

Επτά φορές περισσότερη υπολογιστική ισχύς από τον προκάτοχο του Η Nvidia ανακοίνωσε το Jetson Thor, έναν νέο υπερυπολογιστή σχεδιασμένο για ανθρωποειδή ρομπότ και «έξυπνες»...

XplayGR1 ημέρα πριν

Τεχνολογία

Μεγάλη πτώση στα views του Twitch μετά την αντιμετώπιση των viewbots

Μείωση έως και 24% στα εβδομαδιαία views Η πλατφόρμα Twitch καταγράφει σημαντική πτώση στην επισκεψιμότητά της μετά την αυστηρή καταστολή των viewbots. Σύμφωνα με...

XplayGR2 ημέρες πριν

ΔΙΑΦΗΜΙΣΗ

xplaygr.com

Νεα

Η Meta αποκαλύπτει νέα μοντέλα Llama 4, αλλά προκαλεί αμφιβολίες

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Top 5

Gaming

Κλείνει το Roblox; Η εταιρεία του απαντά στις φήμες για κλείσιμο της πλατφόρμας

Ταινίες

Η Disney αναζητά νέες ιδέες για να προσελκύσει το κοινό της Gen Z

Features

Οι 15 καλύτεροι Shooting Guards του NBA 2K26

Σειρες

Το Spin-Off του The Office, The Paper, αλλάζει το πρόγραμμα κυκλοφορίας του

Features

Οι 10 καλύτεροι Point Guards με τα υψηλότερα ratings στο NBA 2K26

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογία

Ο Elon Musk ιδρύει τη νέα εταιρεία λογισμικού «Macrohard»

Τεχνολογία

Το AI μοντέλο της Google προέβλεψε με ακρίβεια τον τυφώνα Erin

Τεχνολογία

Η Nvidia παρουσίασε το Jetson Thor, ένα νέο «εγκέφαλο» για ρομπότ και αυτόνομα οχήματα

Τεχνολογία

Μεγάλη πτώση στα views του Twitch μετά την αντιμετώπιση των viewbots

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Ακολούθησέ μας

Top 5

Gaming

Κλείνει το Roblox; Η εταιρεία του απαντά στις φήμες για κλείσιμο της πλατφόρμας

Ταινίες

Η Disney αναζητά νέες ιδέες για να προσελκύσει το κοινό της Gen Z

Features

Οι 15 καλύτεροι Shooting Guards του NBA 2K26

Σειρες

Το Spin-Off του The Office, The Paper, αλλάζει το πρόγραμμα κυκλοφορίας του

Features

Οι 10 καλύτεροι Point Guards με τα υψηλότερα ratings στο NBA 2K26

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογία

Ο Elon Musk ιδρύει τη νέα εταιρεία λογισμικού «Macrohard»

Τεχνολογία

Το AI μοντέλο της Google προέβλεψε με ακρίβεια τον τυφώνα Erin

Τεχνολογία

Η Nvidia παρουσίασε το Jetson Thor, ένα νέο «εγκέφαλο» για ρομπότ και αυτόνομα οχήματα

Τεχνολογία

Μεγάλη πτώση στα views του Twitch μετά την αντιμετώπιση των viewbots