Connect with us

Τι ψάχνεις;

Νεα

Η Meta αποκαλύπτει νέα μοντέλα Llama 4, αλλά προκαλεί αμφιβολίες

Facebook meta

Το Σαββατοκύριακο, η Meta ανακοίνωσε την κυκλοφορία δύο νέων μοντέλων της σειράς Llama 4: το μικρότερο μοντέλο ονόματι Scout και το μεσαίο μοντέλο Maverick, το οποίο η εταιρεία υποστηρίζει ότι μπορεί να ξεπεράσει το GPT-4o και το Gemini 2.0 Flash σε μια ευρεία γκάμα αναγνωρισμένων benchmarks. Το Maverick κατάφερε γρήγορα να καταλάβει τη δεύτερη θέση στο LMArena, τον ιστότοπο αναφοράς AI όπου οι άνθρωποι συγκρίνουν τις επιδόσεις διαφορετικών συστημάτων και ψηφίζουν για το καλύτερο αποτέλεσμα.

Σύμφωνα με το δελτίο τύπου της Meta, η βαθμολογία ELO του Maverick ανήλθε σε 1417, τοποθετώντας το πάνω από το OpenAI 4o και λίγο κάτω από το Gemini 2.5 Pro. Αυτή η επίδοση φέρεται να καθιστά το Llama 4 της Meta έναν σοβαρό αντίπαλο στα πιο προηγμένα κλειστά μοντέλα της OpenAI, της Anthropic και της Google. Ωστόσο, οι ερευνητές AI που έψαξαν τα έγγραφα της Meta ανακάλυψαν κάτι ασυνήθιστο.

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Στα ψιλά γράμματα, η Meta παραδέχεται ότι η έκδοση του Maverick που δοκιμάστηκε στο LMArena δεν είναι η ίδια με αυτή που είναι διαθέσιμη στο κοινό. Σύμφωνα με τα υλικά της Meta, χρησιμοποιήθηκε μια “πειραματική έκδοση συνομιλίας” του Maverick που ήταν ειδικά “βελτιστοποιημένη για συνομιλία”. Ο ιστότοπος LMArena αντέτεινε ότι η ερμηνεία της πολιτικής από τη Meta δεν ανταγωνίζεται τις προσδοκίες των παρόχων μοντέλων.

Η εκπρόσωπος της Meta, Ashley Gabriel, δήλωσε ότι “προχωρούμε σε πειραματισμούς με όλους τους τύπους προσαρμοσμένων παραλλαγών“. Υπογράμμισε ότι η έκδοση “Llama-4-Maverick-03-26-Experimental” είναι μια συνομιλιακή βελτιστοποιημένη έκδοση που δοκιμάστηκε και απέδωσε καλά στο LMArena. Τώρα που έχουμε κυκλοφορήσει την ανοιχτή μας έκδοση, θα δούμε πώς οι προγραμματιστές θα προσαρμόσουν το Llama 4 στις δικές τους περιπτώσεις χρήσης.

Διαβάστε επίσης:  Η Γαλλία θέλει να κλείσει την πρόσβαση στο Kick μετά τον θάνατο του Jean Pormanove

Η απόφαση της Meta να χρησιμοποιήσει ένα βελτιστοποιημένο μοντέλο στο LMArena έχει προκαλέσει ανησυχίες στην κοινότητα AI, καθώς οι βαθμολογίες αναφοράς κινδυνεύουν να γίνουν λιγότερο αξιόπιστες. Όπως δήλωσε ο ανεξάρτητος ερευνητής AI Simon Willison, “είναι το πιο σεβαστό γενικό benchmark γιατί τα υπόλοιπα δεν είναι αξιόπιστα”. Η κυκλοφορία του Llama 4 σε μια περίοδο που δεν είναι συνήθης για μεγάλες ανακοινώσεις AI, καθώς και οι φήμες ότι η Meta έχει εκπαιδεύσει τα μοντέλα της για να αποδίδουν καλύτερα στα benchmarks, έχουν προσθέσει περαιτέρω αβεβαιότητα στην κατάσταση.

Advertisement. Scroll to continue reading.

Η Meta προσπαθεί να διατηρήσει την εικόνα της ως ηγέτης στον τομέα της AI, αλλά οι πρόσφατες εξελίξεις δείχνουν ότι οι μάχες για τις κορυφαίες θέσεις στα benchmarks γίνονται όλο και πιο περίπλοκες. Η κοινότητα περιμένει με ανυπομονησία τις επόμενες κινήσεις της Meta και τις ανακοινώσεις γύρω από το Llama 4, ελπίζοντας για περισσότερη διαφάνεια στις μετρήσεις απόδοσης.

 

Advertisement. Scroll to continue reading.
ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Ταινίες

Ένα φιλόδοξο καλλιτεχνικό όραμα που ξεκίνησε το 2011 ολοκληρώθηκε στο Detroit, όπου το πολυαναμενόμενο άγαλμα του RoboCop τοποθετήθηκε επίσημα στην καρδιά του Eastern Market....

Gaming

Η Polyphony Digital αποκάλυψε επίσημα το επερχόμενο SPEC III Update για το Gran Turismo 7, μια από τις πιο εκτενείς αναβαθμίσεις που έχει λάβει...

Τεχνολογία

Ο επικεφαλής σχεδιασμού διεπαφών χρήστη της Apple, Alan Dye, αποχωρεί από την εταιρεία μετά από μια δεκαετία στο τιμόνι της ομάδας UI, για να...

Gaming

Μια σχετικά άγνωστη κονσόλα, το Nex Playground, κατάφερε να ξεπεράσει το PS5 και το Xbox Series X στις πωλήσεις της εβδομάδας στις ΗΠΑ, καταλαμβάνοντας...

Gaming

Μέσω ανάρτησης στα μέσα κοινωνικής δικτύωσης την Τετάρτη 3 Δεκεμβρίου 2025, ο επίσημος λογαριασμός του Prince of Persia: The Sands of Time επιβεβαίωσε ότι...

Τεχνολογία

Ένα ανθρωποειδές ρομπότ, δημιούργημα κινεζικής εταιρείας ρομποτικής, έθεσε ένα νέο παγκόσμιο ρεκόρ Guinness, αφού κατάφερε να περπατήσει 106,286 χιλιόμετρα (περίπου 66 μίλια) χωρίς καμία...

Ταινίες

Το κινηματογραφικό σύμπαν της DC, υπό τη δημιουργική καθοδήγηση του James Gunn, προετοιμάζεται για μια σημαντική εξέλιξη με τίτλους όπως Lanterns, Supergirl και Clayface...

Gaming

Η Play by Play Studios έδωσε στη δημοσιότητα νέο teaser trailer για το επερχόμενο NBA THE RUN, το οποίο αναβιώνει το arcade μπάσκετ με...

Gaming

Μια κινεζική εταιρεία κατασκευής μηχανικών πληκτρολογίων κυκλοφόρησε ένα νέο «πληκτρολόγιο ποδιού» (Foot Keyboard) σχεδιασμένο για να λειτουργεί με διάφορα είδη παιχνιδιών. Καθώς ο τεχνολογικός...

Gaming

Η έναρξη της νέας σεζόν του Warzone φέρνει μια από τις πιο εκτενείς ανανεώσεις που έχουμε δει τα τελευταία χρόνια, καθώς το παιχνίδι ενσωματώνεται...

Σειρες

Ο παραγωγός του Stranger Things, Shawn Levy, μίλησε για τη συγκλονιστική αποκάλυψη του Volume 1 της 5ης σεζόν, η οποία προκάλεσε σοκ σε κοινό...

Σειρες

Το Netflix έδωσε στη δημοσιότητα το πρώτο trailer της πολυαναμενόμενης 3ης σεζόν του The Night Agent, προσφέροντας μια πρώτη ματιά στη νέα αποστολή του...

ΔΙΑΦΗΜΙΣΗ