Connect with us

Τι ψάχνεις;

Νεα

Η Meta αποκαλύπτει νέα μοντέλα Llama 4, αλλά προκαλεί αμφιβολίες

Facebook meta

Το Σαββατοκύριακο, η Meta ανακοίνωσε την κυκλοφορία δύο νέων μοντέλων της σειράς Llama 4: το μικρότερο μοντέλο ονόματι Scout και το μεσαίο μοντέλο Maverick, το οποίο η εταιρεία υποστηρίζει ότι μπορεί να ξεπεράσει το GPT-4o και το Gemini 2.0 Flash σε μια ευρεία γκάμα αναγνωρισμένων benchmarks. Το Maverick κατάφερε γρήγορα να καταλάβει τη δεύτερη θέση στο LMArena, τον ιστότοπο αναφοράς AI όπου οι άνθρωποι συγκρίνουν τις επιδόσεις διαφορετικών συστημάτων και ψηφίζουν για το καλύτερο αποτέλεσμα.

Σύμφωνα με το δελτίο τύπου της Meta, η βαθμολογία ELO του Maverick ανήλθε σε 1417, τοποθετώντας το πάνω από το OpenAI 4o και λίγο κάτω από το Gemini 2.5 Pro. Αυτή η επίδοση φέρεται να καθιστά το Llama 4 της Meta έναν σοβαρό αντίπαλο στα πιο προηγμένα κλειστά μοντέλα της OpenAI, της Anthropic και της Google. Ωστόσο, οι ερευνητές AI που έψαξαν τα έγγραφα της Meta ανακάλυψαν κάτι ασυνήθιστο.

Αμφιβολίες για τη διαφάνεια των αποτελεσμάτων

Στα ψιλά γράμματα, η Meta παραδέχεται ότι η έκδοση του Maverick που δοκιμάστηκε στο LMArena δεν είναι η ίδια με αυτή που είναι διαθέσιμη στο κοινό. Σύμφωνα με τα υλικά της Meta, χρησιμοποιήθηκε μια “πειραματική έκδοση συνομιλίας” του Maverick που ήταν ειδικά “βελτιστοποιημένη για συνομιλία”. Ο ιστότοπος LMArena αντέτεινε ότι η ερμηνεία της πολιτικής από τη Meta δεν ανταγωνίζεται τις προσδοκίες των παρόχων μοντέλων.

Η εκπρόσωπος της Meta, Ashley Gabriel, δήλωσε ότι “προχωρούμε σε πειραματισμούς με όλους τους τύπους προσαρμοσμένων παραλλαγών“. Υπογράμμισε ότι η έκδοση “Llama-4-Maverick-03-26-Experimental” είναι μια συνομιλιακή βελτιστοποιημένη έκδοση που δοκιμάστηκε και απέδωσε καλά στο LMArena. Τώρα που έχουμε κυκλοφορήσει την ανοιχτή μας έκδοση, θα δούμε πώς οι προγραμματιστές θα προσαρμόσουν το Llama 4 στις δικές τους περιπτώσεις χρήσης.

Διαβάστε επίσης:  Η Asus αναβαθμίζει το ROG Zephyrus Duo με δύο πραγματικές edge-to-edge οθόνες

Η απόφαση της Meta να χρησιμοποιήσει ένα βελτιστοποιημένο μοντέλο στο LMArena έχει προκαλέσει ανησυχίες στην κοινότητα AI, καθώς οι βαθμολογίες αναφοράς κινδυνεύουν να γίνουν λιγότερο αξιόπιστες. Όπως δήλωσε ο ανεξάρτητος ερευνητής AI Simon Willison, “είναι το πιο σεβαστό γενικό benchmark γιατί τα υπόλοιπα δεν είναι αξιόπιστα”. Η κυκλοφορία του Llama 4 σε μια περίοδο που δεν είναι συνήθης για μεγάλες ανακοινώσεις AI, καθώς και οι φήμες ότι η Meta έχει εκπαιδεύσει τα μοντέλα της για να αποδίδουν καλύτερα στα benchmarks, έχουν προσθέσει περαιτέρω αβεβαιότητα στην κατάσταση.

Advertisement. Scroll to continue reading.

Η Meta προσπαθεί να διατηρήσει την εικόνα της ως ηγέτης στον τομέα της AI, αλλά οι πρόσφατες εξελίξεις δείχνουν ότι οι μάχες για τις κορυφαίες θέσεις στα benchmarks γίνονται όλο και πιο περίπλοκες. Η κοινότητα περιμένει με ανυπομονησία τις επόμενες κινήσεις της Meta και τις ανακοινώσεις γύρω από το Llama 4, ελπίζοντας για περισσότερη διαφάνεια στις μετρήσεις απόδοσης.

 

Advertisement. Scroll to continue reading.
ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Gaming

Ανησυχία προκαλούν οι νέες πληροφορίες γύρω από το GTA 6, με τον έγκυρο δημοσιογράφο Jason Schreier να εκφράζει φόβους για ακόμη μία καθυστέρηση. Παρά...

Τεχνολογία

Η Dell αναγνώρισε ότι η ζήτηση των καταναλωτών δεν επηρεάζεται από την τεχνητή νοημοσύνη, παρά τη στροφή της βιομηχανίας προς το σχετικό υλικό. Οι...

Τεχνολογία

Η OpenAI ανακοίνωσε το ChatGPT Health, μια νέα εξειδικευμένη εμπειρία που συνδυάζει τις πληροφορίες υγείας των χρηστών με την τεχνητή νοημοσύνη. Η υπηρεσία στοχεύει...

Gaming

Οι φετινές υποψηφιότητες των DICE Awards 2026 ανακοινώθηκαν από την Academy of Interactive Arts & Sciences (AIAS), με τα Clair Obscur: Expedition 33, Ghost...

Gaming

Ο δημιουργός του Dark Souls και επικεφαλής της FromSoftware, Hidetaka Miyazaki, δήλωσε πως το αρχικό υπόβαθρο που είχε θέσει ο George R. R. Martin...

Gaming

Η ZeniMax Online Studios ανακοίνωσε την εισαγωγή του πρώτου επί πληρωμή battle pass για το Elder Scrolls Online, με την ονομασία Tamriel Tomes. Η...

Gaming

Η PlayStation αποκάλυψε επίσημα τη νέα και πιο τολμηρή σειρά αξεσουάρ της έως σήμερα: την Hyperpop Collection. Η συλλογή περιλαμβάνει τρεις νέες χρωματικές εκδόσεις...

Σειρες

Οι δημιουργοί του Stranger Things, Matt και Ross Duffer, ξεκαθάρισαν ότι δεν σκοπεύουν να επιστρέψουν στο αρχικό καστ των χαρακτήρων για μια συνέχεια της...

Σειρες

Η Millie Bobby Brown έσπασε τη σιωπή της σχετικά με το αν η Eleven θα μπορούσε να είναι ζωντανή μετά το δραματικό φινάλε της...

Σειρες

Η πλατφόρμα Disney+ ανακοίνωσε την ενσωμάτωση κάθετων βίντεο εντός του 2026, στοχεύοντας στην προσέλκυση νεότερων ηλικιακά θεατών. Η κίνηση αυτή παρουσιάστηκε επίσημα στις 7...

Gaming

Σύμφωνα με νέες αναφορές, η Microsoft σχεδιάζει να ενσωματώσει την πλήρη εμπειρία των Windows στην επόμενη κονσόλα Xbox. Η κίνηση αυτή θα επιτρέπει στους...

Gaming

Η Blizzard φαίνεται έτοιμη να αναβιώσει το σύμπαν του StarCraft με έναν νέο τίτλο τύπου shooter, ο οποίος αναμένεται να παρουσιαστεί επίσημα στο BlizzCon...

ΔΙΑΦΗΜΙΣΗ