Connect with us

Τι ψάχνεις;

Τεχνολογία

Η NVIDIA παρουσίασε το Nemotron 3 Super, ένα open-source μοντέλο AI σχεδιασμένο για agentic εφαρμογές

Η NVIDIA παρουσίασε το Nemotron 3 Super, ένα open-source μοντέλο AI σχεδιασμένο για agentic εφαρμογές

Η NVIDIA αποκάλυψε το νέο Nemotron 3 Super, την πιο πρόσφατη έκδοση της σειράς open-source μεγάλων γλωσσικών μοντέλων Nemotron.

Το νέο μοντέλο έχει σχεδιαστεί ειδικά για agentic AI workloads και προσφέρει τεράστιο context window, κάτι που το καθιστά ιδιαίτερα κατάλληλο για συστήματα τεχνητής νοημοσύνης που λειτουργούν ως αυτόνομοι «agents», όπως το OpenClaw.

Η εταιρεία συνεχίζει έτσι τη στρατηγική της να επενδύει όχι μόνο σε υποδομές και chips για AI αλλά και σε ανοιχτά μοντέλα, τοποθετώντας τη δυτική αγορά σε ανταγωνιστική θέση απέναντι σε έργα από κινεζικά εργαστήρια όπως τα Kimi και Qwen.

Hybrid Mamba-MoE αρχιτεκτονική και τεράστιο context window

Ένα από τα σημαντικότερα χαρακτηριστικά του Nemotron 3 Super είναι η υβριδική αρχιτεκτονική Mamba-MoE. Η προσέγγιση αυτή αλλάζει τον τρόπο με τον οποίο ένα μεγάλο γλωσσικό μοντέλο επεξεργάζεται τη ροή δεδομένων, αξιοποιώντας το State Space Model (SSM) για γραμμική ανάγνωση των πληροφοριών και αποφυγή συσσώρευσης άχρηστου περιεχομένου μέσα στο context.

Σύμφωνα με την NVIDIA, τα layers της αρχιτεκτονικής Mamba προσφέρουν έως και 4 φορές υψηλότερη αποδοτικότητα σε μνήμη και υπολογιστική ισχύ, ενώ τα transformer layers αναλαμβάνουν πιο σύνθετες διαδικασίες λογικής και συλλογισμού.

Advertisement. Scroll to continue reading.

Το μοντέλο χρησιμοποιεί επίσης Mixture-of-Experts (MoE), όπου από τα 120 δισεκατομμύρια παραμέτρους ενεργοποιούνται μόλις 12 δισεκατομμύρια κατά τη διαδικασία inference. Επιπλέον, η τεχνική Latent MoE ενεργοποιεί τέσσερις εξειδικευμένους «experts» με το υπολογιστικό κόστος ενός, βελτιώνοντας την ακρίβεια στην παραγωγή του επόμενου token.

Διαβάστε επίσης:  Lisuan G100: Η πρώτη 6nm gaming GPU της Κίνας αναμένεται να παρουσιαστεί στις 12 Μαρτίου

Μια ακόμη σημαντική λειτουργία είναι το Multi-Token Prediction, που επιτρέπει στο μοντέλο να προβλέπει πολλαπλές λέξεις ταυτόχρονα, οδηγώντας σε έως και 3 φορές ταχύτερο inference.

Επιδόσεις σε agentic workloads και benchmark

Το Nemotron 3 Super διαθέτει context window 1 εκατομμυρίου tokens, τέσσερις φορές μεγαλύτερο από αυτό του Kimi 2.5. Σε agentic συστήματα, όπου τα μοντέλα πρέπει να επεξεργάζονται μεγάλους όγκους πληροφοριών για να λάβουν αποφάσεις, το μεγάλο context θεωρείται κρίσιμο για την ποιότητα των απαντήσεων.

Σε δοκιμές της NVIDIA στο benchmark PinchBench, που αξιολογεί workloads για AI agents, το μοντέλο πέτυχε 85,6% στο σύνολο των τεστ. Η επίδοση αυτή το τοποθετεί μπροστά από μοντέλα όπως τα Opus 4.5, Kimi 2.5 και GPT-OSS 120B.

Ένα ακόμη πλεονέκτημα είναι ότι η απαιτούμενη υπολογιστική ισχύς για εκτέλεση των workloads μπορεί να καλυφθεί ακόμη και από μία μόνο GPU, κάτι που ανοίγει τον δρόμο για πιο πρακτικές εφαρμογές σε εταιρικά περιβάλλοντα αλλά και σε edge deployments.

Η παρουσίαση του Nemotron 3 Super δείχνει την κατεύθυνση προς την οποία κινείται η ανάπτυξη της τεχνητής νοημοσύνης: μοντέλα σχεδιασμένα όχι μόνο για συνομιλία, αλλά για πολύπλοκα αυτόνομα συστήματα που εκτελούν εργασίες και λαμβάνουν αποφάσεις σε πραγματικό χρόνο.

Advertisement. Scroll to continue reading.

Σχόλια

Loop

ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Gaming

Τις τελευταίες εβδομάδες, το brand του Xbox βρέθηκε στο επίκεντρο έντονης κριτικής μετά από σημαντικές ανακατατάξεις στην ηγετική του ομάδα, οι οποίες προκάλεσαν ανησυχία...

Gaming

Νέες πληροφορίες αποκαλύπτουν τα πρώτα σχέδια του Shinji Mikami για το νέο του στούντιο Unbound Games, το οποίο εργάζεται πάνω σε ένα AAA original...

Gaming

Πληθαίνουν οι αναφορές για την εφαρμογή ενός συστήματος δυναμικής τιμολόγησης στο PlayStation Store. Η πρακτική αυτή, η οποία βασίζεται σε αλγορίθμους που αναλύουν το...

Ταινίες

Η Nintendo παρουσίασε το τελικό trailer για το The Super Mario Galaxy Movie, δίνοντας την πιο ολοκληρωμένη ματιά μέχρι σήμερα στη συνέχεια της επιτυχημένης...

Gaming

Η κινεζική εταιρεία Lisuan ετοιμάζεται να παρουσιάσει μια νέα κάρτα γραφικών για gamers, την Lisuan G100, η οποία αναμένεται να αποκαλυφθεί επίσημα στις 12...

Ταινίες

Η φιγούρα του Din Djarin είναι άρρηκτα συνδεδεμένη με το κράνος του, όμως στη νέα ταινία The Mandalorian and Grogu φαίνεται πως ο πρωταγωνιστής...

Reviews

Το War Machine φτάνει σε μια εποχή όπου η απειλή του πολέμου μοιάζει πιο πραγματική από ποτέ. Η ταινία του Patrick Hughes, σε σενάριο...

Σειρές

Η επιτυχημένη σειρά Ted Lasso επιστρέφει μετά από τρία χρόνια με νέα επεισόδια στο Apple TV+, και το πρώτο teaser για την 4η σεζόν...

ΔΙΑΦΗΜΙΣΗ