Η NVIDIA αποκάλυψε το νέο Nemotron 3 Super, την πιο πρόσφατη έκδοση της σειράς open-source μεγάλων γλωσσικών μοντέλων Nemotron.
Το νέο μοντέλο έχει σχεδιαστεί ειδικά για agentic AI workloads και προσφέρει τεράστιο context window, κάτι που το καθιστά ιδιαίτερα κατάλληλο για συστήματα τεχνητής νοημοσύνης που λειτουργούν ως αυτόνομοι «agents», όπως το OpenClaw.
Η εταιρεία συνεχίζει έτσι τη στρατηγική της να επενδύει όχι μόνο σε υποδομές και chips για AI αλλά και σε ανοιχτά μοντέλα, τοποθετώντας τη δυτική αγορά σε ανταγωνιστική θέση απέναντι σε έργα από κινεζικά εργαστήρια όπως τα Kimi και Qwen.
Hybrid Mamba-MoE αρχιτεκτονική και τεράστιο context window
Ένα από τα σημαντικότερα χαρακτηριστικά του Nemotron 3 Super είναι η υβριδική αρχιτεκτονική Mamba-MoE. Η προσέγγιση αυτή αλλάζει τον τρόπο με τον οποίο ένα μεγάλο γλωσσικό μοντέλο επεξεργάζεται τη ροή δεδομένων, αξιοποιώντας το State Space Model (SSM) για γραμμική ανάγνωση των πληροφοριών και αποφυγή συσσώρευσης άχρηστου περιεχομένου μέσα στο context.
Σύμφωνα με την NVIDIA, τα layers της αρχιτεκτονικής Mamba προσφέρουν έως και 4 φορές υψηλότερη αποδοτικότητα σε μνήμη και υπολογιστική ισχύ, ενώ τα transformer layers αναλαμβάνουν πιο σύνθετες διαδικασίες λογικής και συλλογισμού.
Το μοντέλο χρησιμοποιεί επίσης Mixture-of-Experts (MoE), όπου από τα 120 δισεκατομμύρια παραμέτρους ενεργοποιούνται μόλις 12 δισεκατομμύρια κατά τη διαδικασία inference. Επιπλέον, η τεχνική Latent MoE ενεργοποιεί τέσσερις εξειδικευμένους «experts» με το υπολογιστικό κόστος ενός, βελτιώνοντας την ακρίβεια στην παραγωγή του επόμενου token.
Μια ακόμη σημαντική λειτουργία είναι το Multi-Token Prediction, που επιτρέπει στο μοντέλο να προβλέπει πολλαπλές λέξεις ταυτόχρονα, οδηγώντας σε έως και 3 φορές ταχύτερο inference.
Επιδόσεις σε agentic workloads και benchmark
Το Nemotron 3 Super διαθέτει context window 1 εκατομμυρίου tokens, τέσσερις φορές μεγαλύτερο από αυτό του Kimi 2.5. Σε agentic συστήματα, όπου τα μοντέλα πρέπει να επεξεργάζονται μεγάλους όγκους πληροφοριών για να λάβουν αποφάσεις, το μεγάλο context θεωρείται κρίσιμο για την ποιότητα των απαντήσεων.
Σε δοκιμές της NVIDIA στο benchmark PinchBench, που αξιολογεί workloads για AI agents, το μοντέλο πέτυχε 85,6% στο σύνολο των τεστ. Η επίδοση αυτή το τοποθετεί μπροστά από μοντέλα όπως τα Opus 4.5, Kimi 2.5 και GPT-OSS 120B.
Ένα ακόμη πλεονέκτημα είναι ότι η απαιτούμενη υπολογιστική ισχύς για εκτέλεση των workloads μπορεί να καλυφθεί ακόμη και από μία μόνο GPU, κάτι που ανοίγει τον δρόμο για πιο πρακτικές εφαρμογές σε εταιρικά περιβάλλοντα αλλά και σε edge deployments.
Η παρουσίαση του Nemotron 3 Super δείχνει την κατεύθυνση προς την οποία κινείται η ανάπτυξη της τεχνητής νοημοσύνης: μοντέλα σχεδιασμένα όχι μόνο για συνομιλία, αλλά για πολύπλοκα αυτόνομα συστήματα που εκτελούν εργασίες και λαμβάνουν αποφάσεις σε πραγματικό χρόνο.
Ακολουθήστε το XplayGR στο Google News για να μαθαίνετε πρώτοι όλες τις εξελίξεις από τον χώρο του gaming και της ψυχαγωγίας.
Δείτε όλες τις τελευταίες ειδήσεις στο XplayGR.com.

































