Τεχνολογία

Η NVIDIA παρουσίασε το Nemotron 3 Super, ένα open-source μοντέλο AI σχεδιασμένο για agentic εφαρμογές

Από XplayGR — Δημοσιεύτηκε 4 μήνες πριν

Η NVIDIA αποκάλυψε το νέο Nemotron 3 Super, την πιο πρόσφατη έκδοση της σειράς open-source μεγάλων γλωσσικών μοντέλων Nemotron.

Το νέο μοντέλο έχει σχεδιαστεί ειδικά για agentic AI workloads και προσφέρει τεράστιο context window, κάτι που το καθιστά ιδιαίτερα κατάλληλο για συστήματα τεχνητής νοημοσύνης που λειτουργούν ως αυτόνομοι «agents», όπως το OpenClaw.

Η εταιρεία συνεχίζει έτσι τη στρατηγική της να επενδύει όχι μόνο σε υποδομές και chips για AI αλλά και σε ανοιχτά μοντέλα, τοποθετώντας τη δυτική αγορά σε ανταγωνιστική θέση απέναντι σε έργα από κινεζικά εργαστήρια όπως τα Kimi και Qwen.

Hybrid Mamba-MoE αρχιτεκτονική και τεράστιο context window

Ένα από τα σημαντικότερα χαρακτηριστικά του Nemotron 3 Super είναι η υβριδική αρχιτεκτονική Mamba-MoE. Η προσέγγιση αυτή αλλάζει τον τρόπο με τον οποίο ένα μεγάλο γλωσσικό μοντέλο επεξεργάζεται τη ροή δεδομένων, αξιοποιώντας το State Space Model (SSM) για γραμμική ανάγνωση των πληροφοριών και αποφυγή συσσώρευσης άχρηστου περιεχομένου μέσα στο context.

Σύμφωνα με την NVIDIA, τα layers της αρχιτεκτονικής Mamba προσφέρουν έως και 4 φορές υψηλότερη αποδοτικότητα σε μνήμη και υπολογιστική ισχύ, ενώ τα transformer layers αναλαμβάνουν πιο σύνθετες διαδικασίες λογικής και συλλογισμού.

Advertisement. Scroll to continue reading.

Το μοντέλο χρησιμοποιεί επίσης Mixture-of-Experts (MoE), όπου από τα 120 δισεκατομμύρια παραμέτρους ενεργοποιούνται μόλις 12 δισεκατομμύρια κατά τη διαδικασία inference. Επιπλέον, η τεχνική Latent MoE ενεργοποιεί τέσσερις εξειδικευμένους «experts» με το υπολογιστικό κόστος ενός, βελτιώνοντας την ακρίβεια στην παραγωγή του επόμενου token.

Διαβάστε επίσης: Η Ευρωπαϊκή Ένωση εξετάζει νέα όρια στα social media για παιδιά και εφήβους

Μια ακόμη σημαντική λειτουργία είναι το Multi-Token Prediction, που επιτρέπει στο μοντέλο να προβλέπει πολλαπλές λέξεις ταυτόχρονα, οδηγώντας σε έως και 3 φορές ταχύτερο inference.

Επιδόσεις σε agentic workloads και benchmark

Το Nemotron 3 Super διαθέτει context window 1 εκατομμυρίου tokens, τέσσερις φορές μεγαλύτερο από αυτό του Kimi 2.5. Σε agentic συστήματα, όπου τα μοντέλα πρέπει να επεξεργάζονται μεγάλους όγκους πληροφοριών για να λάβουν αποφάσεις, το μεγάλο context θεωρείται κρίσιμο για την ποιότητα των απαντήσεων.

Σε δοκιμές της NVIDIA στο benchmark PinchBench, που αξιολογεί workloads για AI agents, το μοντέλο πέτυχε 85,6% στο σύνολο των τεστ. Η επίδοση αυτή το τοποθετεί μπροστά από μοντέλα όπως τα Opus 4.5, Kimi 2.5 και GPT-OSS 120B.

Ένα ακόμη πλεονέκτημα είναι ότι η απαιτούμενη υπολογιστική ισχύς για εκτέλεση των workloads μπορεί να καλυφθεί ακόμη και από μία μόνο GPU, κάτι που ανοίγει τον δρόμο για πιο πρακτικές εφαρμογές σε εταιρικά περιβάλλοντα αλλά και σε edge deployments.

Η παρουσίαση του Nemotron 3 Super δείχνει την κατεύθυνση προς την οποία κινείται η ανάπτυξη της τεχνητής νοημοσύνης: μοντέλα σχεδιασμένα όχι μόνο για συνομιλία, αλλά για πολύπλοκα αυτόνομα συστήματα που εκτελούν εργασίες και λαμβάνουν αποφάσεις σε πραγματικό χρόνο.

Advertisement. Scroll to continue reading.

In this article:Tech, Τεχνητή Νοημοσύνη

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Ταινίες

Η παραγωγός του Spider-Man: Brand New Day βάζει όρια στα νέα spin-offs

Η παραγωγός του Spider-Man: Brand New Day, Amy Pascal, δήλωσε ότι η Sony και η Marvel πρέπει να είναι ιδιαίτερα προσεκτικές με την ανάπτυξη...

Μαρία Μαργέτη2 ημέρες πριν

To Netflix εξετάζει την προσθήκη ζωντανών καναλιών και συνδρομητικών πακέτων

Σειρές

To Netflix εξετάζει την προσθήκη ζωντανών καναλιών και συνδρομητικών πακέτων

Το Netflix εξετάζει αλλαγές που θα μπορούσαν να μετατρέψουν την υπηρεσία από μια απλή βιβλιοθήκη περιεχομένου σε ευρύτερη πλατφόρμα ψυχαγωγίας, με στελέχη της εταιρείας...

Μαρία Μαργέτη4 ημέρες πριν

Επιβεβαιώθηκε η κυκλοφορία του God of War Laufey και σε φυσική έκδοση

Gaming