Connect with us

Τι ψάχνεις;

Τεχνολογία

Νέα ρεκόρ ταχύτητας από την NVIDIA με τις Blackwell GPUs

Νέα ρεκόρ ταχύτητας από την NVIDIA με τις Blackwell GPUs

Η NVIDIA ανακοίνωσε πρόσφατα ότι έχει καταφέρει να σπάσει τα όρια απόδοσης στην Τεχνητή Νοημοσύνη (AI) με την αρχιτεκτονική Blackwell, μέσω μιας σειράς βελτιστοποιήσεων και της αυξημένης υπολογιστικής ισχύος. Σε μια νέα ανάρτηση στο blog της, η εταιρεία αποκάλυψε ότι έχει επιτύχει ταχύτητες έως και 1.000 TPS (tokens per second) με τη χρήση ενός μόνο κόμβου DGX B200 που διαθέτει οκτώ NVIDIA Blackwell GPUs.

Αυτή η εντυπωσιακή επίδοση επιτεύχθηκε με το μοντέλο Llama 4 Maverick της Meta, το οποίο διαθέτει 400 δισεκατομμύρια παραμέτρους, και υποδηλώνει ότι το οικοσύστημα AI της NVIDIA έχει κάνει τεράστιες προόδους στον τομέα. Με αυτή τη ρύθμιση, η NVIDIA μπορεί πλέον να επιτύχει έως και 72.000 TPS σε έναν διακομιστή Blackwell, κάτι που, όπως ανέφερε ο Jensen Huang στην ομιλία του στην Computex, θα επιτρέψει στις εταιρείες να επιδεικνύουν την πρόοδό τους στην AI μέσω της απόδοσης των token.

Αναλυτική προσέγγιση στη βελτιστοποίηση της Blackwell

Η επιτυχία της NVIDIA να σπάσει τα όρια TP/s οφείλεται σε εκτενείς βελτιστοποιήσεις λογισμικού που χρησιμοποιούν την τεχνολογία TensorRT-LLM και ένα μοντέλο προκαταρκτικής αποκωδικοποίησης. Αυτή η διαδικασία έχει προσφέρει αύξηση της απόδοσης κατά 4 φορές. Στην ανάρτησή της, η ομάδα Team Green εξερεύνησε πολλές πτυχές της βελτιστοποίησης της Blackwell για μεγάλης κλίμακας LLMs, με κύριο ρόλο να διαδραματίζει η τεχνική της προκαταρκτικής αποκωδικοποίησης.

Διαβάστε επίσης:  Ο Elon Musk έχασε την υπόθεση κατά του Sam Altman

Η προκαταρκτική αποκωδικοποίηση είναι μια δημοφιλής τεχνική που επιταχύνει την ταχύτητα επεξεργασίας των LLMs χωρίς να θυσιάζει την ποιότητα του παραγόμενου κειμένου. Με αυτή την τεχνική, ένα μικρότερο και ταχύτερο μοντέλο “προκαταρκτικής” αποκωδικοποίησης προβλέπει μια ακολουθία υποθετικών tokens, τα οποία στη συνέχεια επαληθεύονται παράλληλα από το μεγαλύτερο “στόχο” LLM. Σύμφωνα με την NVIDIA, η ταχύτητα προέρχεται από την παραγωγή πολλών tokens σε μία μόνο εκτέλεση του μοντέλου στόχου, με το κόστος της επιπλέον φόρτωσης του μοντέλου προκαταρκτικής.

Η NVIDIA χρησιμοποίησε μια αρχιτεκτονική βασισμένη στην EAGLE3, η οποία είναι σχεδιασμένη να επιταχύνει την επεξεργασία μοντέλων γλώσσας μεγάλου μεγέθους, αποδεικνύοντας έτσι τη ηγεσία της στον τομέα της AI. Με την βελτιστοποίηση της Blackwell για LLMs όπως το Llama 4 Maverick, η εταιρεία έχει κάνει ένα σημαντικό βήμα προς την κατεύθυνση της ταχύτερης και πιο ομαλής αλληλεπίδρασης με την Τεχνητή Νοημοσύνη.

Advertisement. Scroll to continue reading.

Loop

ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Σειρές

Ο Cheo Hodari Coker, δημιουργός της σειράς Luke Cage του Netflix, σχολίασε το The Punisher: One Last Kill και στάθηκε σε ένα βασικό πρόβλημα...

Ταινίες

Ο Christopher Nolan χαρακτήρισε την Οδύσσεια (The Odyssey) ως τη μεγαλύτερη ταινία που έχει κάνει μέχρι σήμερα, τονίζοντας ότι η μεταφορά του έπους του...

Gaming

Ο διευθύνων σύμβουλος της Take-Two, Strauss Zelnick, επιβεβαίωσε εκ νέου την ημερομηνία κυκλοφορίας του Grand Theft Auto 6 για τις 19 Νοεμβρίου 2026. Το...

Τεχνολογία

Η Μάλτα προχώρησε σε συνεργασία με την OpenAI για την υλοποίηση ενός εθνικού προγράμματος, μέσω του οποίου θα παρέχεται στους κατοίκους της δωρεάν πρόσβαση...

Τεχνολογία

Η ιαπωνική εταιρεία κατασκευής Ohta Seiki δέχεται καταιγισμό παραγγελιών για τους ανιματρόνικ λύκους της, καθώς η χώρα προσπαθεί να διαχειριστεί τη ραγδαία αύξηση των...

Ταινίες

Ο James Cameron άφησε ανοιχτό το ενδεχόμενο οι επόμενες δύο ταινίες του Avatar να χρειαστούν νέα προσέγγιση στην παραγωγή, μετά τις χαμηλότερες εισπράξεις του...

Ταινίες

Η ταινία της Nintendo και της Illumination ξεπέρασε το A Minecraft Movie, το οποίο είχε φτάσει τα 961 εκατ. δολάρια παγκοσμίως. Η διαφορά ανάμεσα...

Ταινίες

Η παραγωγή της ταινίας Sonic the Hedgehog 4 ολοκληρώθηκε επίσημα, με την κυκλοφορία της στους κινηματογράφους να έχει προγραμματιστεί για το 2027. Η κινηματογραφική...

ΔΙΑΦΗΜΙΣΗ