Τεχνολογία

Νέα ρεκόρ ταχύτητας από την NVIDIA με τις Blackwell GPUs

Από XPlay GR — Δημοσιεύτηκε 1 έτος πριν

Η NVIDIA ανακοίνωσε πρόσφατα ότι έχει καταφέρει να σπάσει τα όρια απόδοσης στην Τεχνητή Νοημοσύνη (AI) με την αρχιτεκτονική Blackwell, μέσω μιας σειράς βελτιστοποιήσεων και της αυξημένης υπολογιστικής ισχύος. Σε μια νέα ανάρτηση στο blog της, η εταιρεία αποκάλυψε ότι έχει επιτύχει ταχύτητες έως και 1.000 TPS (tokens per second) με τη χρήση ενός μόνο κόμβου DGX B200 που διαθέτει οκτώ NVIDIA Blackwell GPUs.

Αυτή η εντυπωσιακή επίδοση επιτεύχθηκε με το μοντέλο Llama 4 Maverick της Meta, το οποίο διαθέτει 400 δισεκατομμύρια παραμέτρους, και υποδηλώνει ότι το οικοσύστημα AI της NVIDIA έχει κάνει τεράστιες προόδους στον τομέα. Με αυτή τη ρύθμιση, η NVIDIA μπορεί πλέον να επιτύχει έως και 72.000 TPS σε έναν διακομιστή Blackwell, κάτι που, όπως ανέφερε ο Jensen Huang στην ομιλία του στην Computex, θα επιτρέψει στις εταιρείες να επιδεικνύουν την πρόοδό τους στην AI μέσω της απόδοσης των token.

Αναλυτική προσέγγιση στη βελτιστοποίηση της Blackwell

Η επιτυχία της NVIDIA να σπάσει τα όρια TP/s οφείλεται σε εκτενείς βελτιστοποιήσεις λογισμικού που χρησιμοποιούν την τεχνολογία TensorRT-LLM και ένα μοντέλο προκαταρκτικής αποκωδικοποίησης. Αυτή η διαδικασία έχει προσφέρει αύξηση της απόδοσης κατά 4 φορές. Στην ανάρτησή της, η ομάδα Team Green εξερεύνησε πολλές πτυχές της βελτιστοποίησης της Blackwell για μεγάλης κλίμακας LLMs, με κύριο ρόλο να διαδραματίζει η τεχνική της προκαταρκτικής αποκωδικοποίησης.

Διαβάστε επίσης: Νέα έρευνα της Anthropic εντοπίζει στο Claude έναν εσωτερικό «χώρο σκέψης» που θυμίζει τον ανθρώπινο εγκέφαλο

Η προκαταρκτική αποκωδικοποίηση είναι μια δημοφιλής τεχνική που επιταχύνει την ταχύτητα επεξεργασίας των LLMs χωρίς να θυσιάζει την ποιότητα του παραγόμενου κειμένου. Με αυτή την τεχνική, ένα μικρότερο και ταχύτερο μοντέλο “προκαταρκτικής” αποκωδικοποίησης προβλέπει μια ακολουθία υποθετικών tokens, τα οποία στη συνέχεια επαληθεύονται παράλληλα από το μεγαλύτερο “στόχο” LLM. Σύμφωνα με την NVIDIA, η ταχύτητα προέρχεται από την παραγωγή πολλών tokens σε μία μόνο εκτέλεση του μοντέλου στόχου, με το κόστος της επιπλέον φόρτωσης του μοντέλου προκαταρκτικής.

Η NVIDIA χρησιμοποίησε μια αρχιτεκτονική βασισμένη στην EAGLE3, η οποία είναι σχεδιασμένη να επιταχύνει την επεξεργασία μοντέλων γλώσσας μεγάλου μεγέθους, αποδεικνύοντας έτσι τη ηγεσία της στον τομέα της AI. Με την βελτιστοποίηση της Blackwell για LLMs όπως το Llama 4 Maverick, η εταιρεία έχει κάνει ένα σημαντικό βήμα προς την κατεύθυνση της ταχύτερης και πιο ομαλής αλληλεπίδρασης με την Τεχνητή Νοημοσύνη.

Advertisement. Scroll to continue reading.

In this article:Tech

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Η Samsung αναμένει το 2026 κέρδη που θα ξεπεράσουν το σύνολο των τελευταίων 40 ετών

Τεχνολογία

Η Samsung αναμένει το 2026 κέρδη που θα ξεπεράσουν το σύνολο των τελευταίων 40 ετών

Τα ετήσια λειτουργικά κέρδη του τομέα ημιαγωγών της Samsung Electronics για το 2026 αναμένεται να ξεπεράσουν το συσσωρευμένο κέρδος που έχει καταγράψει η εταιρεία...

XplayGR4 ημέρες πριν

Το ARC Raiders διαχωρίζει το matchmaking ανάλογα με το στυλ παιχνιδιού

Gaming

Το ARC Raiders διαχωρίζει το matchmaking ανάλογα με το στυλ παιχνιδιού

Η εταιρεία ανάπτυξης Embark Studios κυκλοφόρησε την ενημέρωση 1.36.0 για το ARC Raiders, εισάγοντας μια σημαντική αλλαγή στο σύστημα matchmaking, η οποία αποτελούσε βασικό...

Δημήτρης Κυριαζίδης2 ημέρες πριν

Ταινίες

Το Greyhound με τον Tom Hanks έγινε μία από τις δημοφιλέστερες ταινίες στην ιστορία του Apple TV+

Έξι χρόνια μετά την κυκλοφορία του, το πολεμικό θρίλερ Greyhound με πρωταγωνιστή τον Tom Hanks συνεχίζει να σημειώνει εντυπωσιακές επιδόσεις στο Apple TV+, κατακτώντας...

Μαρία Μαργέτη3 ημέρες πριν

Πάνω από 100.000 υπογραφές σε τέσσερις ημέρες συγκεντρώθηκαν για το ψήφισμα ενάντια στην κατάργηση των δίσκων από τη Sony

Gaming

Πάνω από 100.000 υπογραφές σε τέσσερις ημέρες συγκεντρώθηκαν για το ψήφισμα ενάντια στην κατάργηση των δίσκων από τη Sony

Η πρόσφατη απόφαση της Sony να τερματίσει την παραγωγή φυσικών δίσκων για τα νέα παιχνίδια του PlayStation από τον Ιανουάριο του 2028 έχει προκαλέσει...

Δημήτρης Κυριαζίδης4 ημέρες πριν

Gaming

Η Xbox παραδέχτηκε μεγάλες απώλειες από τις εξαγορές της

Το Xbox ανακοίνωσε χιλιάδες απολύσεις, με τη CEO Asha Sharma να περιγράφει με ασυνήθιστα άμεσο τρόπο πόσο προβληματική αποδείχθηκε η στρατηγική των συνεχών εξαγορών...

XplayGR3 ημέρες πριν

Οι πρώτες αντιδράσεις για την Οδύσσεια του Κρίστοφερ Νόλαν μιλούν για «ένα εντυπωσιακό έπος»

Ταινίες

Οι πρώτες αντιδράσεις για την Οδύσσεια του Κρίστοφερ Νόλαν μιλούν για «ένα εντυπωσιακό έπος»

Οι πρώτες αντιδράσεις για την Οδύσσεια (The Odyssey) του Κρίστοφερ Νόλαν εμφανίστηκαν μετά την παγκόσμια πρεμιέρα της ταινίας και δείχνουν ότι το νέο μεγάλο...

Μαρία Μαργέτη3 ημέρες πριν

Ο δημιουργός του Clair Obscur: Expedition 33 φοβάται ότι η AI θα μπορεί κάποτε να δημιουργεί ολόκληρα παιχνίδια «σε πέντε δευτερόλεπτα»

Gaming

Ο δημιουργός του Clair Obscur: Expedition 33 φοβάται ότι η AI θα μπορεί κάποτε να δημιουργεί ολόκληρα παιχνίδια «σε πέντε δευτερόλεπτα»

Ο Guillaume Broche, επικεφαλής της Sandfall Interactive και σκηνοθέτης του Clair Obscur: Expedition 33, μίλησε για τον ρόλο της γενετικής τεχνητής νοημοσύνης στην ανάπτυξη...

Δημήτρης Κυριαζίδης4 ημέρες πριν

Αποκαλύφθηκε το Attack on Titan 3 με σχεδόν μία ώρα gameplay

Gaming

Αποκαλύφθηκε το Attack on Titan 3 με σχεδόν μία ώρα gameplay

Η Koei Tecmo παρουσίασε και επίσημα το Attack on Titan 3, το νέο παιχνίδι δράσης που βασίζεται στη δημοφιλή σειρά anime. Η αποκάλυψη συνοδεύτηκε...

XplayGR3 ημέρες πριν

ΔΙΑΦΗΜΙΣΗ

Αναλυτική προσέγγιση στη βελτιστοποίηση της Blackwell

Loop

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Τεχνολογία

Η Samsung αναμένει το 2026 κέρδη που θα ξεπεράσουν το σύνολο των τελευταίων 40 ετών

Gaming

Το ARC Raiders διαχωρίζει το matchmaking ανάλογα με το στυλ παιχνιδιού

Ταινίες

Το Greyhound με τον Tom Hanks έγινε μία από τις δημοφιλέστερες ταινίες στην ιστορία του Apple TV+

Gaming

Πάνω από 100.000 υπογραφές σε τέσσερις ημέρες συγκεντρώθηκαν για το ψήφισμα ενάντια στην κατάργηση των δίσκων από τη Sony

Gaming

Η Xbox παραδέχτηκε μεγάλες απώλειες από τις εξαγορές της

Ταινίες

Οι πρώτες αντιδράσεις για την Οδύσσεια του Κρίστοφερ Νόλαν μιλούν για «ένα εντυπωσιακό έπος»

Gaming

Ο δημιουργός του Clair Obscur: Expedition 33 φοβάται ότι η AI θα μπορεί κάποτε να δημιουργεί ολόκληρα παιχνίδια «σε πέντε δευτερόλεπτα»

Gaming

Αποκαλύφθηκε το Attack on Titan 3 με σχεδόν μία ώρα gameplay