Τεχνολογία

Η OpenAI φέρνει AMD, NVIDIA, Intel, Microsoft και Broadcom στο νέο πρωτόκολλο MRC

Από XplayGR — Δημοσιεύτηκε 2 ώρες πριν

Η OpenAI ανακοίνωσε συνεργασία με AMD, NVIDIA, Intel, Microsoft και Broadcom για την ανάπτυξη του MRC, ενός νέου πρωτοκόλλου που στοχεύει να βελτιώσει την απόδοση και την ανθεκτικότητα των δικτύων σε μεγάλα AI training clusters.

Το MRC, δηλαδή Multipath Reliable Connection, παρουσιάζεται ως λύση για ένα από τα κρίσιμα προβλήματα στην εκπαίδευση μεγάλων AI μοντέλων: τη μεταφορά δεδομένων ανάμεσα σε τεράστια clusters από GPUs. Όταν ακόμη και μία μεταφορά καθυστερήσει, η διαδικασία μπορεί να επηρεαστεί συνολικά, αφήνοντας GPUs ανενεργές.

Σύμφωνα με την OpenAI, οι βασικές αιτίες αυτών των καθυστερήσεων είναι η συμφόρηση του δικτύου, οι αστοχίες σε συνδέσεις και τα προβλήματα σε συσκευές. Όσο μεγαλώνει το cluster, τόσο πιο συχνά εμφανίζονται αυτά τα εμπόδια.

Πώς λειτουργεί το MRC

Η OpenAI αναφέρει ότι εργάστηκε τα τελευταία δύο χρόνια με AMD, Broadcom, Intel, Microsoft και NVIDIA πάνω στο MRC, το οποίο ενσωματώνεται στα νεότερα network interfaces των 800 Gb/s. Ο στόχος είναι μια μεμονωμένη μεταφορά να μπορεί να μοιράζεται σε εκατοντάδες αδιάκοπες διαδρομές, να παρακάμπτει βλάβες μέσα σε microseconds και να λειτουργεί με απλούστερα network control planes.

Η εταιρεία εξηγεί ότι, αντί να αντιμετωπίζεται κάθε network interface ως μία σύνδεση των 800 Gb/s, το interface χωρίζεται σε μικρότερες συνδέσεις. Για παράδειγμα, ένα interface μπορεί να συνδεθεί με οκτώ διαφορετικά switches, δημιουργώντας οκτώ παράλληλα δίκτυα, ή planes, που λειτουργούν στα 100 Gb/s το καθένα.

Advertisement. Scroll to continue reading.

«Αυτή η αλλαγή έχει μεγάλη επίδραση στο σχήμα του cluster. Ένα switch που μπορεί να συνδέσει 64 ports στα 800 Gb/s μπορεί αντίθετα να συνδέσει 512 ports στα 100 Gb/s. Αυτό επιτρέπει τη δημιουργία ενός δικτύου που συνδέει πλήρως περίπου 131.000 GPUs με μόνο δύο tiers από switches. Ένα συμβατικό δίκτυο 800 Gb/s θα απαιτούσε τρία ή τέσσερα tiers», αναφέρει η OpenAI.

Διαβάστε επίσης: Τα έσοδα του iPhone έφτασαν τα 57 δισ. δολάρια παρά τις ελλείψεις σε chips

Ήδη σε χρήση σε supercomputers της OpenAI

Το MRC θα επεκτείνει το υπάρχον RDMA over RoCE, δηλαδή Converged Ethernet, επιτρέποντας hardware-accelerated remote direct memory access για GPUs και CPUs. Η OpenAI έχει ήδη αναπτύξει το πρωτόκολλο σε supercomputers που φιλοξενούν NVIDIA GB200 Blackwell GPUs και χρησιμοποιούνται για την εκπαίδευση frontier μοντέλων.

Στα παραδείγματα που αναφέρονται περιλαμβάνονται η Oracle Cloud Infrastructure στο Abilene του Texas και τα Fairwater supercomputers της Microsoft. Το MRC έχει ήδη χρησιμοποιηθεί για την εκπαίδευση πολλαπλών μοντέλων της OpenAI σε NVIDIA και Broadcom hardware.

Το νέο πρωτόκολλο έχει κυκλοφορήσει μέσω του Open Compute Project, ώστε να μπορεί να χρησιμοποιηθεί ευρύτερα από εταιρείες του AI χώρου. Η OpenAI το συνδέει και με το Stargate supercomputer της Oracle Cloud Infrastructure στο Abilene, το οποίο έχει στόχο να φτάσει τα 10GW AI compute έως το 2029, έχοντας ήδη αναπτύξει πάνω από 3GW τους τελευταίους τρεις μήνες.

In this article:Tech, Τεχνητή Νοημοσύνη

Σχόλια

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Νέο μεγάλο update του Crimson Desert δίνει περισσότερο endgame περιεχόμενο

Gaming

Νέο μεγάλο update του Crimson Desert δίνει περισσότερο endgame περιεχόμενο

Η Pearl Abyss κυκλοφόρησε το update 1.05.00 για το Crimson Desert, με τη νέα έκδοση να προσθέτει δύο βασικές λειτουργίες για παίκτες που είχαν...

Δημήτρης Κυριαζίδης3 ημέρες πριν

Αστρονόμοι εντόπισαν 27 πιθανούς πλανήτες σαν τον Τατουίν του Star Wars

Τεχνολογία

Αστρονόμοι εντόπισαν 27 πιθανούς πλανήτες σαν τον Τατουίν του Star Wars

Η Star Wars Day έφερε μια πραγματική αστρονομική είδηση με έντονο άρωμα Τατουίν αφού ερευνητές εντόπισαν 27 πιθανούς πλανήτες που κινούνται γύρω από δύο...

XplayGR2 ημέρες πριν

Η Διεθνής Ολυμπιακή Επιτροπή παγώνει την Επιτροπή Esports

Gaming

Η Διεθνής Ολυμπιακή Επιτροπή παγώνει την Επιτροπή Esports

Η πορεία των esports προς τους Ολυμπιακούς Αγώνες δείχνει να σταματά ξανά, καθώς νέο ρεπορτάζ αναφέρει ότι η Διεθνής Ολυμπιακή Επιτροπή έχει θέσει προσωρινά...

Κωνσταντίνος Ζουμπουλιάς3 ημέρες πριν

Ο Christopher Nolan συγκρίνει την Οδύσσεια με τη Marvel, με το νέο trailer να δείχνει τον Πολύφημο

Ταινίες

Ο Christopher Nolan συγκρίνει την Οδύσσεια με τη Marvel, με το νέο trailer να δείχνει τον Πολύφημο

Η Οδύσσεια του Christopher Nolan αποκάλυψε νέο trailer, δίνοντας την πιο καθαρή ματιά μέχρι σήμερα στο επόμενο μεγάλο κινηματογραφικό project του σκηνοθέτη, που έχει...

Μαρία Μαργέτη2 ημέρες πριν

Ο Tom Hiddleston λέει ότι το Avengers: Doomsday θα ξεπεράσει κάθε προσδοκία

Ταινίες

Ο Tom Hiddleston λέει ότι το Avengers: Doomsday θα ξεπεράσει κάθε προσδοκία

Ο Tom Hiddleston ανεβάζει τον πήχη για το Avengers: Doomsday, υποστηρίζοντας ότι η νέα μεγάλη ταινία της Marvel δεν θα κινηθεί απλώς στο ύψος...

Μαρία Μαργέτη3 ημέρες πριν

Η GameStop προσφέρει 56 δισεκατομμύρια δολάρια για την εξαγορά του eBay

Τεχνολογία

Η GameStop προσφέρει 56 δισεκατομμύρια δολάρια για την εξαγορά του eBay

Η GameStop κατέθεσε πρόταση εξαγοράς του eBay ύψους 56 δισ. δολαρίων, σε μια κίνηση που συνδέεται με το σχέδιο του CEO Ryan Cohen να...

XplayGR2 ημέρες πριν

Η Valve θέλει ανταγωνιστική τιμή για το Steam Machine, αλλά βλέπει αναπόφευκτες πιέσεις από τις ελλείψεις RAM

Gaming

Η Valve θέλει ανταγωνιστική τιμή για το Steam Machine, αλλά βλέπει αναπόφευκτες πιέσεις από τις ελλείψεις RAM

Η Valve προσπαθεί να κρατήσει όσο γίνεται πιο ανταγωνιστική την τιμή του Steam Machine, όμως η εταιρεία αναγνωρίζει ότι οι ελλείψεις σε RAM και...

Δημήτρης Κυριαζίδης3 ημέρες πριν

Το Νυχτερινός Πράκτορας τελειώνει στο Netflix με την 4η σεζόν

Σειρές

Το Νυχτερινός Πράκτορας τελειώνει στο Netflix με την 4η σεζόν

Το Netflix βάζει ημερομηνία λήξης σε μία από τις πιο δημοφιλείς action thriller σειρές του. Το Νυχτερινός Πράκτορας, θα ολοκληρωθεί με την 4η σεζόν,...

Μαρία Μαργέτη2 ημέρες πριν

ΔΙΑΦΗΜΙΣΗ

Πώς λειτουργεί το MRC

Ήδη σε χρήση σε supercomputers της OpenAI

Loop

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Gaming

Νέο μεγάλο update του Crimson Desert δίνει περισσότερο endgame περιεχόμενο

Τεχνολογία

Αστρονόμοι εντόπισαν 27 πιθανούς πλανήτες σαν τον Τατουίν του Star Wars

Gaming

Η Διεθνής Ολυμπιακή Επιτροπή παγώνει την Επιτροπή Esports

Ταινίες

Ο Christopher Nolan συγκρίνει την Οδύσσεια με τη Marvel, με το νέο trailer να δείχνει τον Πολύφημο

Ταινίες

Ο Tom Hiddleston λέει ότι το Avengers: Doomsday θα ξεπεράσει κάθε προσδοκία

Τεχνολογία

Η GameStop προσφέρει 56 δισεκατομμύρια δολάρια για την εξαγορά του eBay

Gaming

Η Valve θέλει ανταγωνιστική τιμή για το Steam Machine, αλλά βλέπει αναπόφευκτες πιέσεις από τις ελλείψεις RAM

Σειρές

Το Νυχτερινός Πράκτορας τελειώνει στο Netflix με την 4η σεζόν