Connect with us

Τι ψάχνεις;

Τεχνολογία

Το νέο μοντέλο AI της Google DeepMind λειτουργεί απευθείας σε ρομπότ

Η Google DeepMind παρουσίασε μια νέα, on-device έκδοση του μοντέλου ρομποτικής AI, Gemini Robotics, που επιτρέπει τη λειτουργία των ρομπότ χωρίς τη σύνδεση στο διαδίκτυο. Το μοντέλο αυτό, γνωστό ως vision-language-action model (VLA), προσφέρει ικανότητες που θυμίζουν την προηγούμενη έκδοση που κυκλοφόρησε τον Μάρτιο, αλλά είναι σχεδιασμένο να είναι μικρό και αποδοτικό ώστε να μπορεί να λειτουργεί απευθείας σε ρομπότ.

Το flagship μοντέλο Gemini Robotics είναι ικανό να ολοκληρώνει ένα ευρύ φάσμα φυσικών εργασιών, ακόμη και αν δεν έχει εκπαιδευτεί ειδικά για αυτές. Αυτή η ικανότητα του επιτρέπει να γενικεύει νέες καταστάσεις, να κατανοεί και να ανταποκρίνεται σε εντολές, καθώς και να εκτελεί εργασίες που απαιτούν λεπτές κινητικές δεξιότητες.

Η Carolina Parada, επικεφαλής ρομποτικής στο Google DeepMind, δήλωσε ότι το αρχικό μοντέλο Gemini Robotics χρησιμοποιεί υβριδική προσέγγιση, επιτρέποντας του να λειτουργεί τόσο σε συσκευές όσο και στο cloud. Με το νέο μοντέλο που λειτουργεί αποκλειστικά σε συσκευή, οι χρήστες μπορούν να αποκτήσουν offline δυνατότητες σχεδόν ισάξιες με αυτές του flagship μοντέλου.

Το on-device μοντέλο μπορεί να εκτελεί πολλές διαφορετικές εργασίες από το ξεκίνημα και μπορεί να προσαρμοστεί σε νέες καταστάσεις με μόλις 50 έως 100 επιδείξεις. Αν και η Google εκπαίδευσε το μοντέλο στο ρομπότ ALOHA, κατάφερε να το προσαρμόσει σε διάφορους τύπους ρομπότ, όπως το ανθρωποειδές Apollo της Apptronik και το Franka FR3.

Διαβάστε επίσης:  Ερευνητές χρησιμοποίησαν το ChatGPT για να υποκλέψουν δεδομένα από το Gmail

Η Parada τόνισε ότι το υβριδικό μοντέλο Gemini Robotics είναι πιο ισχυρό, αλλά εξέφρασε την έκπληξή της για την ισχύ του νέου μοντέλου. Αυτό το μοντέλο μπορεί να χρησιμεύσει ως αρχικό μοντέλο ή για εφαρμογές με περιορισμένη συνδεσιμότητα, γεγονός που το καθιστά χρήσιμο και για εταιρείες με αυστηρές απαιτήσεις ασφαλείας.

Advertisement. Scroll to continue reading.

Μαζί με την κυκλοφορία αυτού του μοντέλου, η Google δημοσιεύει ένα software development kit (SDK) που θα επιτρέψει στους προγραμματιστές να αξιολογήσουν και να προσαρμόσουν το μοντέλο, κάτι που είναι πρωτοποριακό για τα VLA της Google DeepMind. Το μοντέλο και το SDK θα διατεθούν σε μια ομάδα έμπιστων δοκιμαστών, ενώ η Google συνεχίζει να εργάζεται για τη μείωση των κινδύνων ασφαλείας.

 

Advertisement. Scroll to continue reading.

ΔΕΙΤΕ ΕΠΙΣΗΣ

Τεχνολογία

Ο αστεροειδής 2024 YR4 και οι πιθανές επιπτώσεις Η NASA εξετάζει ένα δραστικό σχέδιο που περιλαμβάνει τη χρήση πυρηνικών βομβών για την αναχαίτιση του...

Τεχνολογία

Η νέα λειτουργία Pulse και τι προσφέρει Η OpenAI παρουσίασε τη νέα λειτουργία ChatGPT Pulse, η οποία δίνει στους συνδρομητές του προγράμματος Pro την...

Τεχνολογία

Οι λειτουργίες που επηρεάζονται και οι ανησυχίες για την ασφάλεια Η Apple προειδοποίησε ότι αρκετές νέες λειτουργίες των προϊόντων της θα καθυστερήσουν στην Ευρώπη,...

Τεχνολογία

Η ανακοίνωση στο Snapdragon Summit και το όραμα της Google Μία από τις μεγαλύτερες ειδήσεις του Snapdragon Summit δεν αφορούσε μόνο τη Qualcomm, αλλά...

ΔΙΑΦΗΜΙΣΗ