Connect with us

Τι ψάχνεις;

Τεχνολογία

Το νέο AI της Google σερφάρει στο ίντερνετ όπως ένας κανονικός χρήστης

Το νέο AI της Google σερφάρει στο ίντερνετ όπως ένας κανονικός χρήστης

Η Google αποκαλύπτει το Gemini 2.5 Computer Use, ένα μοντέλο τεχνητής νοημοσύνης που επιτρέπει σε AI πράκτορες να αλληλεπιδρούν με ιστοσελίδες, χρησιμοποιώντας περιβάλλοντα σχεδιασμένα για ανθρώπους.

Νέες δυνατότητες και λειτουργίες

Η Google παρουσιάζει το Gemini 2.5 Computer Use, ένα μοντέλο AI που χρησιμοποιεί “οπτική κατανόηση και λογικές δυνατότητες” για την ανάλυση αιτημάτων χρηστών και την εκτέλεση εργασιών, όπως η συμπλήρωση και υποβολή φορμών. Το μοντέλο αυτό μπορεί να χρησιμοποιηθεί για δοκιμές διεπαφής χρήστη ή για πλοήγηση σε περιβάλλοντα χωρίς διαθέσιμο API ή άλλη άμεση σύνδεση.

Άλλες εκδόσεις αυτού του μοντέλου έχουν χρησιμοποιηθεί για χαρακτηριστικά πρακτόρων στο AI Mode και στο Project Mariner, ένα ερευνητικό πρωτότυπο που χρησιμοποιεί AI πράκτορες για την εκτέλεση εργασιών σε έναν περιηγητή, όπως η προσθήκη αντικειμένων στο καλάθι, βάσει μιας λίστας συστατικών.

Η ανταγωνιστική σκηνή της AI

Η ανακοίνωση της Google έρχεται μόλις μία ημέρα μετά την αποκάλυψη νέων εφαρμογών για το ChatGPT από την OpenAI, στο ετήσιο Dev Day της. Η Google συνεχίζει να εστιάζει στην ChatGPT Agent λειτουργία, που μπορεί να ολοκληρώσει σύνθετες εργασίες εκ μέρους σας. Εν τω μεταξύ, η Anthropic είχε ήδη κυκλοφορήσει μια έκδοση του μοντέλου Claude AI με “χρήση υπολογιστή” από πέρυσι.

Advertisement. Scroll to continue reading.

Η Google αναφέρει ότι το μοντέλο χρήσης υπολογιστή “ξεπερνάει τις κορυφαίες εναλλακτικές λύσεις σε πολλαπλά web και mobile benchmarks”. Σε αντίθεση με το ChatGPT Agent και το εργαλείο χρήσης υπολογιστή της Anthropic, το νέο μοντέλο AI της Google έχει πρόσβαση μόνο σε έναν περιηγητή — όχι σε ολόκληρο το περιβάλλον του υπολογιστή. Η Google σημειώνει ότι “δεν είναι ακόμη βελτιστοποιημένο για έλεγχο σε επίπεδο λειτουργικού συστήματος desktop” και υποστηρίζει προς το παρόν 13 ενέργειες, όπως το άνοιγμα ενός περιηγητή, η πληκτρολόγηση κειμένου, καθώς και η μεταφορά και απόθεση στοιχείων.

Διαβάστε επίσης:  Tα Robotaxi της Tesla δημιουργούν τετραπλάσιο ποσοστό τροχαίων ατυχημάτων σε σχέση με τους ανθρώπους, σύμφωνα με αναφορές

Το Gemini 2.5 Computer Use είναι διαθέσιμο στους προγραμματιστές μέσω του Google AI Studio και του Vertex AI, αλλά υπάρχει επίσης μια επίδειξη στο Browserbase, όπου μπορείτε να δείτε το μοντέλο να ολοκληρώνει εργασίες, όπως “Παίξε ένα παιχνίδι του 2048” ή “Περιηγήσου στο Hacker News για τάσεις στις συζητήσεις”.

Advertisement. Scroll to continue reading.

Loop

ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Ταινίες

Ο Cillian Murphy επιστρέφει ως Τόμι Σέλμπι στο πρώτο επίσημο trailer του Peaky Blinders: The Immortal Man, της κινηματογραφικής συνέχειας της δημοφιλούς σειράς. Παρότι...

Gaming

Ραγδαίες εξελίξεις σημειώνονται στη Microsoft Gaming, καθώς ο Phil Spencer αποχωρεί από τη θέση του CEO του Xbox, η Sarah Bond παραιτείται και η...

Ταινίες

Η Disney και η Pixar έδωσαν στη δημοσιότητα το πρώτο ολοκληρωμένο trailer του Toy Story 5, τέσσερις μήνες πριν από την πρεμιέρα του στις...

Features

To Dark mode του xplaygr.com είναι μια συλλογή άρθρων που αφορούν σκοτεινές θεωρίες για τα αγαπημένα μας παιχνίδια. Εδώ βλέπουμε τις ιστορίες, κάπως διαφορετικά....

Σειρές

Το πρώτο επίσημο trailer για την 3η σεζόν του House of the Dragon κυκλοφόρησε και υπόσχεται μια εκρηκτική συνέχεια γεμάτη φωτιά, δράκους και βαριά...

Gaming

Η Sony προχωρά στο κλείσιμο της Bluepoint Games, πέντε χρόνια μετά την εξαγορά του στούντιο που υπέγραψε το remake του Demon’s Souls για το...

Ταινίες

Η Netflix επιχειρεί να καθησυχάσει τη βιομηχανία των κινηματογράφων μετά την ανακοίνωση εξαγοράς της Warner Bros. Pictures τον περασμένο Δεκέμβριο, αποκαλύπτοντας ότι σκοπεύει να...

Gaming

Η Ubisoft επιβεβαίωσε επίσημα ότι βρίσκονται σε ανάπτυξη δύο νέα παιχνίδια Far Cry και «πολλαπλοί» νέοι τίτλοι Assassin’s Creed, μέσω συνέντευξης του συνιδρυτή και...

ΔΙΑΦΗΜΙΣΗ