Connect with us

Τι ψάχνεις;

Τεχνολογία

Το νέο AI της Google σερφάρει στο ίντερνετ όπως ένας κανονικός χρήστης

Το νέο AI της Google σερφάρει στο ίντερνετ όπως ένας κανονικός χρήστης

Η Google αποκαλύπτει το Gemini 2.5 Computer Use, ένα μοντέλο τεχνητής νοημοσύνης που επιτρέπει σε AI πράκτορες να αλληλεπιδρούν με ιστοσελίδες, χρησιμοποιώντας περιβάλλοντα σχεδιασμένα για ανθρώπους.

Νέες δυνατότητες και λειτουργίες

Η Google παρουσιάζει το Gemini 2.5 Computer Use, ένα μοντέλο AI που χρησιμοποιεί “οπτική κατανόηση και λογικές δυνατότητες” για την ανάλυση αιτημάτων χρηστών και την εκτέλεση εργασιών, όπως η συμπλήρωση και υποβολή φορμών. Το μοντέλο αυτό μπορεί να χρησιμοποιηθεί για δοκιμές διεπαφής χρήστη ή για πλοήγηση σε περιβάλλοντα χωρίς διαθέσιμο API ή άλλη άμεση σύνδεση.

Άλλες εκδόσεις αυτού του μοντέλου έχουν χρησιμοποιηθεί για χαρακτηριστικά πρακτόρων στο AI Mode και στο Project Mariner, ένα ερευνητικό πρωτότυπο που χρησιμοποιεί AI πράκτορες για την εκτέλεση εργασιών σε έναν περιηγητή, όπως η προσθήκη αντικειμένων στο καλάθι, βάσει μιας λίστας συστατικών.

Η ανταγωνιστική σκηνή της AI

Η ανακοίνωση της Google έρχεται μόλις μία ημέρα μετά την αποκάλυψη νέων εφαρμογών για το ChatGPT από την OpenAI, στο ετήσιο Dev Day της. Η Google συνεχίζει να εστιάζει στην ChatGPT Agent λειτουργία, που μπορεί να ολοκληρώσει σύνθετες εργασίες εκ μέρους σας. Εν τω μεταξύ, η Anthropic είχε ήδη κυκλοφορήσει μια έκδοση του μοντέλου Claude AI με “χρήση υπολογιστή” από πέρυσι.

Advertisement. Scroll to continue reading.

Η Google αναφέρει ότι το μοντέλο χρήσης υπολογιστή “ξεπερνάει τις κορυφαίες εναλλακτικές λύσεις σε πολλαπλά web και mobile benchmarks”. Σε αντίθεση με το ChatGPT Agent και το εργαλείο χρήσης υπολογιστή της Anthropic, το νέο μοντέλο AI της Google έχει πρόσβαση μόνο σε έναν περιηγητή — όχι σε ολόκληρο το περιβάλλον του υπολογιστή. Η Google σημειώνει ότι “δεν είναι ακόμη βελτιστοποιημένο για έλεγχο σε επίπεδο λειτουργικού συστήματος desktop” και υποστηρίζει προς το παρόν 13 ενέργειες, όπως το άνοιγμα ενός περιηγητή, η πληκτρολόγηση κειμένου, καθώς και η μεταφορά και απόθεση στοιχείων.

Διαβάστε επίσης:  Η TCL αποκτά τον έλεγχο των τηλεοράσεων Sony μέσω της Bravia Inc.

Το Gemini 2.5 Computer Use είναι διαθέσιμο στους προγραμματιστές μέσω του Google AI Studio και του Vertex AI, αλλά υπάρχει επίσης μια επίδειξη στο Browserbase, όπου μπορείτε να δείτε το μοντέλο να ολοκληρώνει εργασίες, όπως “Παίξε ένα παιχνίδι του 2048” ή “Περιηγήσου στο Hacker News για τάσεις στις συζητήσεις”.

Advertisement. Scroll to continue reading.

Loop

ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Gaming

Η συζήτηση γύρω από το κόστος του PS5 έχει φουντώσει ξανά, όμως ένα γράφημα που κυκλοφορεί στο Reddit δείχνει ότι η σημερινή κονσόλα της...

Features

Η δικαστική νίκη της Activision απέναντι στην εταιρεία AM General, που βρίσκεται πίσω από τα Humvee, δεν είχε ποτέ άμεση σχέση με τη Rockstar...

Τεχνολογία

Η Apple απέκτησε ένα από τα πιο εντυπωσιακά διαφημιστικά στιγμιότυπα των τελευταίων ετών, καθώς το iPhone 17 Pro εμφανίστηκε σε βίντεο μέσα από την...

Gaming

Η διαδραστική εμπειρία του Resident Evil Requiem είναι αλήθεια ότι έτυχε πολύ θετικής υποδοχής και δεχτήκαμε πολλά θετικά σχόλια για αυτό το νέο κομμάτι...

Features

Μόλις ανοίξετε την αρχική σελίδα του Netflix και ακούσετε τον χαρακτηριστικό ήχο , οι επιλογές φαντάζουν ατελείωτες. Από εσωτερικές παραγωγές που έγιναν μοντέρνα κλασικά...

Gaming

Σχεδόν δύο χρόνια μετά την κυκλοφορία του The First Descendant, η Nexon μίλησε ασυνήθιστα ανοιχτά για την πορεία του looter shooter, κατατάσσοντάς το επίσημα...

Gaming

Η PlayStation κυκλοφόρησε ένα νέο πακέτο δωρεάν avatars για να γιορτάσει τα 30 χρόνια του Resident Evil, όμως η διαδικασία για να τα αποκτήσουν...

Gaming

Νέες λεπτομέρειες έρχονται στο φως της δημοσιότητας σχετικά με την οικονομική απόδοση των τίτλων της PlayStation στην αγορά των PC, αποκαλύπτοντας τα κέρδη που...

ΔΙΑΦΗΜΙΣΗ