Connect with us

Τι ψάχνεις;

Τεχνολογία

Το νέο AI της Google σερφάρει στο ίντερνετ όπως ένας κανονικός χρήστης

Το νέο AI της Google σερφάρει στο ίντερνετ όπως ένας κανονικός χρήστης

Η Google αποκαλύπτει το Gemini 2.5 Computer Use, ένα μοντέλο τεχνητής νοημοσύνης που επιτρέπει σε AI πράκτορες να αλληλεπιδρούν με ιστοσελίδες, χρησιμοποιώντας περιβάλλοντα σχεδιασμένα για ανθρώπους.

Νέες δυνατότητες και λειτουργίες

Η Google παρουσιάζει το Gemini 2.5 Computer Use, ένα μοντέλο AI που χρησιμοποιεί “οπτική κατανόηση και λογικές δυνατότητες” για την ανάλυση αιτημάτων χρηστών και την εκτέλεση εργασιών, όπως η συμπλήρωση και υποβολή φορμών. Το μοντέλο αυτό μπορεί να χρησιμοποιηθεί για δοκιμές διεπαφής χρήστη ή για πλοήγηση σε περιβάλλοντα χωρίς διαθέσιμο API ή άλλη άμεση σύνδεση.

Άλλες εκδόσεις αυτού του μοντέλου έχουν χρησιμοποιηθεί για χαρακτηριστικά πρακτόρων στο AI Mode και στο Project Mariner, ένα ερευνητικό πρωτότυπο που χρησιμοποιεί AI πράκτορες για την εκτέλεση εργασιών σε έναν περιηγητή, όπως η προσθήκη αντικειμένων στο καλάθι, βάσει μιας λίστας συστατικών.

Η ανταγωνιστική σκηνή της AI

Η ανακοίνωση της Google έρχεται μόλις μία ημέρα μετά την αποκάλυψη νέων εφαρμογών για το ChatGPT από την OpenAI, στο ετήσιο Dev Day της. Η Google συνεχίζει να εστιάζει στην ChatGPT Agent λειτουργία, που μπορεί να ολοκληρώσει σύνθετες εργασίες εκ μέρους σας. Εν τω μεταξύ, η Anthropic είχε ήδη κυκλοφορήσει μια έκδοση του μοντέλου Claude AI με “χρήση υπολογιστή” από πέρυσι.

Advertisement. Scroll to continue reading.

Η Google αναφέρει ότι το μοντέλο χρήσης υπολογιστή “ξεπερνάει τις κορυφαίες εναλλακτικές λύσεις σε πολλαπλά web και mobile benchmarks”. Σε αντίθεση με το ChatGPT Agent και το εργαλείο χρήσης υπολογιστή της Anthropic, το νέο μοντέλο AI της Google έχει πρόσβαση μόνο σε έναν περιηγητή — όχι σε ολόκληρο το περιβάλλον του υπολογιστή. Η Google σημειώνει ότι “δεν είναι ακόμη βελτιστοποιημένο για έλεγχο σε επίπεδο λειτουργικού συστήματος desktop” και υποστηρίζει προς το παρόν 13 ενέργειες, όπως το άνοιγμα ενός περιηγητή, η πληκτρολόγηση κειμένου, καθώς και η μεταφορά και απόθεση στοιχείων.

Διαβάστε επίσης:  Η NVIDIA κοιτάζει στο διάστημα για μελλοντικά AI datacenters με πέντε συνεργάτες

Το Gemini 2.5 Computer Use είναι διαθέσιμο στους προγραμματιστές μέσω του Google AI Studio και του Vertex AI, αλλά υπάρχει επίσης μια επίδειξη στο Browserbase, όπου μπορείτε να δείτε το μοντέλο να ολοκληρώνει εργασίες, όπως “Παίξε ένα παιχνίδι του 2048” ή “Περιηγήσου στο Hacker News για τάσεις στις συζητήσεις”.

Advertisement. Scroll to continue reading.

Loop

ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Ταινίες

Ο Jean-Claude Van Damme αναλαμβάνει τον πρωταγωνιστικό ρόλο στο Raid Pacific, ένα νέο θρίλερ δράσης με φόντο τον Β’ Παγκόσμιο Πόλεμο, βασισμένο σε πραγματικά...

Ταινίες

Ο σκηνοθέτης του The Punisher: One Last Kill, Reinaldo Marcus Green, δήλωσε ότι θα ήθελε να επιστρέψει στη Marvel για μια live-action ταινία με...

Gaming

Το Minecraft Java Edition αποκτά επιτέλους ενσωματωμένο Friends List και peer-to-peer multiplayer, επιτρέποντας στους παίκτες να συνδέονται απευθείας στους κόσμους των φίλων τους χωρίς...

Ταινίες

Το Η Μαγική Αλλαγή (Swapped) ανέβηκε στην κορυφή του παγκόσμιου Top 10 του Netflix, ρίχνοντας από την πρώτη θέση το θρίλερ δράσης Apex με...

Gaming

Το Video Games Museum συμμετέχει στη Διεθνή Ημέρα Μουσείων 2026 με τη δράση Press Start Together, μια ειδική εμπειρία αφιερωμένη στον τρόπο με τον...

Gaming

Μια χαμένη εκδοχή του Uncharted 4: A Thief’s End, πάνω στην οποία εργαζόταν η Amy Hennig πριν την αποχώρησή της από τη Naughty Dog...

Τεχνολογία

Το Estadio Azteca στην Πόλη του Μεξικού, το οποίο πρόκειται να φιλοξενήσει τον εναρκτήριο αγώνα του Μουντιάλ 2026, αντιμετωπίζει σοβαρά προβλήματα στατικότητας καθώς το...

Σειρές

Το Δια Πυρός και Σιδήρου (Man on Fire) συνεχίζει να κυριαρχεί στο παγκόσμιο Top 10 του Netflix, φτάνοντας τις 23,6 εκατομμύρια προβολές μέσα στις...

ΔΙΑΦΗΜΙΣΗ