Πιο έξυπνη και ακριβής δημιουργία εικόνων
Η Google ανακοίνωσε το Gemini 2.5 Flash Image, μια σημαντική αναβάθμιση του AI μοντέλου εικόνας της. Το νέο εργαλείο επιτρέπει τη δημιουργία εικόνων με φυσικές γλωσσικές εντολές, τη συγχώνευση φωτογραφιών και πιο ακριβείς επεξεργασίες χωρίς παραμορφώσεις.
Χρησιμοποιεί τη «γνώση του κόσμου» του Gemini ώστε να κατανοεί καλύτερα το περιεχόμενο που παράγει.
Η αναβάθμιση στοχεύει να καλύψει το χάσμα με την OpenAI, η οποία προηγείται στον χώρο της AI εικόνας με το GPT-4o. Η Google διαθέτει αυτή τη στιγμή 450 εκατομμύρια μηνιαίους χρήστες, σε σύγκριση με τους 700 εκατομμύρια εβδομαδιαίους του ChatGPT, σύμφωνα με τον Sundar Pichai.
Από το «Nano-Banana» στο επίσημο εργαλείο
Το Gemini 2.5 Flash Image εμφανίστηκε αρχικά ανώνυμα στην πλατφόρμα αξιολόγησης LMArena με το ψευδώνυμο «nano-banana», προκαλώντας ενδιαφέρον με τις δυνατότητές του. Σήμερα η Google αποκάλυψε ότι επρόκειτο για το νέο της μοντέλο. Ένα παράδειγμα που κυκλοφόρησε στο X έδειξε το εργαλείο να αλλάζει με ακρίβεια το πουκάμισο του Sam Altman σε φωτογραφία.
Η εταιρεία αναφέρει ότι το μοντέλο λύνει ένα από τα μεγαλύτερα προβλήματα των AI image generators: τη συνέπεια αντικειμένων και χαρακτήρων σε πολλαπλές εικόνες. Οι χρήστες μπορούν πλέον να τοποθετούν τον ίδιο χαρακτήρα σε διαφορετικά περιβάλλοντα, να δημιουργούν brand assets ή να προβάλλουν ένα προϊόν από διαφορετικές γωνίες.
Το Gemini 2.5 Flash Image διατίθεται μέσω της εφαρμογής Gemini αλλά και για developers στο Gemini API, το Google AI Studio και το Vertex AI. Η Google έχει ήδη δημιουργήσει πρότυπες εφαρμογές για δοκιμή, ενώ οι πρώτες χρήσεις περιλαμβάνουν real estate κάρτες, εταιρικά badges και προϊόντικά mockups.
Ακολουθήστε το XplayGR στο Google News για να μαθαίνετε πρώτοι όλες τις εξελίξεις από τον χώρο του gaming και της ψυχαγωγίας.
Δείτε όλες τις τελευταίες ειδήσεις στο XplayGR.com.