Connect with us

Τι ψάχνεις;

Τεχνολογία

Η Wikimedia δημιουργεί AI-friendly βάση δεδομένων για ευκολότερη πρόσβαση στο Wikidata

Μετατροπή 19 εκατομμυρίων καταχωρήσεων σε διανυσματική μορφή

Το Wikidata, η βάση δεδομένων που ανήκει στο Ίδρυμα Wikimedia, αποκτά πλέον νέα μορφή φιλική προς την τεχνητή νοημοσύνη. Η πρωτοβουλία προέρχεται από το Wikipedia Embedding Project του γερμανικού παραρτήματος Wikimedia Deutschland, το οποίο δούλεψε για έναν χρόνο στη μετατροπή των 19 εκατομμυρίων καταχωρήσεων του Wikidata από δύσχρηστα δομημένα δεδομένα σε διανύσματα που αποτυπώνουν πλαίσιο και νόημα.

Σε αυτή τη νέα μορφή, οι πληροφορίες λειτουργούν σαν γράφημα με σημεία και γραμμές: για παράδειγμα, ο Douglas Adams θα συνδέεται με τον όρο «άνθρωπος», αλλά και με τους τίτλους των βιβλίων του. Όπως τόνισε η Lydia Pintscher, υπεύθυνη χαρτοφυλακίου του Wikidata, στόχος είναι η καλύτερη πρόσβαση στο περιεχόμενο, χωρίς να αλλάξει η εμπειρία των χρηστών στην καθημερινή χρήση της Wikipedia. Το έργο απευθύνεται κυρίως σε προγραμματιστές AI που θέλουν να αξιοποιήσουν τα δεδομένα για τη δημιουργία chatbots και άλλων εφαρμογών.

Στήριξη σε μικρότερους developers και νέες δυνατότητες για την AI

Η Pintscher εξήγησε ότι μεγάλες εταιρείες όπως η OpenAI και η Anthropic έχουν ήδη τους πόρους για να μετατρέπουν δεδομένα σε διανύσματα, αλλά το νέο project στοχεύει να δώσει πρόσβαση και σε μικρότερους παίκτες. «Πραγματικά, για μένα έχει σημασία να τους δώσουμε ένα πλεονέκτημα, ώστε να έχουν τουλάχιστον μια ευκαιρία», ανέφερε. Ως παράδειγμα αξιοποίησης του Wikidata, η ίδια αναφέρθηκε στο Govdirectory, μια πλατφόρμα που βοηθά τους πολίτες να βρίσκουν τα social media και τα emails δημοσίων αξιωματούχων σε όλο τον κόσμο.

Διαβάστε επίσης:  Η Dell παραδέχεται ότι οι αγοραστές δεν επιλέγουν υπολογιστές με βάση AI χαρακτηριστικά

Η νέα διανυσματική μορφή επιτρέπει σε AI συστήματα να έχουν καλύτερη κατανόηση του πλαισίου γύρω από μια πληροφορία, αντί να στηρίζονται αποκλειστικά σε συχνότητα λέξεων ή γενικό περιεχόμενο. Ο Philippe Saadé, project manager για το AI στο Wikidata, εξήγησε ότι το αποτέλεσμα λειτουργεί σαν μια «γενική ιδέα» του εκάστοτε αντικειμένου, ακόμα και αν υπάρξουν μικρές αλλαγές στις καταχωρήσεις.

Για την υλοποίηση, η ομάδα χρησιμοποίησε μοντέλο της εταιρείας Jina AI, ενώ η αποθήκευση της βάσης δεδομένων γίνεται δωρεάν μέσω της DataStax, που ανήκει στην IBM. Τα δεδομένα που έχουν μετατραπεί σε διανύσματα καλύπτουν το Wikidata μέχρι τις 18 Σεπτεμβρίου 2024, με τους υπεύθυνους να περιμένουν τώρα ανατροφοδότηση από προγραμματιστές πριν προχωρήσουν σε νέα ενημέρωση.

Advertisement. Scroll to continue reading.

ΔΙΑΦΗΜΙΣΗ
ΑΚΟΛΟΎΘΗΣΈ ΜΑΣ
ΔΙΑΦΗΜΙΣΗ

ΔΗΜΟΦΙΛΗ ΤΩΡΑ

Σειρες

Το πρώτο trailer του One Piece: Into the Grand Line, της δεύτερης σεζόν της live-action μεταφοράς του Netflix, παρουσιάζει εντυπωσιακές νέες σκηνές και μας...

Gaming

Μια ιδιότυπη παράδοση της Valve φαίνεται πως επιβεβαιώνεται, καθώς μόνο οι πιο επιτυχημένοι δημιουργοί στο Steam λαμβάνουν στο τέλος της χρονιάς ένα πολυτελές κουτί...

Σειρες

Η πλατφόρμα του Netflix ανακοίνωσε επίσημα ότι η σειρά The Witcher θα ολοκληρωθεί οριστικά το 2026 με την προβολή της πέμπτης σεζόν. Μετά την...

Σειρες

Ένα νέο ντοκιμαντέρ για τα γυρίσματα της πέμπτης σεζόν του Stranger Things έφερε ξανά στο προσκήνιο τη δυσαρέσκεια μέρους του κοινού, αποκαλύπτοντας ότι το...

Ταινίες

Η Paramount κατέθεσε αγωγή εναντίον της Warner Bros. Discovery (WBD), διεκδικώντας την αποκάλυψη κρίσιμων οικονομικών στοιχείων που αφορούν τη συμφωνία ύψους 83 δισ. δολαρίων...

Gaming

Το επιτυχημένο Palworld της Pocketpair συνεχίζει να επεκτείνεται πέρα από το ψηφιακό του σύμπαν, καθώς ανακοινώθηκε το πρώτο επίσημο trading card game του franchise....

Σειρες

Η νέα σειρά του HBO, A Knight of the Seven Kingdoms: The Hedge Knight, φαίνεται πως ίσως βαδίσει σε μονοπάτια παρόμοια με εκείνα που...

Gaming

Νέες πληροφορίες για το Grand Theft Auto 6 ήρθαν στο φως της δημοσιότητας μέσω επίσημων εγγράφων από τη δικαστική διαμάχη της Rockstar Games. Τα...

Gaming

Στο πλαίσιο του Steam Detective Fest, το noir detective simulator του ελληνικού στούντιο Lost Cabinet Games απέκτησε το πρώτο του δημόσιο playable demo, καλώντας...

Ταινίες

Η τρίτη ταινία του Black Panther φαίνεται πως μπαίνει δυναμικά σε τροχιά παραγωγής, καθώς νέα καταχώριση της Film and Television Industry Alliance αποκάλυψε τόσο...

Gaming

Ο εμβληματικός δημιουργός Hideo Kojima μοιράστηκε πρόσφατα μία από τις πιο σουρεαλιστικές και ανησυχητικές σημειώσεις από το προσωπικό του «ημερολόγιο ονείρων». Ο θρυλικός game...

Ταινίες

Η Marvel Studios δημοσίευσε τέσσερα διαδοχικά βίντεο για το Avengers: Doomsday, τα οποία προβλήθηκαν αρχικά πριν από το Avatar: Fire and Ash και στη...

ΔΙΑΦΗΜΙΣΗ