Μια καινοτόμα πλατφόρμα τεχνητής νοημοσύνης έχει αναπτυχθεί από την ομάδα Ψηφιακής Επεξεργασίας Εγγράφων του Εργαστηρίου Υπολογιστικής Ευφυίας του Εθνικού Κέντρου Έρευνας Φυσικών Επιστημών «Δημόκριτος», που στοχεύει στην ψηφιακή απεικόνιση και διαχείριση κειμένων ιστορικών ελληνικών βιβλίων, γραμμένων σε πολυτονικό σύστημα. Η πλατφόρμα παρουσιάζεται στο Athens Science Festival και έχει αναπτυχθεί στο πλαίσιο του έργου “reBook”, σε συνεργασία με τον Σύλλογο Προς Διάδοσην Ωφελίμων Βιβλίων (ΣΩΒ) και την εταιρεία Innews, στο πλαίσιο του ΕΣΠΑ 2014-2020.
Η πλατφόρμα, η οποία λειτουργεί με τη χρήση τεχνητής νοημοσύνης, επιτρέπει στους ερευνητές να ψηφιοποιούν και να επανεκδίδουν ψηφιακά περίπου 100 βιβλία από τα αρχεία του ΣΩΒ, τα οποία χρονολογούνται από τις αρχές του 20ου αιώνα και μετά. Η εφαρμογή ανεβάζει εικόνες σκαναρισμένων βιβλίων και, χάρη στην τεχνητή νοημοσύνη, αναγνωρίζει το κείμενο και το μετατρέπει σε ψηφιακή μορφή, ακόμα και αν είναι γραμμένο στο πολυτονικό σύστημα. Η πλατφόρμα επίσης προβαίνει σε προεπεξεργασία των εικόνων για να διορθώσει προβλήματα όπως στραβό σκανάρισμα και ξεθωριασμένες σελίδες.
Ο στόχος του έργου “reBook” είναι η ανάπτυξη νέων τεχνικών και μεθοδολογιών για την επιστημονική τεκμηρίωση της πολιτιστικής κληρονομιάς. Η δυνατότητα να ψηφιοποιηθούν ιστορικά βιβλία και να γίνουν προσβάσιμα σε ευρύ κοινό και ερευνητές αποτελεί μεγάλο βήμα προς αυτήν την κατεύθυνση. Η υποψήφια διδάκτορας Οικολογίας Τοπίου και επιστημονική συνεργάτιδα του “Δημόκριτου”, Κατερίνα Χριστοπούλου, εξηγεί ότι η πλατφόρμα προσφέρει πολλαπλές δυνατότητες στους αναγνώστες, καθώς μπορούν να χρησιμοποιήσουν και να αναζητήσουν μέσα από τα ψηφιοποιημένα βιβλία.
Αξίζει να σημειωθεί ότι το Εργαστήριο Υπολογιστικής Ευφυΐας του “Δημόκριτου” έχει ασχοληθεί ξανά με την επεξεργασία και αναγνώριση ιστορικών εγγράφων. Σε προηγούμενο έργο που υλοποίησε σε συνεργασία με το Πανεπιστήμιο Κύπρου, είχε προχωρήσει στην ψηφιοποίηση πολυτονικών κειμένων από έργα του Σέξπιρ στα ελληνικά. Επιπλέον, έχει πραγματοποιήσει έργα επεξεργασίας και αναγνώρισης χειρογράφων πρακτικών της Τράπεζας της Ελλάδος, καθώς και χειρογράφων της Μονής του Όρους Σινά.
Η ανάπτυξη τέτοιων τεχνολογιών αποτελεί σημαντική επιτυχία για την επιστημονική κοινότητα και την προώθηση της πολιτιστικής κληρονομιάς μας. Με την ψηφιοποίηση ιστορικών βιβλίων, μπορούμε να διατηρήσουμε την πρόσβαση σε αυτά και να τα μελετήσουμε για πολλά χρόνια ακόμα. Η αξία της πλατφόρμας αναγνώρισης και ψηφιοποίησης βιβλίων είναι ακόμα μεγαλύτερη όταν σκεφτούμε ότι υπάρχουν ακόμα πολλά ιστορικά κείμενα που δεν έχουν γίνει ακόμα ψηφιακά διαθέσιμα. Ο στόχος είναι να φθάσουν στο ευρύ κοινό και τους ερευνητές, για να μελετηθούν και να διατηρηθούν για τις επόμενες γενιές.