Ένα εργαλείο σε Java για την ανάκτηση πληροφοριών και τον εντοπισμό ομοιοτήτων σε ακαδημαϊκές εκδόσεις με τη χρήση τεχνικών εξόρυξης δεδομένων
View/ Open
Date
2012Author
Γαρουφάλλου, Εμμανουήλ
Ρουσίδης, Δημήτρης
Μπαλατσούκας, Παναγιώτης
Garoufallou, Emmanouel
Rousidis, Dimitris
Balatsoukas, Panos
Metadata
Show full item recordAbstract
Μια πληθώρα νέων δεδομένων και πληροφοριών προσθέτονται κάθε μέρα στον
ακαδημαϊκό τομέα. Ο αριθμός των ακαδημαϊκών άρθρων αυξάνεται εκθετικά κάθε
χρόνο καθιστώντας αυτή την τεράστια δεξαμενή γνώσης προβληματική ως προς την
εξερεύνηση και επεξεργασία της. Προτείνεται ένα αυτοματοποιημένο εργαλείο
εξόρυξης δεδομένων γραμμένο σε Java το οποίο βρίσκεται στη φάση της υλοποίησης
και θα εντοπίζει σημασιολογικές ομοιότητες μεταξύ ακαδημαϊκών συγγραμμάτων.
Παρέχοντας στο εργαλείο έναν τίτλο άρθρου Α, θα μπορεί να αναγνωρίζει
αποτελεσματικά άλλους τίτλους άρθρων τα οποία μοιράζονται κοινώς ένα ή
παραπάνω κριτήρια, όπως συγγραφείς, αναφορές, λέξεις κλειδιά, θεματολογία,
εκδότες, ημερομηνίες καθώς και μεθοδολογίες και θεματικές υποενότητες. Το
εργαλείο θα έχει τη δυνατότητα ανακάλυψης κρυμμένων μοτίβων, κανόνων σχέσης
(association rules), κατηγοριοποίησης (classification) και συσταδοποίησης-
ομαδοποίησης (clustering) στις ακαδημαϊκές εκδόσεις καθώς και απεικόνιση όλων
αυτών των πληροφοριών. Προκειμένου να διευκολυνθεί η ανακάλυψη των
μεθοδολογιών, το προτεινόμενο εργαλείο θα είναι σε θέση να δημιουργεί μια βάση
δεδομένων ορολογιών και υπο-ορολογιών κυρίως μέσω της ανάλυσης των
ευρετηρίων ηλεκτρονικών βιβλίων (e-books). Επιπροσθέτως, αυτή η βάση δεδομένων
θα είναι διαθέσιμη διαδικτυακά οπού ουσιαστικά θα δημιουργηθεί ένα αποθετήριο
ορολογιών και υπο-ορολογιών. Ο κύριος σκοπός της δημιουργίας αυτού του
εργαλείου είναι η διευκόλυνση της ακαδημαϊκής μελέτης και έρευνας και η αύξηση
της ικανότητας άντλησης πληροφοριών και συσχετισμών από τα ακαδημαϊκά
περιεχόμενα.