Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών
Date
2006Author
Μπουντούρη, Λίνα
Γεργατσούλης, Μανώλης
Gergatsoulis, Manolis
Bountouri, Lina
Metadata
Show full item recordAbstract
Η δημιουργία και η ταχεία εξέλιξη του Διαδικτύου οδήγησε στη διάθεση ποικίλλων δεδομένων και στην παροχή πρόσβασης σε μεγάλο αριθμό χρηστών. Ανάλογη με την εξέλιξη του Διαδικτύου είναι και η αύξηση του περιεχομένου που διατίθεται δικτυακά, το οποίο είναι συχνά ετερογενές, κυρίως επειδή προορίζεται για να καλύψει είτε ευρείες ανάγκες πλήθους χρηστών είτε εξειδικευμένες ανάγκες κοινοτήτων χρηστών. Σε κάθε περίπτωση, ο στόχος της αποτελεσματικής αναζήτησης και ανάκτησης δεδομένων που προέρχονται από ετερογενείς πηγές είναι δύσκολο να επιτευχθεί. Με γνώμονα την επίτευξη του παραπάνω στόχου, το επιστημονικό πεδίο της Ολοκλήρωσης Δεδομένων (Data Integration) μελετά τη δημιουργία συστημάτων τα οποία παρέχουν δυνατότητες αναζήτησης και ανάκτησης από συλλογές αυτόνομων και ετερογενών πηγών δεδομένων σαν αυτές να αποτελούν ένα ενιαίο σύνολο. Με άλλα λόγια, μέσα από ένα σύστημα ολοκλήρωσης δεδομένων δίνεται η δυνατότητα στο χρήστη με ένα μόνο ερώτημα να ανακτήσει αποτελέσματα από διαφορετικές πηγές. Τα τελευταία χρόνια, στα πλαίσια της δημιουργίας του Σημασιολογικού Ιστού (Semantic Web) και της ανάπτυξης συστημάτων ολοκλήρωσης δεδομένων, έχει δοθεί ιδιαίτερη έμφαση στην αντιμετώπιση θεμάτων Σημασιολογικής (ή Εννοιολογικής) Ολοκλήρωσης των δεδομένων (Semantic Integration). Η σημασιολογική ολοκλήρωση δεδομένων καλείται να αντιμετωπίσει προβλήματα σημασιολογικής ετερογένειας (semantic heterogeneity) τα οποία προκύπτουν από τη χρήση διαφορετικών όρων για την αποτύπωση της ίδιας έννοιας τόσο σε επίπεδο σχημάτων κωδικοποίησης δεδομένων (schema level) όσο και στο επίπεδο των ίδιων των δεδομένων (data level). Για την επίτευξη της σημασιολογικής ολοκλήρωσης, σημαντικός θεωρείται ο ρόλος των τεχνολογιών του σημασιολογικού ιστού, όπως είναι οι Οντολογίες. Οι οντολογίες εκφράζουν αναλυτικούς προσδιορισμούς εννοιών και μπορούν, κατά συνέπεια, να λειτουργήσουν ως φορέας διαλειτουργικότητας της πληροφορίας ανάμεσα σε διάφορα πληροφοριακά συστήματα. Η παρούσα εργασία περιλαμβάνει μία επισκόπηση του προβλήματος της σημασιολογικής ολοκλήρωσης δεδομένων δίνοντας έμφαση στις τεχνικές ολοκλήρωσης δεδομένων με χρήση οντολογιών. Στη συνέχεια, η εργασία παρουσιάζει ανοικτά ερευνητικά προβλήματα του συγκεκριμένου επιστημονικού πεδίου και προσεγγίσεις της ερευνητικής μας ομάδας για την επίλυσή τους.