Διαλειτουργικότητα σχημάτων μεταδεδομένων: μία προσέγγιση με τη χρήση της οντολογίας CIDOC CRM
Abstract
Η παρούσα διδακτορική διατριβή ασχολείται με τη μελέτη και ανάπτυξη τεχνικών δια- λειτουργικότητας σχημάτων μεταδεδομένων, η οποία αποτελεί ένα ενεργό ερευνητικό πρό¬βλημα στο χώρο της διαχείρισης της πληροφορίας. Στο πλαίσιο της διατριβής δίνεται έμφαση στην ανάπτυξη τεχνικών διαλειτουργικότητας ανάμεσα σε πληροφοριακές πηγές που προέρχονται από συγκεκριμένους θεματικούς τομείς, στην εν λόγω περίπτωση, από τον τομέα των Ιδρυμάτων Πολιτιστικής Κληρονομιάς (αρχείων, βιβλιοθηκών, μουσείων, κέντρων τεκμηρίωσης, μορφωτικών ιδρυμάτων κτλ.).
Στο συγκεκριμένο θεματικό τομέα παρατηρείται χρήση ποικίλων σχημάτων μεταδεδο¬μένων σε εθνικό και διεθνές επίπεδο, ακόμα και σε περιπτώσεις τεκμηρίωσης πληροφορια¬κών πηγών με κοινά χαρακτηριστικά. Τα Ιδρύματα Πολιτιστικής Κληρονομιάς διαθέτουν υλικό ποικίλου τύπου και υποστρώματος, όπως χειρόγραφα, έντυπη και ηλεκτρονική μου¬σική, χαρτογραφικό υλικό, περιοδικά δημοσιεύματα, βιβλία, αρχεία, συλλογές, ηλεκτρονικά τεκμήρια κτλ. Προκειμένου να καλυφθούν οι ανάγκες τεκμηρίωσης αυτών των τύπων υλι¬κού εφαρμόζονται διάφορα XML σχήματα μεταδεδομένων, όπως είναι το Encoded Archival Description (EAD), το Metadata Object Description Schema (MODS), το Dublin Core (DC) και τα διάφορα Προφίλ Εφαρμογής του, τα MARC κτλ. Η ανάγκη ενιαίας διαχεί¬ρισης αυτών των σχημάτων μεταδεδομένων στα πλαίσια των Ψηφιακών Βιβλιοθηκών, των Ψηφιακών Αποθετηρίων και των Συλλογικών Καταλόγων ανάγει την επίτευξη της διαλει- τουργικότητας σε βασικό ζήτημα.
Βασική ερευνητική συνεισφορά της διατριβής αποτελεί ο ορισμός αρχιτεκτονικής ολο¬κλήρωσης των σχημάτων μεταδεδομένων με τη χρήση της οντολογίας CIDOC Conceptual Reference Model (CIDOC CRM). Στο πλαίσιο της αρχιτεκτονικής αυτής η οντολογία CIDOC CRM, η οποία είναι μία οντολογία πυρήνα για την εννοιολογική αναπαράσταση της πολιτισμικής πληροφορίας, αποτελεί βασικό συστατικό μέρος και καλείται να παίξει διάφορους ρόλους ανάλογα με το σενάριο ολοκλήρωσης στο οποίο μετέχει. Εκτός της CIDOC CRM, επιπλέον συστατικά μέρη της εν λόγω αρχιτεκτονικής αποτελούν οι προς ολοκλήρωση τοπικές πηγές XML δεδομένων που προέρχονται από τα Ιδρύματα Πολιτιστι¬κής Κληρονομιάς (και είναι συχνά κωδικοποιημένες με διαφορετικά XML σχήματα μετα¬δεδομένων), καθώς και οι σημασιολογικές απεικονίσεις ανάμεσα στην οντολογία και τις τοπικές XML πηγές και ανάμεσα στις ίδιες τις τοπικές XML πηγές.
Για την έκφραση των σημασιολογικών απεικονίσεων ανάμεσα στα XML σχήματα μετα-δεδομένων και την οντολογία CIDOC CRM προτείνεται η Γλώσσα Περιγραφής Απεικονί¬σεων (ΓΠΑ), η οποία ορίζει τυποποιημένους κανόνες. Οι συγκεκριμένοι κανόνες έχουν τη μορφή μονοπατιών, εφόσον τόσο τα σχήματα μεταδεδομένων όσο και η οντολογία εκφράζο¬νται μέσα από μονοπάτια. Συγκεκριμένα, τα σχήματα μεταδεδομένων εκφράζονται μέσα από αλληλουχίες XML κόμβων και τα μέρη της οντολογίας μέσα από δυαδικές σχέσεις ανάμεσα σε κλάσεις, οι οποίες εμφανίζονται με τη μορφή “κλάση - ιδιότητα - κλάση” ή αλληλουχίες αυτών. Αξιοποιώντας τη ΓΠΑ, ορίζονται οι σημασιολογικές απεικονίσεις ανά¬μεσα στο EAD και τη CIDOC CRM. Οι συγκεκριμένες απεικονίσεις περιλαμβάνουν εκτός των απεικονίσεων των πεδίων του σχήματος μεταδεδομένων σε μονοπάτια της οντολογίας, την πλήρη σημασιολογική απεικόνιση των εννοιών του αρχείου και της αρχειακής περιγρα¬φής στη CIDOC CRM και την έκφραση των πολύπλοκων μεταξύ τους σχέσεων μέσα από τυποποιημένους κανόνες. Παράλληλα, ορίζεται η απεικόνιση προς τη CIDOC CRM της πολύπλοκης ιεραρχικής δομής της αρχειακής περιγραφής και της κληρονομικότητας της περιγραφής που τη διέπει, καθώς αποτελούν βασικά χαρακτηριστικά της αρχειακής περι¬γραφής, αξιοποιώντας κανόνες εκφρασμένους μέσα από τη γλώσσα Semantic Web Rule Language (SWRL).
Επιπλέον, οι κανόνες που ορίζονται μέσα από τη ΓΠΑ…