Text Encoding Initiative: επισκόπηση, προβλήματα και εφαρμογές
Abstract
Τα τελευταία χρόνια έχουν γίνει αρκετές προσπάθειες στο επιστημονικό πεδίο της
Πληροφορικής για τις Ανθρωπιστικές σπουδές (Humanities Computing), με σκοπό
τη δημιουργία προτύπων περιγραφής και εργαλείων διαχείρισης των κειμένων
ανθρωπιστικών σπουδών στο Διαδίκτυο. Η δυνατότητα ηλεκτρονικής επεξεργασίας
και έκδοσης κειμένων αποτέλεσε βασική εφαρμογή των εργαλείων της πληροφορικής
στις Ανθρωπιστικές σπουδές και αποτέλεσε σημαντικό παράγοντα για την ανάδειξη, τη
διαχείριση και την επιστημονική επεξεργασία των έργων του γραπτού λόγου.
Για την ηλεκτρονική εμφάνιση και διαχείριση των κειμένων ανθρωπιστικών σπουδών, οι
ερευνητές του κλάδου χρησιμοποίησαν σε μεγάλο βαθμό τις γλώσσες σήμανσης (HTML,
SGML, XML). Η SGML και η XML, λόγω της δομής τους, αποτέλεσαν εξ’ αρχής μια
πιο αποτελεσματική βάση – σε σχέση με την HTML – για τη δημιουργία προτύπων και
μεταδεδομένων που αφορούν τα ηλεκτρονικά κείμενα.
Το συγκεκριμένο άρθρο ασχολείται με το πρότυπο Text Encoding Initiative (TEI), το οποίο
εμφανίστηκε το 1987. Το TEI βασίστηκε αρχικά στην SGML και στη συνέχεια και στην
XML, με στόχο να καθιερωθεί ως ένα διεθνές πρότυπο το οποίο θα χρησιμοποιείται από
βιβλιοθήκες, μουσεία, εκδότες και ακαδημαϊκούς για την παρουσίαση λογοτεχνικών και
γλωσσολογικών κειμένων σε ηλεκτρονική μορφή. Μέσα από τη γενική περιγραφή του
TEI Document Type Definition (TEI DTD) και των συστατικών μερών του, θα εξακριβωθεί
η χρησιμότητά του για τέτοιου είδους υλικό, ενώ θα δοθεί ιδιαίτερη έμφαση στη δομή
και στη χρησιμότητα του TEI Header. Το TEI Header αποτελεί αναπόσπαστο κομμάτι του
TEI DTD, καθώς παρέχει χρήσιμες πληροφορίες τόσο στους χρήστες που αναζητούν και
ανακτούν ηλεκτρονικά κείμενα όσο και στους βιβλιοθηκονόμους ή στους συντάκτες των
κειμένων αυτών. Το TEI αξιοποιείται από φορείς πληροφόρησης του εξωτερικού, κυρίως από βιβλιοθήκες και αρχεία. Το γεγονός αυτό δίνει το έναυσμα για τη συνεχή έρευνα στο πεδίο δημιουργίας
εργαλείων επεξεργασίας, εμφάνισης και αναζήτησης – ανάκτησης των TEI εγγράφων.
Παράλληλα, η υιοθέτησή του σε πραγματικές εφαρμογές κάνει εμφανή τα πλεονεκτήματα
της χρήσης του και συγχρόνως αναδεικνύει τα ανοικτά ερευνητικά ερωτήματα για την
περαιτέρω βελτίωση του. Οι πλευρές αυτές θα εξεταστούν στα πλαίσια του παρόντος
άρθρου.
Συνοψίζοντας, η αναφορά σε παραδείγματα κωδικοποίησης ελληνικών κειμένων
καταδεικνύει τόσο τη χρησιμότητα του TEI για τους Έλληνες ερευνητές των ανθρωπιστικών
σπουδών όσο και το πρόσφορο έδαφος που υπάρχει στην ελληνική πραγματικότητα για
την αξιοποίηση του προτύπου.