Till: The Blog v.3: Η δύναμη του Ελληνικού Hoax, μέρος τέταρτον...

Τρίτον: Ο Ίβυκος

«Αυτές οι ιδιότητες της Ελληνικής ώθησαν το Πανεπιστήμιο Ιρβάιν της Καλιφόρνια να αναλάβει την αποθησαύριση του πλούτου της. Επικεφαλής του προγράμματος τοποθετήθηκαν η γλωσσολόγος -Ελληνίστρια- Μακ Ντόναλι και οι καθηγητές της ηλεκτρονικής Μπρούνερ και Πάκαρι. Στον Η/Υ «Ίβυκο» αποθησαυρίστηκαν 6 εκατομμύρια λεκτικοί τύποι της γλώσσας μας όταν η Αγγλική έχει συνολικά 490.000 λέξεις και 300.000 τεχνικούς όρους δηλαδή ως γλώσσα είναι μόλις το 1/100 της δικής μας. Στον «Ίβυκο» ταξινομήθηκαν 8.000 συγγράμματα 4.000 αρχαίων Ελλήνων και το έργο συνεχίζεται. Μιλώντας γι' αυτό ο καθηγητής Μπρούνερ είπε: «Σε όποιον απορεί γιατί τόσα εκατομμύρια δολάρια για την αποθησαύριση των λέξεων της Ελληνικής, απαντούμε: Μα πρόκειται για τη γλώσσα των προγόνων μας. Και η επαφή μας μ' αυτούς θα βελτιώσει τον πολιτισμό μας». Οι υπεύθυνοι του προγράμματος υπολογίζουν ότι οι ελληνικοί λεκτικοί τύποι θα φθάσουν στα 90 εκατομμύρια, έναντι 9 εκατομμυρίων της λατινικής»

Για το συγκεκριμένο θέμα, παραθέτω αυτούσιο το κείμενο του Νίκου Σαραντάκου, που μπορεί κανείς να βρει στην διεύθυνση http://www.sarantakos.com/language/ekatom.htm :

«Συχνά-πυκνά, ακούμε να λένε για την ελληνική γλώσσα (την αρχαία, συνήθως) ότι είναι η πλουσιότερη απ' όλες τις γλώσσες του κόσμου -και ως μέτρο του πλούτου αναφέρεται ο αριθμός των λέξεων της γλώσσας μας. Πόσες λέξεις έχει η αρχαία ελληνική; Αν πιστέψουμε διάφορους εθνικιστές ή απλώς τερατολόγους, έχει εκατομμύρια. Έτσι, ο θεωρητικός της χούντας Γ. Γεωργαλάς, στο βιβλίο του "Ινδοευρωπαίοι ή Αιγαίοι;" (εκδ. Τότε, 1996, σελ. 70) γράφει: "To πανεπιστήμιο Irving [διάβαζε: Irvine] της Καλιφόρνιας επιμελήθηκε την κατασκευή του υπολογιστού Ιβυκος όπου περιέχονται 6.000.000 λέξεις και 71.000.000 λεκτικοί τύποι της Ελληνικής. Για σύγκρισι, η Αγγλική έχει 490.000 λέξεις και 300.000 τεχνικούς όρους." Την ίδια χρονιά, σε άρθρο του στον Δαυλό με τον μετριόφρονα τίτλο "Aστρονομική απόδειξη ότι η Ελληνική Γλώσσα εχρησιμοποιείτο πριν 28.000 χρόνια", ("Δαυλός", τ. 176-177, Αυγ.-Σεπτ. 1996, σελ. 10745-10755) ο Κων. Κουτρουβέλης επικαλείται τα ίδια νούμερα για να "αποδείξει" ότι αποκλείεται η πλουσιότατη ελληνική να κατάγεται από την φτωχή ινδοευρωπαϊκή.

Ο μύθος διαδίδεται στα περιοδικά του "ελληνοκεντρικού" χώρου. Έτσι, στο περιοδικό Ελληνική Αγωγή (Ιούν. 2001) διάβασα πρόσφατα για μια διάλεξη της κ. Βάγιας Καραντινίδη, η οποία συστήνεται ως "κλινική ψυχολόγος, παιδοψυχολόγος και διεθνής επιστήμων της αρχαίας ελληνικής φιλοσοφίας" (όχι, παίζουμε!) και η οποία υποστήριξε ότι η ελληνική είναι "η πλουσιότερη γλώσσα του κόσμου με 5.000.000 λέξεις και 70.000.000 λεξικούς τύπους, όπως καταγράφτηκε στο βιβλίο Γκίνες (!) ενώ η αγγλική έχει μόνον 490.000 λέξεις."
Το κακό είναι ότι τα "70 εκατ. λεκτικών τύπων" και τα "6 εκατ. λέξεων" επαναλαμβάνονται όχι μόνο στα έντυπα του εθνικιστικού περιθωρίου αλλά και στα πιο ευυπόληπτα και κοντεύουν να καθιερωθούν ως αλήθεια. Έτσι, ένα άρθρο της κ. Εύας-Χριστίνας Γεωργαλά (αναρωτιέμαι αν είναι συγγενής του χουντοδιανοούμενου) με τον ενδεικτικό τίτλο "Ελληνική - γλώσσα άνευ ορίων" αναδημοσιεύτηκε ευρύτατα (και, δυστυχώς, άκριτα) σε πολλά σοβαρά έντυπα, ας πούμε στην εφημερίδα Μεσόγειο του Ηρακλείου, τη μεγαλύτερη της Κρήτης, στις 25.2.2000.

Το εν λόγω άρθρο περιέχει αρκετά τερατολογήματα περί ελληνικής γλώσσας, που ίσως σχολιάσω σε επόμενο, αλλά για το θέμα μας αναφέρει: "Ετσι, η Ελληνική αποθησαυρίστηκε από το Πανεπιστήμιο Ιρβάιν της Καλιφόρνιας.Δηλαδή αποθησαυρίστηκαν στον ηλεκτρονικό υπολογιστή έξι (αριθμός 6!) εκατομμύρια λέξεις και 78 εκατομμύρια λεκτικοί τύποι της ελληνικής γλώσσας, έναντι μερικών εκατοντάδων χιλιάδων της αγγλικής."

Οι περισσότεροι μύθοι έχουν μέσα τους έναν κόκκο αλήθειας, το ίδιο και ο προκείμενος. Αλλά πρώτα να ξεκαθαρίσουμε τι εννοούμε λέγοντας λέξεις και λεκτικούς τύπους. Λέξεις εν προκειμένω είναι τα λήμματα του λεξικού. Παράδειγμα η λέξη "άνθρωπος". Σε κάθε λέξη αντιστοιχούν ένας ή (συνήθως) περισσότεροι λεκτικοί τύποι. Έτσι, η λέξη άνθρωπος (ένα λήμμα) έχει στην αρχαία γλώσσα κάπου δώδεκα λεκτικούς τύπους (πέντε πτώσεις στον ενικό, πέντε στον πληθυντικό, ο δυικός αριθμός συν κάποιοι εναλλακτικοί τύποι της δοτικής). Αν η λέξη είναι ρήμα έχει εκατοντάδες λεκτικούς τύπους, αν είναι επίρρημα ή άλλη άκλιτη λέξη θα έχει μόνο έναν.

Το πανεπιστήμιο Ιρβάιν (Irvine) της Καλιφόρνιας πράγματι έχει αποθησαυρίσει όλα (σχεδόν) τα κείμενα της αρχαίας ελληνικής (και ορισμένα μεταγενέστερα, έως την Άλωση) και τα διαθέτει στον ψηφιακό δίσκο TLG (Thesaurus Linguae Graecae) -ο Ίβυκος τον οποίο αναφέρει ο Γεωργαλάς είναι παλαιότερη ονομασία του ίδιου προγράμματος. Όλα αυτά τα κείμενα δεν είναι και πάρα πολλά, κάπου 615 megabyte για τους τεχνολογικά ενήμερους, χωράνε δηλαδή ίσα-ίσα σε έναν ψηφιακό δίσκο (CD-ROM). Λέω ότι δεν είναι και πάρα πολλά, όσα έχουν διασωθεί εννοείται, διότι το ετήσιο σώμα μιας σημερινής καθημερινής εφημερίδας περιέχει μεγαλύτερον όγκο κειμένων (πράγμα που αποδεικνύει ότι ουκ εν τω πολλώ το ευ!). Όλα αυτά λοιπόν τα κείμενα έχουν συνολικό αριθμό επαναλαμβανόμενων λέξεων κάπου 78 εκατομμύρια, με τον ίδιο τρόπο που το κειμενάκι που διαβάζετε τώρα έχει συνολικά κάπου 900 λέξεις. Για παράδειγμα, στα κείμενα του TLG, το λήμμα άνθρωπος, υπό τους διάφορους λεκτικούς τύπους του απαντά περίπου 135.000 φορές. Ο αριθμός των επαναλαμβανόμενων λέξεων της αρχαίας γραμματείας (αυτό που στα αγγλικά λέγεται word count) είναι λοιπόν 78 εκατομμύρια. Εδώ ο Γεωργαλάς και οι συν αυτώ κάνουν μια ελαφρώς χοντροκομμένη λαθροχειρία: συνδέουν τον αριθμό "78 εκατομμύρια" με τον αριθμό των λεκτικών τύπων της ελληνικής -και επειδή σε κάθε λέξη-λήμμα αντιστοιχούν κατά μέσο όρο περίπου 12-15 λεκτικοί τύποι, με μια απλή μπακάλικη διαίρεση προκύπτει ότι ο αριθμός λέξεων (λημμάτων) της αρχαίας είναι πέντε-έξι εκατομμύρια, πολύ μεγαλύτερος απ' ό,τι της πτωχής αγγλικής.

Φυσικά, υπάρχει τεράστια διαφορά ανάμεσα σε συνολικό αριθμό εμφανίσεων λέξεων και σε συνολικό αριθμό λημμάτων. Πόσες είναι οι λέξεις/λήμματα της αρχαίας; Αν πάρουμε υπόψη ότι το λεξικό Liddell-Scott περιλαμβάνει στην τελευταία του ηλεκτρονική έκδοση 136.292 λήμματα, θα καταλήξουμε σε περίπου 150.000 λέξεις, πολύ λιγότερες από τις λέξεις της αγγλικής και κατά πάσα πιθανότητα και από τις λέξεις της νέας ελληνικής. (Και είναι βεβαίως άδικο να συγκρίνουμε μια αρχαία γλώσσα, έστω και ικανοποιητικά παραδομένη, όπως η ελληνική, με μια νέα που εμπλουτίζεται διαρκώς από την ακένωτη δεξαμενή των νεολογισμών και των δανείων). Πάντως καμιά σχέση με τα 5 ή τα 78 εκατομμύρια.
Λοιπόν, ο συνολικός αριθμός των λημμάτων της αρχαίας ελληνικής είναι γύρω στις 150.000 (αντί των 5.000.000 της εθνικιστικής ονείρωξης), ενώ οι λεκτικοί τύποι, σύμφωνα με πληροφορία που μου έδωσε ο Νίκος Νικολάου, ερευνητής γλωσσολόγος στο πανεπιστήμιο Irvine, σε 1.200.000 (αντί των 70 εκατομμυρίων του Γεωργαλά και σία). Αλλά είπαμε, ουκ εν τω πολλώ το ευ».

Συμπέρασμα: Η αναφορά εδώ είναι σε ένα σπουδαίο, μεγάλο και πραγματικό πρόγραμμα, το Thesaurus Linguae Graecae, (ούτε τα ονόματα δεν μπόρεσαν να βρουν σωστα: πρόκειται για την Μάριαν ΜακΝτόναλντ και τον Ντέιβιντ Πάκαρντ - τα βασικά στοιχεία του προγράμματος βρίσκονται στην σελίδα http://ptolemy.tlg.uci.edu/TLG_Info.html ). Οι κλασσικοί φιλόλογοι και Ελληνιστές, έχουν ψηφιοποιήσει όλη την Ελληνική γραμματεία από τον Όμηρο μέχρι το 600 μ.Χ. και προχωράνε ακάθεκτοι για το 1453! Αλλά τα σωστά φτάνουν μέχρι εδώ. Οι άνθρωποι δεν τα κάνουν αυτά λόγω της ειδικής φύσης της Ελληνικής γλώσσας (δεν έχουν συνομιλήσει με Βρετανούς επιχειρηματίες προφανώς) αλλά επειδή είναι αυτή η δουλειά τους, δεν κοστίζει πολύ και αγαπάνε την αρχαία Ελλάδα. Όσο για τα περί λέξεων: πρώτα από όλα η ποσότητα των λέξεων από μόνη της δεν θα εξασφάλιζε την ποιότητά της. Επιχειρήματα του τύπου: η δική μου είναι πιο μακριά (σε λεξιλόγιο) από την δική σου, μόνο σε ανθρώπους με συναισθηματικό κόσμο δεκάχρονου αγοριού ευδοκιμούν. Άλλωστε, προσέξτε, αυτό το λένε και οι αγγλόφωνοι για την δική τους γλώσσα (εξίσου αστήρικτα). Περί των αριθμών τώρα: Έχουν συνολικά καταγραφεί από όλα τα κείμενα 78 εκατομμύρια λέξεις συνολικά (όχι διακριτές: όλες οι λέξεις όλων των κειμένων). Άρα οι διακριτές δεν μπορεί να είναι 90 εκατομμύρια. Οι λεκτικές μορφές είναι 1.2 εκατομμύρια... Αυτές περιλαμβάνουν και διαφορετικές πτώσεις μιας λέξης, διαφορετικά πρόσωπα, αριθμούς, επιρρηματοποιήσεις κ.τ.τ. Αξίζει να σημειωθεί ότι οι λέξεις αυτές δεν ήταν πάντοτε διαθέσιμες σε όλους, καθώς περιλαμβάνουν διαφορετικούς διαλεκτικούς τύπους, νεωτερισμούς, δάνειες λέξεις (π.χ. από την Λατινική) κ.ο.κ. καθώς και χρήσεις διαφορετικών εποχών.Ακόμα και οι αριθμοί των λέξεων της Αγγλικής είναι υπερβολικοί - που σημαίνει ότι αυτός που εφηύρε αυτήν την «είδηση» δεν πρέπει να σκάμπαζε πολλά από γλώσσες, ενώ και με την αριθμητική δεν τα πήγαινε και καλά (ακόμα και έτσι να ήταν οι αριθμοί η αναλογία θα ήταν 1 προς 8 περίπου και όχι ένα προς 100...!)Τέλος θα πρέπει να σκεφτεί κανείς ότι διάφορες γλώσσες που δημιουργούν λέξεις δια συγκολλήσεως άλλων, όπως τα φινλανδικά, τα Ουαλικά και τα γερμανικά έχουν δυνητικά άπειρες λέξεις (συνεχίζεται...)

Till: The Blog v.3

Το ψαχτήρι του κακομοίρη...

Σάββατο 11 Σεπτεμβρίου 2004

Η δύναμη του Ελληνικού Hoax, μέρος τέταρτον...

Δεν υπάρχουν σχόλια: