érdekes kérdés.
szófeltörő és statisztikus vagyok, szóval azt hiszem, meg tudom válaszolni. A teljes LOTR szöveget desztilláltam a PDF kiadásomból, megszüntettem a nyilvánvaló szemetet a digitális szövegből (oldalszámok, fejlécek és láblécek, becsomagolt vonalak és szavak stb.), és szöveges elemzéssel kezeltem professzionális szoftver. Vigyázat: Tolkien előszavát bevettem az elemzésbe, de a függelékeket nem, mivel a PDF kiadásomból hiányoznak.
a LOTR szöveg 482 058 előfordulással rendelkezik, 12 972 különálló lemmával. A fogalom világosabbá tétele érdekében: egy szövegben minden szó többször is használható, természetesen: a LOTR-ben a lemma és 19 987 alkalommal használják; ez 19 987 előfordulást és 1 lemmát jelent.
a LOTR-ban Tolkien 4470 hapaxot használ (a hapax, egy görög szó jelentése egyszer, csak egyszer, egy szövegben csak egyszer használt szó): ez azt jelenti, hogy a háromból egy szót (pontosabban 34,51%) csak egyszer használnak a könyvben; ez valóban hatalmas mennyiségű hapax, egy ilyen hatalmas szöveghez: Tolkien nagy lexikai mesterségének jele (néhány hapax természetesen csak egy szó, amelyet egy tünde, törpe vagy ork szavak: ez nem Tolkien nagy lexikai mesterségének jele?).
melyek a leggyakrabban használt szavak, kivéve a kötőszókat, elöljárókat, modális és időbeli határozószókat, névelőket és névmásokat? A lista nem különösebben meglepő:
- frodo1991
- hosszú1351
- sam1290
- nagy1283
- down1203
- like1146
- gandalf1123
- gondolkodj1107
- man1106
- hát1007
- tudj938
- nap841
- fall827
- idő825
- dark818
- way800
- find790
- eye790
- pass783
- hand780
- leave760
- stand757
- hear756
- well749
- aragorn722
- pippin685
- fény683
- lie679
- turn667
- thing665
- speak642
- ring639
- tree637
- út628
- merry603
tetszik az a tény, hogy a listában szereplő három lényeg, amely konkrét dolgokra mutat, a gyűrű (nyilvánvalóan), a fa és az út. Fa! Milyen szép ez? A fa az egyik leggyakrabban használt szó a LOTR-ban, és a három legfontosabb név egyike! Mivel magam is fa szerelmese vagyok, nagyon élvezem ezt az eredményt.
természetesen sok szó (igék, elöljárók és szubsztanciák) van a mozgásról (a LOTR végül is egy utazásról szóló könyv), sok ige az emberi kommunikációról, és néhány szó a világ érzékelésén keresztül történő észlelésének folyamatáról: szem, sötét, világos, hallani.
módszertani megjegyzés a hazugságról: az elemzéshez használt szoftver lemmatizálási folyamatot hajt végre (az elemzés előtt minden szót a szótárává alakítanak Lemma: többes számú főnevek egyes számra, konjugált igék pedig infinitív formára: ez azért van, hogy csökkentse az adatmátrixot, és hogy az eredmények kevésbé szétszóródjanak és értelmesebbek legyenek). De a szoftver nem képes szemantikai elemzést végezni, így nem tudja megmondani, hogy a jelenlegi forma feküdt-e, feküdt-e, a múlt tökéletes formája feküdt-e, hazudni. El kellett volna végeznem egy pontosítást, de úgy gondolom, hogy ez nagymértékben túllépte volna ennek a válasznak a célját: különben is, a szoftver lemmatizálta a lie alatt a további eseményeket: 373 lay, 110 lie, 89 lies, 84 laying, 22 lain and just 1 lied. Azt mondhatjuk, hogy a hazugság olyan folyamat,amely nem ismeretlen a LOTR narratív fejlődésének.
nagyon érdekes lenne elemezni a hapaxot is: például (csak egy kanállal üríteni a tengert) van egy adószó, amelyet átvitt értelemben használnak:
‘hazudsz-mondta Wormtongue. És ezt a kardot a mestered adta nekem.’
‘és most újra megköveteli tőletek’ – mondta TH. Ez nem tetszik neked?’
‘biztosan nem. uram-mondta Wormtongue. Törődöm veled és a tiéddel, ahogy csak tudok. De ne fáraszd magad, vagy túl erősen adóztatd az erődet. Hagyja, hogy mások foglalkozzanak ezekkel a bosszantó vendégekkel.
és csak egy fattyú szó van, amely az Ungoliant utódaira utal:
messze és messze a kisebb fiasításai, a nyomorult társak fattyai, saját utódai, akiket megölt, elterjedtek glenről glenre, az Ephel D-Donchath-tól a keleti hegyekig, Dol Guldurig és Mirkwood gyorsaságáig. De senki sem vetekedhetett vele, Shelob, a nagy, az Ungoliant utolsó gyermeke, aki bajba sodorta a boldogtalan világot.
sok olyan melléknév van, amelyek un -, úgy gondolom, hogy Tolkiennek teljesen szeretnie kellett volna őket (akárcsak én, mint nem őshonos, vagy unnative, vagy unnate, angolul beszélő és olvasó): hálátlan, halhatatlan, feltáratlan, indokolatlan, eseménytelen, földöntúli, unheed, unhopped, és így tovább.
megpróbáltam egy klaszter elemzést is végrehajtani. Szöveges elemzésben a fürtözési folyamat olyan térképeket állít elő, amelyek jelzik, hogy mely szavakat használják szigorú közelségben, mely más szavakkal: a térkép lehetővé teszi egyes lexikális affinitással rendelkező tartalmi területek individualizálását; ennek közvetlen következményeként ez az elemzés lehetővé teszi a tudós számára, hogy kiszúrja az elemzett szövegben jelen lévő fő témákat.
a LOTR szöveg klaszterelemzéséből könnyen kiszúrhat négy fő osztályt; két osztály (amelyek a térkép felső részén találhatók) viszont két alosztályra oszlik.
- a vörös osztály Frodó és Samu Mordorba vezető útjára utal. Mint látható, ez a halmaz tele van rövid,” repedt ” szavakkal, amelyek a pár kétségbeesett erkölcsi és fizikai erőfeszítéseit érintik, a végzet hegye felé haladva, és a vulkanikus pusztaság elhagyatott táján. Sok testrész, sok fájdalmat kifejező ige, sok onomatopoeia (kéz, sziszegés, fej, pillanat, Gollum, húzás, zihál, nyak, lépés, hát, láb, kiáltás, Shagrat, grind, ork, förtelmes, kar, sírás, térd, markolat, hang, lélegzet, szem, tapogatózás, penge, küzdelem, kiabálás, ostor, nyakkendő, bűz, csúszás).
- a halványzöld és akvamarin Osztály az ösztöndíjas utazásokra utal. Különösen a zöld alosztály utal a “megfelelő” utazásra, és tele van mozgással foglalkozó lemmákkal, és fáradtsággal és nehéz túrázással (lejtő, domb, út, mászás, patak, lefelé, mérföld, fa, oldal, hegy, ösvény, bank, meredek, völgy, felhő, emelkedés, gerinc, szél, keskeny, szikla…). Másrészt az akvamarin alosztály a “mágikus közjátékokkal” foglalkozik, amelyek az utazást spanglálják: különösen az öreg erdő, A L ‘ Argentrien és a szürke Havenek. Ez az alosztály tele van olyan lemmákkal, amelyek a színekre és a természetre utalnak, és a szépség, a tisztaság és a frissesség (ezüst, levél, Fehér, zöld, csillag, ragyog, énekel, virág, haj, Goldberry, arany, víz, nap, édes, fa , fény, sárga, tiszta, hajó, fényes, szökőkút, medence, vitorla, szürke, tenger, hab, dal, nyár, arany, szél, ékszer, Harmat, eső, kék, gyertya, meleg, karcsú, csillogó).
- a szürke osztály a megyére és Bree-re utal, és tele van hangulatos, otthonos, praktikus, mindennapi szavakkal és az emberi kommunikációról szóló szavakkal: A hobbitok végül is nagyon beszédes emberek. Ez a “kiindulási helyzet, olyan nyugodt és unalmas” szókincse, amelyet minden kalandmesében észrevehet. Ennek ellenére ez az osztály tartalmaz néhány kis kúszó szót, előre látva az eljövendő dolgok alakját (Strider, jó, Bree, gondolkodj, beszélj, feltételezd, tudd, történet, étel , Uram, aggodalom, harapás, félelem, üzlet, komp, kérdezz, mondd, üzlet, igazi, fickó, nevetés, idő, furcsa, földesúr, fogadó, kaland , hírek, ügy).
- a kék és lila Osztály az emberek Szauron elleni háborújára utal. Különösen a kék osztály utal a gyűrű gonosz befolyására, áldozataival és ellenségeivel (Szauron, Boromir, hatalom, ellenség, gonosz, Isildur, gyűrű, Szarumán, Elrond, bölcs, Minas Tirith, Moria, veszedelem, elpusztít, elpusztít, lore, cél, Mordor, szolga, kétség, félelem, átok, bölcsesség, hordozó, sors). A Lila Osztály utal, hogy a tényleges háborús cselekmények, az nagyon csaták Rohan, valamint a Gondor (Uram Király, – Éomer, Théoden, Éowyn, fuvart, embert, Denethor, fiam, város, Gondor, ház, Faramir, Beregond, gyógyítani, csata, Rohan, Steward, Mark, Imrahil, kapitány, Aragorn, háború, herceg, lovag úr, igazgató úr, ló, szerelmem , húgom, edorast fenyegeti, gyógyító, szolgáltató, becsület , ajánlat, nő, sietve).
olyan hosszú, hogy hány szó van a LOTR könyvekben. Remélhetőleg a válaszom némi érdeklődést mutat Tolkien rajongói és talán tudósok számára. Ha valakinek van olyan kíváncsisága, amely nem kapcsolódik közvetlenül a válaszhoz, az elemzés eredményeiről, vagy a módszertanokról, nyugodtan DM me.