Hur många ord finns det i LOTR-böcker? – Quora

intressant fråga.

jag är ett ord cruncher och statistiker, så jag tror att jag kan svara på det. Jag har destillerat full LOTR-text från min PDF-utgåva, jag har eliminerat uppenbart skräp från den digitala texten (sidnummer, sidhuvud och sidfot, inslagna linjer och ord, och så vidare), och jag har behandlat det med en textanalys professionell programvara. Akta dig: Jag har tagit Tolkiens förord i analysen, men inte bilagorna, eftersom min PDF-utgåva saknar dem.

LOTR-texten har 482 058 händelser, med 12 972 distinkta lemmer. För att göra konceptet tydligare: i en text kan varje ord användas mer än en gång, naturligtvis: i LOTR, lemma och används 19 987 gånger; det gör 19 987 händelser och 1 lemma.

i LOTR använder Tolkien 4 470 hapaxes (en hapax, ett grekiskt ord som betyder en gång, endast en gång, är ett ord som bara används en gång i en text): det betyder att ett ord av tre (34,51%, för att vara mer exakt) används bara en gång i boken; detta är verkligen en enorm mängd hapaxes, för en sådan massiv text: ett tecken på Tolkiens stora lexikala mästerskap (vissa hapaxes, naturligtvis, är Elvish, Dwarvish eller orkish ord: är det inte ett tecken på Tolkiens stora lexikala mästerskap också?).

vilka är de mest använda orden, exklusive konjunktioner, prepositioner, modala och tidsmässiga adverb, artiklar och pronomen? Listan är inte särskilt förvånande:

  1. frodo1991
  2. lång1351
  3. sam1290
  4. stor1283
  5. ned1203
  6. like1146
  7. gandalf1123
  8. think1107
  9. man1106
  10. back1007
  11. know938
  12. day841
  13. fall827
  14. time825
  15. dark818
  16. way800
  17. find790
  18. eye790
  19. pass783
  20. hand780
  21. leave760
  22. stand757
  23. hear756
  24. well749
  25. aragorn722
  26. pippin685
  27. light683
  28. lie679
  29. turn667
  30. thing665
  31. speak642
  32. ring639
  33. tree637
  34. road628
  35. merry603

jag gillar det faktum att de tre substantiverna i denna lista som pekar på konkreta saker är ring (självklart), träd och väg. Träd! Hur trevligt är det här? Träd är en av de mest använda orden i LOTR, och en av de tre översta namnen på saker! Att vara en trädälskare själv tycker jag mycket om detta resultat.

det finns många ord (verb, prepositioner och ämnen) om rörelse, naturligtvis (LOTR är en bok om en resa, trots allt), många verb om mänsklig kommunikation och något ord om processen att uppfatta världen genom sinnena: ögon, mörk, ljus, hör.

en metodologisk anteckning om lie: programvaran jag använde för analysen utför en lemmatiseringsprocess (före analysen förvandlas varje ord till sin ordbok lemma: plural substantiv till singular och konjugerade verb till infinitivformen: för att minska datamatrisen och göra resultaten mindre spridda och mer meningsfulla). Men programvaran kan inte utföra en semantisk analys, så den kan inte berätta den nuvarande formen lay, från att lägga, från det förflutna perfekt form lay, från att ljuga. Jag borde ha utfört en disambiguation, men jag tror att det i stor utsträckning skulle ha överdrivit syftet med detta svar: Hur som helst har mjukvaran lemmatiserat under lie de ytterligare händelserna: 373 lay, 110 lie, 89 lies, 84 lie, 22 lain och bara 1 lied. Vi kan säga att lögn är en process som inte är okänd för LOTR berättande utveckling.

det skulle vara väldigt intressant att analysera hapax också: till exempel, (försöker bara tömma havet med en sked), det finns ett skatteord som används i figurativ mening:

’du ljuger, sa Wormtongue. Och detta svärd, som din Herre själv gav i mitt förråd.’

’och han nu kräver det av dig igen’, sade TH Bisexoden. Misshagar det dig?’

’ förvisso inte. lord’, sade Wormtongue. Jag bryr mig om dig och din så gott jag kan. Men tröttna inte på dig själv eller beskatta för mycket din styrka. Låt andra ta itu med dessa irriterande gäster.

och det finns bara ett bastardord, hänvisat till Ungoliants avkomma:

vitt och brett hennes mindre kullar, bastards av de eländiga kompisarna, hennes egna avkommor, som hon dödade, spred sig från glen till glen, från Ephel D utilat till de östra kullarna, till Dol Guldur och fastnesses of Mirkwood. Men ingen kunde konkurrera med henne, Shelob det stora, sista barnet av Ungoliant för att besvära den olyckliga världen.

det finns många adjektiv som börjar med un-, jag tror att Tolkien borde ha älskat dem fullständigt (det gör jag också, som en icke-infödd eller unnativ eller unconnate, engelsktalande och läsare): ungracious, unfading, unexplored, unresononing, uneventful, unearthly, unheeding, unhopeful, och så vidare.

jag har också försökt att utföra en klusteranalys. I en textanalys producerar klusterprocessen kartor som anger vilka ord som används i strikt närhet med vilka andra ord: kartan gör det möjligt för oss att individualisera vissa innehållsområden som delar lexikal affinitet; och i direkt följd av det gör denna analys det möjligt för forskaren att upptäcka de huvudteman som finns i den analyserade texten.

du kan enkelt upptäcka fyra huvudklasser från klusteranalysen av LOTR-texten; två klasser (de som finns i den övre delen av kartan) är i sin tur uppdelade i två underklasser.

  • den röda klassen hänvisar till Frodos och Sams resa till Mordor. Som du lätt kan se är detta kluster fyllt med korta, ”knäckta” ord som berör parets desperata moraliska och fysiska ansträngningar, i deras rörelse mot Mount Doom och på det ödsliga landskapet i det vulkaniska ödemarken. Massor av kroppsdelar, massor av verb som uttrycker smärta, massor av onomatopoeia (hand, hiss, Huvud, ögonblick, Gollum, dra, gasp, nacke, steg, rygg, ben, skrika, Shagrat, slipa, orc, hemskt, arm, gråta, knä, grepp, ljud, andetag, öga, grope, blad, kamp, skrika, piska, slips, stank, krypa).
  • den ljusgröna och Akvamarinklassen hänvisar till Fellowship journeys. I synnerhet hänvisar den gröna underklassen till den” riktiga ” resan, och den är fylld med lemmas som handlar om rörelse och connoted av trötthet och svår vandring (sluttning, kulle, väg, klättra, bäck, ner, mil, träd, sida, berg, Stig, bank, brant, dal, moln, stiga, ås, vind, smal, sten…). Å andra sidan handlar Akvamarinunderklassen om de ”magiska mellanrummen” som spanglar resan: i synnerhet den gamla skogen, l Assirienen och de Grå hamnarna. Denna underklass är fylld med lemmas som hänvisar till färger och till naturen, och är connoted av skönhet, klarhet och friskhet (silver, blad, vit, grön, stjärna, glans, sjunga, blomma, hår, Goldberry, guld, vatten, sol, söt, träd, ljus , gul, klar, skepp, ljus, Fontän, bassäng, segel, grå, hav, skum, sång, sommar, gyllene, vind, juvel, dagg, regn, blå, ljus, varm, smal, skimmer).
  • den grå klassen hänvisar till Shire och Bree, och den är fylld med mysiga, hemtrevliga, praktiska, vardagliga ord och med ord om mänsklig kommunikation: Hobbits är trots allt mycket pratsamma människor. Det är ordförrådet för ”startsituationen, så lugn och tråkig” som du kan upptäcka i varje äventyrshistoria. Ändå innehåller den här klassen några små krypande ord som förutser formen på de saker som kommer (Strider, bra, Bree, tänk, prata, anta, veta, berättelse, mat , Herr, oroa, bita, rädd, affärer, färja, fråga, berätta, affär, verklig, kollega, skratta, tid, queer, hyresvärd, värdshus, äventyr , nyheter, affär).
  • den blå och lila klassen hänvisar till det rätta kriget för män mot Sauron. I synnerhet hänvisar den blå klassen till ringens onda inflytande, med sina offer och dess fiender (Sauron, Boromir, makt, fiende, ondska, Isildur, ring, Saruman, Elrond, wise, Minas Tirith, Moria, fara, förstöra, förgås, lore, syfte, Mordor, tjänare, tvivel, rädsla, bane, visdom, bärare, öde). Den lila klassen hänvisar till de faktiska krigshandlingarna, själva striderna i Rohan och i Gondor (Lord, King, Auguliomer, TH Ugulioden, Ugulowyn, ride, man, Denethor, son, city, Gondor, house, Faramir, Beregond, heal, battle, Rohan, Steward, Mark, Imrahil, captain, Aragorn, war, prince, knight, warden, horse, love , sister, Edoras, healer, service, Honor , bid, woman, haste).

så länge för hur många ord i LOTR böcker. Förhoppningsvis är mitt svar av intresse för Tolkiens fans och kanske forskare. Om någon har någon nyfikenhet som inte är direkt relaterad till svaret, om analysresultat, eller om metoder, Känn dig fri att DM mig.

Lämna ett svar

Din e-postadress kommer inte publiceras.