Hoeveel woorden staan er in LOTR boeken? – Quora

interessante vraag.

ik ben een woord cruncher en statisticus, dus ik denk dat ik het kan beantwoorden. Ik heb gedestilleerd volledige LOTR tekst uit mijn PDF-editie, ik heb geëlimineerd voor de hand liggende rommel uit de digitale tekst (paginanummers, kop-en voetteksten, verpakte lijnen en woorden, en ga zo maar door), en ik heb behandeld met een tekstanalyse professionele software. Let op: Ik heb Tolkien ‘ s Voorwoord meegenomen in de analyse, maar niet de bijlagen, omdat mijn PDF-editie ze mist.

de LOTR-tekst heeft 482.058 voorkomen, met 12.972 verschillende lemma ‘ s. Om het begrip duidelijker te maken: in een tekst kan elk woord meer dan eens worden gebruikt, natuurlijk: in de LOTR, het lemma en wordt 19.987 keer gebruikt; dat maakt 19.987 voorvallen en 1 lemma.

in LOTR gebruikt Tolkien 4.470 hapaxen (een hapax, een Grieks woord dat eenmalig betekent, is een woord dat slechts één keer in een tekst wordt gebruikt): dat betekent dat één woord op drie (34,51%, om precies te zijn) slechts één keer in het boek wordt gebruikt; Dit is echt een enorme hoeveelheid hapaxen, voor zo ‘ n massieve tekst: een teken van Tolkiens grote lexicale meesterschap (sommige hapaxes zijn natuurlijk elfen, dwergen of orkish woorden: is dat niet ook een teken van Tolkiens grote lexicale meesterschap?).

wat zijn de meest gebruikte woorden, met uitzondering van voegwoorden, voorzetsels, modale en temporele bijwoorden, artikelen en voornaamwoorden? De lijst is niet bijzonder verrassend:

  1. frodo1991
  2. long1351
  3. sam1290
  4. great1283
  5. down1203
  6. like1146
  7. gandalf1123
  8. think1107
  9. man1106
  10. back1007
  11. know938
  12. day841
  13. fall827
  14. time825
  15. dark818
  16. way800
  17. find790
  18. eye790
  19. pass783
  20. hand780
  21. leave760
  22. stand757
  23. hear756
  24. well749
  25. aragorn722
  26. pippin685
  27. light683
  28. lie679
  29. turn667
  30. thing665
  31. speak642
  32. ring639
  33. boom637
  34. weg628
  35. merry603

het bevalt me dat de drie substantieven in deze lijst die naar concrete dingen wijzen ring (uiteraard), boom en weg zijn. Boom! Hoe leuk is dit? Boom is een van de meest gebruikte woorden in LOTR, en een van de drie top namen van dingen! Omdat ik zelf een boomliefhebber ben, geniet ik veel van dit resultaat.

er zijn veel woorden (werkwoorden, voorzetsels en substantieven) over beweging, natuurlijk (LOTR is immers een boek over een reis), veel werkwoorden over menselijke communicatie, en een woord over het proces van het waarnemen van de wereld door de zintuigen: ogen, Donker, Licht, horen.

een methodologische opmerking over lie: de software die ik gebruikte voor de analyse voert een proces van lemmatisering uit (vóór de analyse wordt elk woord omgezet in zijn woordenboek lemma: meervoud zelfstandige naamwoorden in enkelvoud, en geconjugeerde werkwoorden in de infinitief vorm: dit, om de gegevensmatrix te verminderen, en om resultaten minder verspreid en betekenisvoller te maken). Maar de software is niet in staat om een semantische analyse uit te voeren, dus kan het de huidige vormleger niet onderscheiden, van de verleden perfecte vormleger, van de leugen. Ik had een disambiguatie moeten uitvoeren, maar ik denk dat dat het doel van dit antwoord grotendeels zou hebben overtroffen: hoe dan ook, de software heeft onder lie de verdere gebeurtenissen lemmatiseerd: 373 lay, 110 lie, 89 lies, 84 lay, 22 lain en slechts 1 Low. We kunnen zeggen dat liegen een proces is dat niet onbekend is bij de LOTR narratieve ontwikkeling.

het zou zeer interessant zijn om ook de hapax te analyseren: bijvoorbeeld, (gewoon proberen om de zee leeg te maken met een lepel), er is een fiscaal woord, gebruikt in een figuurlijke zin:

‘je liegt’, zei Wormtong. En dit zwaard gaf uw meester zelf aan mij.”

“en hij heeft het nu weer van u nodig”, zei Théoden. Vind je dat niet erg?”

” zeker niet. Heer’, zei Wormtong. Ik zorg zo goed mogelijk voor jou en de jouwe. Maar vermoeid jezelf niet, of belast te zwaar je kracht. Laat anderen omgaan met deze vervelende gasten.

en er is maar één bastaardwoord, verwezen naar het nageslacht van Ungoliant.:

haar kleine broedsels, bastaards van de ellendige maten, haar eigen nakomelingen, die ze doodde, verspreidden zich van glen naar glen, van de Ephel Dúath naar de oostelijke heuvels, naar Dol Guldur en de vasten van Mirkwood. Maar niemand kon haar evenaren, Shelob de Grote, laatste kind van Ungoliant om de ongelukkige wereld lastig te vallen.

er zijn veel bijvoeglijke naamwoorden die beginnen met on-, Ik denk dat Tolkien ze volkomen zou moeten hebben liefgehad (zo doe ik, als een niet inheemse, of onnatief, of unconnate, Engels spreker en lezer): ungracious, unfading, unexplored, unreasoning, uneventful, unearthly, unheading, unopeful, enzovoort.

ik heb ook geprobeerd een clusteranalyse uit te voeren. In een tekstanalyse produceert het clustering proces kaarten die aangeven welke woorden worden gebruikt in strikte nabijheid met welke andere woorden: de kaart maakt het mogelijk om een aantal inhoudsgebieden te individualiseren die lexicale affiniteit delen; en, als direct gevolg daarvan, stelt deze analyse de geleerde in staat om de hoofdthema ‘ s in de geanalyseerde tekst te herkennen.

u kunt eenvoudig vier hoofdklassen uit de clusteranalyse van de LOTR-tekst herkennen; twee klassen (die zich in het bovenste deel van de kaart bevinden) zijn op hun beurt opgesplitst in twee subklassen.

  • de Rode klasse verwijst naar de reis van Frodo en Sam naar Mordor. Zoals je gemakkelijk kunt zien, is deze cluster gevuld met korte, “gebarsten” woorden die betrekking hebben op de wanhopige morele en fysieke inspanningen van het paar, in hun verhuizing naar Mount Doom, en op het desolate landschap van de vulkanische woestenij. Veel lichaamsdelen, veel werkwoorden die pijn uitdrukken, veel onomatopoeia (hand, gesis, hoofd, moment, Gollum, slepen, snakken, nek, stap, rug, been, schreeuwen, Shagrat, grind, orc, afzichtelijk, arm, huilen, knie, grip, geluid, adem, oog, betast, mes, strijd, schreeuwen, zweep, stropdas, stank, kruipen).
  • de lichtgroene en Aquamariene klasse verwijst naar de Fellowshipreizen. In het bijzonder, de groene subklasse zinspeelt op de “juiste” Reis, en het is gevuld met lemma ‘ s omgaan met beweging, en connoted door vermoeidheid en moeilijke wandelen (helling, heuvel, weg, klimmen, Beek, beneden, mijl, boom, kant, berg, pad, bank, steil, vallei, wolk, stijgen, ridge, wind, smal, rots…). Aan de andere kant, de Aquamarijn subklasse behandelt de “magische intermezzo ‘s” die de reis overspannen: in het bijzonder, het Oude Bos, Lórien en de Grijze Havens. Deze subklasse is gevuld met lemma ‘ s die zinspelen op kleuren en op de natuur, en zijn verbonden met schoonheid, helderheid en frisheid (zilver, blad, wit, groen, ster, glans, zingen, bloem, haar, Goudbes, goud, water, zon, zoet, boom, licht , geel, helder, schip, helder, fontein, bassin, zeil, grijs, zee, schuim, lied, zomer, goud, wind, juweel, dauw, regen, blauw, kaars, warm, slank, glans).
  • de grijze klasse verwijst naar de Gouw en Bree, en het is gevuld met gezellige, huiselijke, praktische, alledaagse woorden, en met woorden over menselijke communicatie: Hobbits zijn tenslotte zeer spraakzame mensen. Het is de woordenschat van de” startsituatie, zo kalm en saai ” dat je in elk avonturenverhaal kunt spotten. Niettemin bevat deze klas enkele kruipende woorden, die de vorm van de dingen die komen voorzien (Strider, goed, Bree, denken, praten, veronderstel, weten, verhaal, eten , meneer, zorgen, bijten, bang, zaken, veerboot, vragen, vertellen, deal, echte, collega, lachen, tijd, queer, verhuurder, herberg, avontuur , nieuws, affaire). De blauwe en paarse klasse verwijst naar de echte oorlog van mannen tegen Sauron. In het bijzonder verwijst de Blauwe klasse naar de kwade invloed van de Ring, met zijn slachtoffers en zijn vijanden (Sauron, Boromir, macht, vijand, kwaad, Isildur, ring, Saruman, Elrond, wijs, Minas Tirith, Moria, gevaar, vernietigen, vergaan, lore, doel, Mordor, dienaar, twijfel, angst, bane, wijsheid, drager, lot). De paarse klasse verwijst naar de werkelijke oorlogshandelingen, de veldslagen in Rohan en in Gondor (heer, koning, Éomer, Théoden, Éowyn, ride, man, Denethor, zoon, stad, Gondor, huis, Faramir, Beregond, heal, battle, Rohan, Steward, Mark, Imrahil, kapitein, Aragorn, oorlog, Prins, ridder, warden, paard, liefde , zuster, Edoras, genezer, dienst, eer , bod, vrouw, haast).

zo lang voor hoeveel woorden in de LOTR boeken. Hopelijk is mijn antwoord interessant voor Tolkien ‘ s fans en, misschien, geleerden. Als iemand enige nieuwsgierigheid heeft die niet direct verband houdt met het antwoord, over de resultaten van de analyse, of over methodologieën, voel je vrij om DM me.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.