interessant spørgsmål.
jeg er en ordknuser og statistiker, så jeg tror, jeg kan svare på det. Jeg har destilleret fuld LOTR-tekst fra min PDF-udgave, jeg har fjernet åbenlyst uønsket fra den digitale tekst (sidetal, sidehoveder og sidefødder, indpakket linjer og ord osv.), og jeg har behandlet det med et professionelt tekstanalyseprogram. Pas på: Jeg har taget Tolkiens forord ind i analysen, men ikke bilagene, da min PDF-udgave mangler dem.
LOTR-teksten har 482.058 forekomster med 12.972 forskellige lemmaer. For at gøre konceptet klarere: i en tekst kan hvert ord naturligvis bruges mere end en gang: i LOTR, lemma og bruges 19.987 gange; det gør 19.987 forekomster og 1 lemma.
i LOTR bruger Tolkien 4.470 hapakser (en hapakse, et græsk ord, der betyder en gang, kun for en gang, er et ord, der kun bruges en gang i en tekst): det betyder, at et ord ud af tre (34,51%, for at være mere præcist) bruges kun en gang i bogen; dette er virkelig en enorm mængde hapakninger til en så massiv tekst: et tegn på Tolkiens store leksikalske mesterskab (nogle hapakninger er selvfølgelig Elvish, dværge eller orkish ord: er det ikke også et tegn på Tolkiens store leksikalske mesterskab?).
Hvad er de mest anvendte ord, undtagen konjunktioner, præpositioner, modale og tidsmæssige adverb, artikler og pronomen? Listen er ikke særlig overraskende:
- frodo1991
- long1351
- sam1290
- stor1283
- ned1203
- like1146
- gandalf1123
- tænk1107
- man1106
- back1007
- kend938
- dag841
- fall827
- tid825
- dark818
- vej800
- find790
- eye790
- pass783
- hand780
- leave760
- stand757
- hear756
- brønd749
- aragorn722
- pippin685
- light683
- lie679
- turn667
- thing665
- speak642
- ring639
- tree637
- road628
- merry603
jeg kan godt lide det faktum, at de tre substantiver indeholdt i denne liste, der peger på konkrete ting, er ring (naturligvis), træ og vej. Træ! Hvor dejligt er det her? Træ er et af de mest anvendte ord i LOTR, og et af de tre øverste navne på ting! At være en træ elsker mig selv, Jeg nyder dette resultat meget.
der er mange ord (verb, præpositioner og substantiver) om bevægelse, selvfølgelig (LOTR er en bog om en rejse, trods alt), mange verb om menneskelig kommunikation og noget ord om processen med at opfatte verden gennem sanserne: øjne, mørke, lys, høre.
en metodologisk note om løgn: det program, jeg brugte til analysen, udfører en lemmatiseringsproces (før analysen omdannes hvert ord til sin ordbog lemma: flertal substantiver til ental og konjugerede verb til den infinitive form: for at reducere datamatricen og gøre resultaterne mindre spredte og mere meningsfulde). Men programmet er ikke i stand til at udføre en semantisk analyse, så det kan ikke fortælle den nuværende form lå, fra at lægge, fra fortiden perfekt form lå, fra at lyve. Jeg burde have udført en disambiguation, men jeg tror, at det stort set ville have overdrevet formålet med dette svar: alligevel har programmet lemmatiseret under lie de yderligere forekomster: 373 lay, 110 lie, 89 lies, 84 lie, 22 lain og bare 1 lied. Vi kan sige, at løgn er en proces, der ikke er ukendt for LOTR-fortællingsudviklingen.
det ville også være meget interessant at analysere hapaksen: for eksempel (bare forsøger at tømme havet med en ske), der er et skatteord, der bruges i figurativ forstand:
‘du lyver, sagde ormen. Og dette sværd, som din herre selv gav mig.’
‘og nu kræver han det af jer igen’, sagde TH. Er det utilfreds med dig?’
‘bestemt ikke. Herre’, sagde Ormtongue. Jeg holder af dig og din, så godt jeg kan. Men du behøver ikke trætte dig selv, eller beskatte for stærkt din styrke. Lad andre beskæftige sig med disse irriterende gæster.
og der er kun et bastard ord, der henvises til afkom af Ungoliant:
vidt og bredt spredte hendes mindre yngel, bastarder af de elendige kammerater, hendes eget afkom, som hun dræbte, sig fra glen til glen, fra Efel D-Karrat til de østlige bakker, til Dol Guldur og Fasthederne i Mirktræ. Men ingen kunne konkurrere med hende, Shelob den store, sidste barn af Ungoliant for at forstyrre den ulykkelige verden.
der er mange adjektiver, der starter med un -, jeg tror, at Tolkien burde have fuldstændig elsket dem (det gør jeg også som en ikke indfødt eller unnativ eller unconnate, engelsktalende og læser): ungracious, unfading, uudforsket, urimelig, uneventful, uneventful, unheasthly, unheeding, unhopeful og så videre.
jeg har også forsøgt at udføre en klyngeanalyse. I en tekstanalyse producerer klyngeprocessen kort, der angiver, hvilke ord der bruges i nøje nærhed med hvilke andre ord: kortet gør os possibile at individualisere nogle indholdsområder, der deler leksikalsk affinitet; og, som direkte konsekvens af det, denne analyse gør det muligt for den lærde at få øje på de vigtigste temaer, der findes i den analyserede tekst.
du kan nemt få øje på fire hovedklasser fra klyngeanalysen af LOTR-teksten; to klasser (dem, der er placeret i den øverste del af kortet) er igen opdelt i to underklasser.
- Den Røde klasse henviser til Frodo og Sams rejse ind i Mordor. Som du nemt kan se, er denne klynge fyldt med korte, “krakkede” ord, der berører parrets desperate moralske og fysiske indsats, i deres bevægelse mod Mount Doom og på det øde landskab i det vulkanske ødemark. Masser af kropsdele, masser af verb, der udtrykker smerte, masser af onomatopoeia (hånd, sus, hoved, øjeblik, Gollum, træk, gisp, hals, trin, ryg, ben, råbe, Shagrat, slib, ork, hæslig, arm, græde, knæ, greb, lyd, ånde, øje, famle, klinge, kamp, råbe, pisk, slips, stank, kravle).
- den lysegrønne og akvamarin klasse refererer til fællesskab rejser. Især henviser den grønne underklasse til den” rigtige ” rejse, og den er fyldt med lemmaer, der beskæftiger sig med bevægelse, og konnoteret af træthed og vanskelig Vandring (hældning, bakke, vej, klatre, strøm, ned, Mil, træ, side, bjerg, sti, bank, stejl, dal, Sky, stigning, højderyg, vind, smal, klippe…). På den anden side beskæftiger akvamarin-underklassen sig med de “magiske mellemrum”, der Spangler rejsen: især Den Gamle Skov, L Kurrien og de grå havne. Denne underklasse er fyldt med lemmaer, der henviser til farver og til naturen og er forbundet med skønhed, klarhed og friskhed (sølv, blad, Hvid, grøn, stjerne, skinne, synge, blomst, hår, Goldberry, guld, vand, sol, sød, træ, lys , gul, klar, skib, lys, springvand, bassin, sejl, grå, hav, skum, sang, sommer, gylden, vind, juvel, dug, regn, blå, lys, varm, slank, glimmer).
- den grå klasse refererer til Shire og Bree, og den er fyldt med hyggelige, hjemlige, praktiske, hverdagslige ord og med ord om menneskelig kommunikation: Hobbitter er trods alt meget snakkesalige mennesker. Det er ordforrådet for “startsituationen, så rolig og kedelig”, som du kan få øje på i enhver eventyrhistorie. Ikke desto mindre indeholder denne klasse nogle små krybende ord, der forudser formen på de kommende Ting (Strider, god, Bree, tænk, snak, Antag, ved, historie, mad , Sir, bekymre dig, bid, bange, forretning, færge, spørg, fortæl, deal, ægte, fyr, grine, tid, underlig, udlejer, kro, eventyr , nyheder, affære).
- den blå og lilla klasse refererer til den rette krig af mænd mod Sauron. Især henviser Den Blå klasse til ringens onde indflydelse med dens ofre og dens fjender (Sauron, Boromir, magt, fjende, ondskab, Isildur, ring, Saruman, Elrond, klog, Minas Tirith, Moria, fare, ødelægge, omkomme, lore, formål, Mordor, tjener, tvivl, frygt, bane, visdom, bærer, skæbne). Den lilla klasse henviser til de faktiske krigshandlinger, selve slagene i Rohan og i Gondor (Herre, Konge, Karlsomer, TH Karloden, karlsvogn, ride, mand, Denethor, søn, by, Gondor, hus, Faramir, Beregond, helbrede, kamp, Rohan, forvalter, Mark, Imrahil, kaptajn, Aragorn, krig, prins, ridder, vagt, hest, kærlighed , søster, Edoras, healer, tjeneste, ære , bud, kvinde, hast).
så længe efter hvor mange ord i LOTR-bøgerne. Forhåbentlig er mit svar af interesse for Tolkiens fans og måske lærde. Hvis nogen har nogen nysgerrighed, der ikke er direkte relateret til svaret, om analyseresultater eller om metoder, er du velkommen til at DM mig.