Interessant spørsmål .
jeg er et ord cruncher og statistiker, så jeg tror jeg kan svare på det. Jeg har destillert FULL LOTR-tekst fra MIN PDF-utgave, jeg har eliminert åpenbar søppel fra den digitale teksten (sidetall, topp-og bunntekst, innpakket linjer og ord, og så videre), og jeg har behandlet det med en tekstanalyse profesjonell programvare. Pass på: Jeg har tatt Tolkiens forord inn i analysen, men ikke Vedleggene, siden MIN PDF-utgave mangler dem.
LOTR-teksten har 482 058 forekomster, med 12 972 forskjellige lemmaer. For å gjøre konseptet klarere: i en tekst kan hvert ord brukes mer enn en gang, selvfølgelig: I LOTR, lemma og brukes 19,987 ganger; det gjør 19,987 forekomster og 1 lemma.
I LOTR bruker Tolkien 4,470 hapaxer (et hapax, et gresk ord som betyr en gang, for en gang, er et ord som brukes bare en gang i en tekst): det betyr at ett ord ut av tre (34,51%, for å være mer presis) brukes bare en gang i boken; dette er virkelig en stor mengde hapaxer, for en så massiv tekst: et tegn På Tolkiens store leksikalske mesterskaps (noen hapaxer, selvfølgelig, er elvish, dwarvish eller orkish ord: er Ikke Det et tegn På Tolkiens store leksikalske mesterskaps også?).
hva er de mest brukte ordene, unntatt konjunksjoner, preposisjoner, modale og tidsmessige adverb, artikler og pronomen? Listen er ikke spesielt overraskende:
- frodo1991
- lang1351
- sam1290
- stor1283
- ned1203
- som1146
- gandalf1123
- think1107
- man1106
- back1007
- know938
- dag841
- fall827
- tid825
- mørk818
- way800
- finne790
- eye790
- pass783
- hånd780
- blad760
- stand757
- hear756
- brønn749
- aragorn722
- pippin685
- lys683
- lie679
- sving667
- ting665
- speak642
- ring639
- tree637
- vei628
- merry603
jeg liker det faktum at de tre substantives som finnes i denne listen som peker pa konkrete ting er ring (apenbart), tre og vei. Tre! Hvor fint er det dette? Treet er en av DE mest brukte ordene I LOTR, og en av de tre toppnavnene pa ting! Å være en tre elsker meg selv, jeg liker dette resultatet mye.
det er mange ord (verb, preposisjoner og substantiver) om bevegelse, selvfølgelig (LOTR er en bok om en reise, tross alt), mange verb om menneskelig kommunikasjon, og noen ord om prosessen med å oppleve verden gjennom sansene: øyne, mørke, lys, høre.
et metodisk notat om lie: programvaren jeg brukte til analysen utfører en lemmatiseringsprosess (før analysen blir hvert ord omgjort til sin ordbok lemma: flertall substantiver til entall, og konjugerte verb til infinitiv form: dette, for å redusere datamatrisen, og for å gjøre resultatene mindre spredt og mer meningsfylt). Men programvaren er ikke i stand til å utføre en semantisk analyse, så den kan ikke fortelle den nåværende formen lå, fra å ligge, fra den tidligere perfekte formen lå, fra å lyve. Jeg burde ha utført en disambiguation, men jeg tror at det i stor grad ville ha overdrevet formålet med dette svaret: uansett har programvaren lemmatisert under løgn de videre hendelsene: 373 lay, 110 lie, 89 lies, 84 lying, 22 lain og bare 1 lied. Vi kan si at løgn er en prosess som IKKE er ukjent FOR LOTR fortellende utvikling.
det ville være veldig interessant å analysere hapaxen også: for eksempel, (bare prøver å tømme havet med en skje), er det ett skatteord, brukt i figurativ forstand:
‘du lyver, sa Wormtongue. Og dette sverdet gav din herre selv i min varetekt.’
‘og han krever det nå av deg igjen’, Sa Dené. ‘Mishager det deg?’
‘ Sikkert ikke. herre, sa Wormtongue. Jeg bryr meg om deg og dine så godt jeg kan. Men ikke trett deg selv, eller skatt for tungt din styrke. La andre håndtere disse irriterende gjestene.
Og det er bare ett bastard ord, referert til avkom Av Ungoliant:
Langt og bredt hennes mindre kull, bastards av de elendige kameratene, hennes eget avkom, som hun drepte, spredte seg fra glen til glen, Fra Ephel Dúath til de østlige åsene, Til Dol Guldur og mirkwoods fastheter. Men Ingen kunne rival henne, Shelob Den Store, Siste barn Ungoliant å problemer ulykkelig verden.
Det er mange adjektiver som begynner med un-, jeg tror At Tolkien burde ha elsket dem helt (det gjør jeg også, som en ikke innfødt, eller unnativ eller unconnate, engelsktalende og leser): ungracious, unfading, uutforsket, unreasoning, uneventful, unearthly, unheeding, unhopeful, og så videre.
jeg har også prøvd å utføre en klyngeanalyse. I en tekstlig analyse, clustering prosessen produserer kart som viser hvilke ord som brukes i streng nærhet med hvilke andre ord: kartet gjør oss possibile å individualisere noen innholdsområder som deler leksikalsk affinitet; og, i direkte konsekvens av det, denne analysen gjør det mulig for forskeren å få øye på de viktigste temaene som er tilstede i den analyserte teksten.
du kan enkelt se ut fire hovedklasser fra klyngeanalysen AV LOTR-teksten; to klasser( de som ligger i den øvre delen av kartet) er i sin tur delt inn i to underklasser.
- Den Røde Klassen refererer Til Frodo Og Sams reise inn I Mordor. Som du lett kan se, er denne klyngen fylt med korte,» sprukne » ord som berører parets desperate moralske og fysiske innsats, i deres bevegelse mot Doom-Fjellet og på det øde landskapet i det vulkanske ødemarken. Mange kroppsdeler, mange verb som uttrykker smerte, mange onomatopoeia (hånd, hiss, hode, øyeblikk, Gollum, dra, gisp, nakke, skritt, rygg, ben, rop, Shagrat, grind, ork, heslig, arm, gråte, kne, grep, lyd, pust, øye, grope, blad, kamp, rop, pisk, slips, stank, kryp).
- Pale Green Og Aquamarine Klassen refererer Til Fellesskap reiser. Spesielt refererer Den Grønne underklassen til den» riktige » reisen, og den er fylt med lemmas som omhandler bevegelse ,og connoted av tretthet og vanskelig fotturer (skråning, bakke, vei, klatre, strøm, ned, kilometer, tre, side, fjell, sti, bank, bratt, dal, sky, stige, ås, vind, smal, stein…). På den annen side handler Akvamarinunderklassen om de» magiske mellomspillene » som spangle reisen: spesielt Den Gamle Skogen, Ló og De Grå Havnene. Denne underklassen er fylt med lemmas som refererer til farger Og Til Naturen, og er connoted av skjønnhet, klarhet og friskhet (sølv, blad, hvit, grønn, stjerne, skinne, synge, blomst, hår, Goldberry, gull, vann, sol, søt, tre , lys, gul, klar, skip, lyse, fontene, bassenget, seil, grå, sjø, skum, sang, sommer, gylden, vind, juvel, dugg, regn, blå, stearinlys, varm, slank, skimmer).
- Den Grå Klassen refererer til Hobsyssel og Bree, og den er fylt med koselige, hjemmekoselige, praktiske, hverdagslige ord, og med ord om menneskelig kommunikasjon: Hobbits er veldig snakkesalige mennesker, tross alt. Det er vokabularet til «startsituasjonen, så rolig og kjedelig»som du kan se i alle eventyrfortellinger. Ikke desto mindre inneholder Denne Klassen noen små krypende ord som forutser formen på de tingene som kommer (Strider, bra, Bree, tenk, snakk, anta, vet, historie , mat, Herre, bekymre deg, bite, redd, virksomhet, ferge, spør, fortell, avtale, ekte, stipendiat, latter, tid, queer,utleier, inn , eventyr, nyheter, affære).
- Den Blå Og Lilla Klassen refererer til Den riktige Krigen Av Menn mot Sauron. Spesielt refererer Den Blå Klassen Til Ringens onde innflytelse, med sine ofre og fiender (Sauron, Boromir, makt, fiende, ondskap, Isildur, ring, Saruman, Elrond, wise, Minas Tirith, Moria, fare, ødelegge, gå til grunne, lore, hensikt, Mordor, tjener, tvil, frykt, bane, visdom, bærer, skjebne). Den Lilla Klassen refererer til de faktiske krigshandlingene, selve slagene I Rohan og I Gondor (Herre, Konge, ④omer, Théoden, Éowyn, ri, mann, Denethor, sønn, By, gondor, hus, Faramir, Beregond, helbrede, kamp, Rohan, Steward, Mark, Imrahil, kaptein, aragorn, krig, prins, ridder, warden, hest, kjærlighet , søster, Edoras, healer, service, ære , bud, kvinne, haste).
så lenge for HVOR mange ord I LOTR-bøkene. Forhåpentligvis er svaret mitt av interesse for Tolkiens fans og kanskje lærde. Hvis noen har noen nysgjerrighet som ikke er direkte relatert til svaret, om analyseresultater eller om metoder, vær SÅ SNILL Å DM meg.