Kuinka monta sanaa on LOTR-kirjoissa? – Quora

mielenkiintoinen kysymys.

olen sananjulistaja ja tilastotieteilijä, joten uskon osaavani vastata siihen. Olen tislattu koko LOTR tekstiä minun PDF-painos, olen poistanut ilmeinen roskaa digitaalisen tekstin (sivunumerot, otsikot ja alatunnisteet, kääritty linjat ja sanat, ja niin edelleen), ja olen käsitellyt sitä tekstianalyysi ammatillinen ohjelmisto. Varokaa: olen ottanut Tolkienin esipuheen analyysiin, mutta en liitteitä, sillä PDF-versiostani ne puuttuvat.

LOTR-tekstissä on 482 058 esiintymää, joista 12 972 erillisiä lemmejä. Jotta käsite selkeämpi: tekstissä, jokainen sana voidaan käyttää useammin kuin kerran, tietenkin: LOTR, lemma ja sitä käytetään 19,987 kertaa; joka tekee 19,987 esiintymiä ja 1 lemma.

Lotrissa Tolkien käyttää 4 470 hapaxia (hapax, kreikankielinen sana, joka tarkoittaa kerran, vain kerran, on sana, jota käytetään vain kerran tekstissä): se tarkoittaa, että yhtä sanaa kolmesta (tarkemmin sanottuna 34,51%) käytetään vain kerran kirjassa; tämä on todella valtava määrä hapaxeja, niin massiiviselle tekstille: merkki Tolkienin suuresta leksikaalisesta mestaruudesta (jotkut hapaxit, tietenkin, ovat haltioita, kääpiöitä tai orkilaisia sanoja: eikö sekin ole merkki Tolkienin suuresta leksikaalisesta mestaruudesta?).

mitkä ovat käytetyimmät sanat, pois lukien konjunktiot, prepositiot, modaali-ja ajalliset adverbit, Artikkelit ja pronominit? Lista ei ole erityisen yllättävä:

  1. frodo1991
  2. long1351
  3. sam1290
  4. great1283
  5. down1203
  6. like1146
  7. gandalf1123
  8. think1107
  9. man1106
  10. back1007
  11. know938
  12. day841
  13. fall827
  14. time825
  15. dark818
  16. way800
  17. find790
  18. eye790
  19. pass783
  20. hand780
  21. leave760
  22. stand757
  23. hear756
  24. well749
  25. aragorn722
  26. pippin685
  27. light683
  28. lie679
  29. turn667
  30. thing665
  31. speak642
  32. ring639
  33. tree637
  34. road628
  35. merry603

pidän siitä, että tämän listan kolme konkreettisiin asioihin viittaavaa sisältöä ovat rengas (ilmeisesti), puu ja tie. Puu! Eikö olekin hieno? Puu on yksi LOTRIN käytetyimmistä sanoista, ja yksi asioiden kolmesta kärkinimestä! Koska olen itsekin puun ystävä, nautin tästä tuloksesta paljon.

on paljon sanoja (verbit, prepositiot ja aineelliset) koskien liikettä, tietenkin (LOTR on kirja matkasta, onhan), paljon verbejä koskien ihmisen viestintää, ja joitakin sanoja koskien prosessia hahmottaa maailmaa aistien kautta: silmät, pimeys, valo, kuule.

metodologinen huomautus valheesta: analyysiin käyttämäni ohjelmisto suorittaa lemmatisointiprosessin (ennen analyysiä jokainen sana muutetaan sanakirjakseen lemma: monikossa substantiivit yksikössä ja konjugoituneet verbit infinitiivimuodossa: tämä, jotta voidaan vähentää datamatriisi, ja tehdä tulokset vähemmän hajallaan, ja mielekkäämpi). Ohjelmisto ei kuitenkaan pysty suorittamaan semanttista analyysiä, joten se ei pysty erottamaan nykyistä muotoa lay, from lay, from the past perfect form lay, from to lie. Minun olisi pitänyt tehdä disambiguation, mutta mielestäni, että olisi suurelta osin liioiteltu tarkoitus tämän vastauksen: joka tapauksessa, ohjelmisto on lemmatised alle lie edelleen esiintymiä: 373 lay, 110 lie, 89 valheita, 84 valehtelee, 22 lain ja vain 1 lied. Voidaan sanoa, että valehtelu on prosessi, joka ei ole tuntematon LOTRIN kerronnan kehitykselle.

olisi erittäin mielenkiintoista analysoida myös hapaxia: esimerkiksi (vain yrittää tyhjentää merta lusikalla) on yksi verosana, jota käytetään kuvaannollisessa merkityksessä:

’valehtelet”, sanoi Matokieli. Ja tämän miekan Herrasi antoi minun haltuuni.”

”ja nyt hän vaatii sitä sinulta taas”, Théoden sanoi. Eikö se miellytä sinua?”

” ei varmastikaan. Herra”, sanoi Matokieli. Välitän teistä parhaani mukaan. Mutta älä väsytä itseäsi äläkä verota liikaa voimiasi. Anna toisten hoitaa nämä ärsyttävät vieraat.

ja on vain yksi äpärä sana, viittasi Ungoliantin jälkeläisiin:

hänen vähäisemmät jälkeläisensä, surkeiden puolisoiden äpärät, omat jälkeläisensä, jotka hän tappoi, levisivät glenistä gleniin, Ephel Dúathista itäisille kukkuloille, Dol Gulduriin ja mirkwoodin paastoihin. Mutta kukaan ei voinut vetää vertoja hänelle, Shelob suurelle, Ungoliantin viimeiselle lapselle, joka vaivasi onnettomaa maailmaa.

on olemassa paljon adjektiiveja alkaen un -, mielestäni Tolkienin olisi pitänyt täysin rakastanut heitä (niin minäkin, koska ei syntyperäinen, tai unnative, tai unconnate, Englanti puhuja ja lukija): ungracious, unfading, tutkimaton, järjetön, uneventful, unearthly, unheeding, unhopeful, ja niin edelleen.

olen yrittänyt tehdä myös klusterianalyysiä. Tekstianalyysissä klusterointiprosessi tuottaa karttoja, jotka osoittavat, mitä sanoja käytetään tiukan läheisessä suhteessa mihinkin muuhun sanaan: kartta tekee meille mahdolliseksi yksilöidä joitakin sisältöalueita, jotka jakavat leksikaalinen affiniteetti; ja, suora seuraus siitä, että, tämä analyysi mahdollistaa tutkija havaita tärkeimmät teemat läsnä analysoidun tekstin.

LOTR-tekstin klusterianalyysistä voi helposti erottaa neljä pääluokkaa; kaksi luokkaa (ne, jotka sijaitsevat kartan yläosassa) on puolestaan jaettu kahteen alaluokkaan.

  • Punainen luokka viittaa Frodon ja Samin matkaan Mordoriin. Kuten voit helposti nähdä, tämä klusteri on täynnä lyhyitä, ”säröillä” sanoja, jotka koskettavat pariskunnan epätoivoisia moraalisia ja fyysisiä ponnisteluja, heidän siirtyessään kohti Tuomiovuorta, ja autiota maisemaa vulkaanisessa autiomaassa. Paljon ruumiinosia, paljon kipua ilmaisevia verbejä, paljon onomatopoeiaa (käsi, sihinä, Pää, hetki, Klonkku, vedä, henkäys, kaula, askel, selkä, jalka, huutaa, Shagrat, jauhaa, örkki, hirveä, käsi, itku, polvi, ote, ääni, hengitys, silmä, haparointi, terä, kamppailu, huuto, ruoska, solmio, löyhkä, ryömintä).
  • Vaaleanvihreä ja akvamariini-luokka viittaa Toveruusmatkoihin. Erityisesti vihreä alaluokka viittaa ”oikea” matka, ja se on täynnä lemmas käsittelevät liikettä, ja merkitään väsymys ja vaikea vaellus (Rinne, kukkula, tie, kiivetä, stream, alas, maili, puu, puoli, vuori, polku, pankki, jyrkkä, laakso, pilvi, nousu, harjanne, tuuli, kapea, Kallio…). Toisaalta akvamariinin alaluokka käsittelee matkaa sävyttäviä ”maagisia välisanoja”: erityisesti vanhaa metsää, Lórienia ja harmaita satamia. Tämä alaluokka on täynnä lemmoja, jotka viittaavat väreihin ja luontoon, ja ne merkitsevät kauneutta, selkeyttä ja raikkautta (hopea, lehti, Valkoinen, vihreä, tähti, paistaa, laulaa, kukka, hiukset, Goldberry, kulta, vesi, aurinko, makea, puu , valo, keltainen, kirkas, laiva, kirkas, suihkulähde, allas, purje, harmaa, meri, vaahto, laulu, kesä, kultainen, tuuli, jalokivi, kaste, sade, sininen, kynttilä, lämmin, hoikka, hohto).
  • harmaa luokka viittaa Konnuun ja Breen, ja se on täynnä kodikkaita, kotoisia, käytännöllisiä, arkisia sanoja ja sanoja ihmisten viestinnästä: Hobitit ovat loppujen lopuksi hyvin puheliaita ihmisiä. Se on sanastoa ”lähtötilanne, niin rauhallinen ja tylsä”, että voit bongata jokaisen seikkailuja tarina. Kuitenkin, tämä luokka sisältää joitakin pieniä hiipivä sanoja, ennakoiden muoto tulevia asioita (Strider, hyvä, Bree, ajatella, puhua, olettaa, tietää, tarina, ruoka , Sir, huoli, purra, pelkää, liike, lautta, kysyä, kertoa, käsitellä, todellinen, kaveri, nauraa, aika, queer, vuokranantaja, inn, seikkailu , uutiset, affair).
  • sininen ja violetti luokka viittaa miesten oikeaan sotaan Sauronia vastaan. Erityisesti sininen luokka viittaa sormuksen pahaan vaikutukseen uhreineen ja vihollisineen (Sauron, Boromir, power, enemy, evil, Isildur, ring, Saruman, Elrond, wise, Minas Tirith, Moria, peril, destroy, perish, lore, purpose, Mordor, servant, doubt, fear, bane, wisdom, bearer, fate). Purppuraluokka viittaa varsinaisiin sotatoimiin, aivan taisteluihin Rohanissa ja Gondorissa (Herra, Kuningas, Éomer, Théoden, Éowyn, ratsastaa, mies, Denethor, poika, kaupunki, Gondor, talo, Faramir, Beregond, heal, taistelu, Rohan, taloudenhoitaja, Mark, Imrahil, kapteeni, Aragorn, sota, prinssi, ritari, johtaja, hevonen , rakkaus, sisko, Edoras, parantaja, palvelu , kunnia, tarjous, nainen, kiire).

So long for how many words in the LOTR books. Toivottavasti vastaukseni kiinnostaa Tolkienin faneja ja ehkä tutkijoita. Jos jollakulla on uteliaisuutta, joka ei liity suoranaisesti vastaukseen, analyysin tuloksiin tai menetelmiin, voit vapaasti kertoa minulle.

Vastaa

Sähköpostiosoitettasi ei julkaista.