Ile słów jest w książkach LOTR? – Quora

ciekawe pytanie.

jestem pogromcą słów i statystykiem, więc myślę, że mogę na nie odpowiedzieć. Wydestylowałem pełny tekst LOTR z mojej edycji PDF, wyeliminowałem oczywiste śmieci z tekstu cyfrowego (numery stron, nagłówki i stopki, zawinięte linie i słowa itp.) i potraktowałem to profesjonalnym oprogramowaniem do analizy tekstu. Uwaga: wziąłem przedmowę Tolkiena do analizy, ale nie do załączników, ponieważ brakuje mi ich w moim wydaniu PDF.

tekst LOTR ma 482 058 wystąpień, z 12 972 odrębnymi lematami. Dla jasności: w tekście każde słowo może być użyte więcej niż raz, oczywiście: w LOTR, lemacie i jest użyte 19 987 razy, co daje 19 987 wystąpień i 1 lemat.

w LOTR Tolkien używa 4470 hapaxów (hapax, greckie słowo oznaczające raz, tylko raz, jest słowem używanym tylko raz w tekście): oznacza to, że jedno z trzech słów (34,51%, dokładniej) jest użyte tylko raz w książce; to naprawdę ogromna ilość hapaxów, jak na tak ogromny tekst: znak Wielkiego mistrzowskiego leksykalnego opanowania Tolkiena (niektóre hapaxy są oczywiście elfickie, krasnoludzkie lub orkijskie słowa: czy to nie oznaka Wielkiego leksykalnego Mistrzostwa Tolkiena?).

jakie są najczęściej używane słowa, z wyjątkiem spójników, przyimków, przysłówków modalnych i czasowych, artykułów i zaimków? Lista nie jest szczególnie zaskakująca:

  1. frodo1991
  2. long1351
  3. sam1290
  4. great1283
  5. down1203
  6. like1146
  7. gandalf1123
  8. think1107
  9. man1106
  10. back1007
  11. know938
  12. day841
  13. fall827
  14. time825
  15. dark818
  16. way800
  17. find790
  18. eye790
  19. pass783
  20. hand780
  21. leave760
  22. stand757
  23. hear756
  24. well749
  25. aragorn722
  26. pippin685
  27. light683
  28. lie679
  29. turn667
  30. thing665
  31. speak642
  32. Ring 639
  33. tree637
  34. road628
  35. merry603

podoba mi się fakt, że trzy rzeczowniki zawarte w tej liście, które wskazują na konkretne rzeczy to pierścień (oczywiście), drzewo i droga. Drzewo! Jakie to miłe? Drzewo jest jednym z najczęściej używanych słów w LOTR i jednym z trzech najlepszych nazw rzeczy! Będąc miłośnikiem drzew, bardzo lubię ten wynik.

jest wiele słów (czasowników, przyimków i rzeczowników) dotyczących ruchu, oczywiście (LOTR to przecież książka o podróży), wiele czasowników dotyczących komunikacji międzyludzkiej, a także słowo dotyczące procesu postrzegania świata za pomocą zmysłów: oczu, ciemności, światła, słuchu.

Uwaga metodologiczna o kłamstwie: oprogramowanie, którego użyłem do analizy, przeprowadza proces lematyzacji (przed analizą każde słowo zamienia się w lemat słownikowy: rzeczowniki w liczbie mnogiej na liczbę pojedynczą, a czasowniki odmienione na bezokolicznik: to, w celu zmniejszenia macierzy danych i aby wyniki były mniej rozproszone i bardziej znaczące). Ale oprogramowanie nie jest w stanie przeprowadzić analizy semantycznej, więc nie może odróżnić obecnej formy lay, od do lay, od przeszłej formy perfect lay, od do lie. Powinienem był przeprowadzić disambiguację, ale myślę, że to w dużej mierze przesadziło cel tej odpowiedzi: w każdym razie oprogramowanie lemmatyzowało pod lie dalsze zdarzenia: 373 lay, 110 lie, 89 lies, 84 lie, 22 lain i tylko 1 lied. Można powiedzieć, że kłamstwo jest procesem nieznanym lotrowi.

bardzo ciekawe byłoby przeanalizowanie również hapaksu: na przykład (próbując opróżnić morze łyżką), jest jedno słowo podatkowe, używane w przenośni:

’kłamiesz”, powiedział Wormtongue. I ten miecz twój Pan sam oddał w moje ręce.”

„i teraz wymaga tego od ciebie ponownie”, powiedział Théoden. / Nie podoba Ci się to?”

” panie”, powiedział Wormtongue. 'Troszczę się o Ciebie i twoje jak najlepiej mogę. Ale nie znudzić się, lub podatku zbyt mocno swoją siłę. Niech inni zajmą się tymi irytującymi gośćmi.

i jest tylko jedno bękartowe słowo, odnoszące się do potomstwa Ungolianta:

daleko i szeroko jej Pomniejsze lęgi, bękarty nieszczęśliwych kolegów, jej własne potomstwo, które zabiła, rozprzestrzeniły się od doliny do doliny, od Ephel Dúath po Wschodnie wzgórza, do Dol Guldur i posty Mirkwood. Ale nikt nie mógł jej dorównać, Shelobowi wielkiemu, ostatniemu dziecku Ungolianta, by dręczyć nieszczęśliwy świat.

istnieje wiele przymiotników zaczynających się na un-, myślę, że Tolkien powinien był je całkowicie pokochać (ja też, jako nie rodzimy, nienaturalny, lub niezwiązany, mówiący po angielsku i czytający): niewdzięczny, nienadający się, niezbadany, niezrównoważony, nieziemski, niezauważony, unhopeful i tak dalej.

też próbowałem przeprowadzić analizę klastra. W analizie tekstowej proces klastrowania tworzy mapy wskazujące, które słowa są używane w ścisłej bliskości, z którymi inne słowa: mapa umożliwia zindywidualizowanie niektórych obszarów treści, które mają wspólne powinowactwo leksykalne, a w konsekwencji analiza ta pozwala badaczowi dostrzec główne tematy obecne w analizowanym tekście.

z analizy klastrowej tekstu LOTR można łatwo wyodrębnić cztery główne klasy; dwie klasy (te znajdujące się w górnej części mapy) są z kolei podzielone na dwie podklasy.

  • Klasa Czerwona odnosi się do podróży Froda i sama do Mordoru. Jak łatwo zauważyć, Ta gromadka jest wypełniona krótkimi,” pękniętymi ” słowami dotykającymi desperackich wysiłków moralnych i fizycznych pary, w ich dążeniu do góry Zagłady i opustoszałego krajobrazu wulkanicznych pustkowi. Wiele części ciała, wiele czasowników wyrażających ból, wiele onomatopei (ręka, syk, Głowa, moment, Gollum, przeciąganie, sapanie, szyja, krok, Plecy, noga, krzyk, Shagrat, grind, Ork, ohydny, ręka, płacz, kolano, chwyt, dźwięk, oddech, oko, po omacku, ostrze, walka, krzyk, bicz, krawat, smród, pełzanie).
  • Klasa Bladozielona i akwamaryna nawiązuje do podróży towarzyskich. W szczególności, Zielona podklasa nawiązuje do „właściwej” podróży i jest wypełniona lemmami zajmującymi się ruchem, a kojarzy się ze zmęczeniem i trudnymi wędrówkami (stok, wzgórze, droga, wspinaczka, strumień, dół, Mila, drzewo, bok, Góra, ścieżka, Brzeg, stroma, Dolina, Chmura, wzrost, grzbiet, wiatr, wąski, skała…). Z drugiej strony, podklasa akwamaryna dotyczy „magicznych interludii”, które urozmaicają podróż: w szczególności Starego Lasu, Lórien i szarych przystani. Ta podklasa jest wypełniona lemmami, które nawiązują do kolorów i Natury, i są konotowane przez piękno, klarowność i świeżość (srebro, liść, biały, zielony, gwiazda, połysk, śpiew, kwiat, włosy, złotówka, złoto, woda, słońce, słodkie, drzewo , światło, Żółty, Jasny, statek, jasny, Fontanna, basen, żagiel, szary, morze, piana, piosenka, lato, złoty, wiatr, klejnot, Rosa, deszcz, niebieski, świeca, ciepły, smukły, migotanie).
  • szara Klasa odnosi się do Shire i Bree, a jest wypełniona przytulnymi, domowymi, praktycznymi, codziennymi słowami i słowami o komunikacji międzyludzkiej: Hobbici to w końcu bardzo gadatliwi ludzie. Jest to słownictwo „sytuacji wyjściowej, tak spokojnej i nudnej”, które można dostrzec w każdej opowieści o przygodach. Niemniej jednak, ta klasa zawiera kilka małych pełzających słów, przewidując kształt rzeczy, które nadejdą (Strider, dobry, Bree, myśleć, mówić, przypuszczać, wiedzieć, historia, jedzenie , Sir, martwić, ugryźć, boi, biznes, Prom, zapytać, powiedzieć, deal, prawdziwy, człowiek, śmiech, czas, queer, właściciel, inn, przygoda , aktualności, romans).
  • Klasa niebiesko-fioletowa odnosi się do właściwej wojny ludzi przeciwko Sauronowi. W szczególności Klasa Niebieska nawiązuje do złego wpływu pierścienia, jego ofiar i wrogów (Sauron, Boromir, moc, wróg, zło, Isildur, pierścień, Saruman, Elrond, mądry, Minas Tirith, Moria, niebezpieczeństwo, zniszczyć, zginąć, lore, cel, Mordor, sługa, wątpliwość, strach, zmora, mądrość, nosiciel, los). Klasa Purpurowa nawiązuje do rzeczywistych działań wojennych, samych bitew w Rohanie i Gondorze (Lord, King, Éomer, Théoden, Éowyn, ride, man, Denethor, son, city, Gondor, house, Faramir, Beregond, heal, battle, Rohan, Steward, Mark, Imrahil, captain, Aragorn, war, prince, knight, warden, horse, love , sister, Edoras, healer, service, honour , bid, woman, haste).

tyle słów w książkach LOTRA. Mam nadzieję, że moja odpowiedź jest interesująca dla fanów Tolkiena, a może i dla uczonych. Jeśli ktoś ma jakąś ciekawość nie związaną bezpośrednio z odpowiedzią, wynikami analiz, czy metodologią, zapraszam do DM me.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.