興味深い質問。
私はワードクランチャーと統計学者なので、私はそれに答えることができると思います。 私は私のPDF版から完全なLOTRテキストを蒸留しました、私はデジタルテキスト(ページ番号、ヘッダーとフッター、ラップされた行と単語など)から明白な迷惑を排除しました、と私はテキスト分析の専門的なソフトウェアでそれを扱ってきました。 注意してください:私のPDF版にはそれらが欠けているので、私はTolkienの序文を分析に取り入れましたが、付録ではありません。
LOTRテキストには482,058個の出現があり、12,972個の異なる補題があります。 概念をより明確にするために:テキストでは、すべての単語はもちろん、複数回使用することができます:LOTRでは、補題とは19,987回使用されます。
LOTRでは、トールキンは4,470ハパックスを使用しています(hapax、一度だけ、一度だけを意味するギリシャ語の単語は、テキスト内で一度だけ使用される単語です):それは、3つのうち一つの単語(より正確には34.51%)が本の中で一度だけ使用されていることを意味します。これは本当に膨大な量のハパックスであり、そのような大規模なテキストのために:トールキンの偉大な語彙マスターシップの兆候です(もちろん、いくつかのハパックスはエルフ、ドワーフまたはorkishの言葉: それはあまりにもトールキンの偉大な語彙マスターシップの兆候ではありませんか?).
接続詞、前置詞、モーダル副詞および時間副詞、冠詞および代名詞を除いて、最も使用される単語は何ですか? リストは特に驚くべきことではありません:
- frodo1991
- long1351
- sam1290
- great1283
- down1203
- like1146
- 1107
- man1106
- back1007
- know938
- day841
- fall827
- time825
- ダーク818
- ウェイ800
- find790
- eye790
- pass783
- hand780
- leave760
- スタンド757
- hear756
- well749
- aragorn722
- pippin685
- light683
- lie679
- turn667
- thing665
- speak642
- ring639
- tree637
- road628
- merry603
私は具体的なものを指すこのリストに含まれている三つのsubstantivesがリング(明らかに)、木と道路であるという事実が好きです。 ツリー! それはこれはどのように素敵ですか? ツリーはLOTRの中で最も使用される単語の一つであり、物事の三つのトップの名前の一つです! 木の恋人自身であること、私はこの結果をたくさん楽しんでいます。
運動に関する多くの言葉(動詞、前置詞、実体)、もちろん(LOTRは結局のところ、旅についての本です)、人間のコミュニケーションに関する多くの動詞、そして感覚を通
嘘についての方法論的メモ:私が分析に使用したソフトウェアは、補題のプロセスを実行します(分析の前に、各単語は辞書補題に変わります:複数名詞: これは、データ行列を減少させ、結果をあまり分散させず、より意味のあるものにするためである)。 しかし、ソフトウェアは意味分析を実行することができないので、現在の形の位置、位置から位置、過去の完全な形の位置、位置から位置までを伝えることはできません。 とにかく、ソフトウェアはlieの下で、373lay、110lie、89lie、84lie、22lain、そしてちょうど1lieのさらなる出現をlemmatisedました。 私たちは、嘘はLOTRの物語の開発に知られていないプロセスであると言うことができます。
hapaxを分析することも非常に興味深いでしょう:例えば、(ちょうどスプーンで海を空にしようとしている)、比喩的な意味で使用される一つの税の言葉があ:
‘あなたは嘘をついている”とWormtongueは言った。 “そして、この剣はあなたのマスター自身が私の保管に与えました。’
‘そして、彼は今、再びあなたのそれを必要としています’とThéodenは言いました。 “それはあなたを不快にしていますか?’
‘は確かにそうではありません。 主は”、Wormtongueは言いました。 “私はあなたとあなたのために最善のように気にすることができます。 しかし、自分自身を疲れ、またはあまりにも重くあなたの強さを課税しないでください。 他の人がこれらの厄介なゲストに対処してみましょう。
そして、ただ一つのろくでなしの言葉があり、Ungoliantの子孫と呼ばれています:
はるかに広い彼女の小さなbroods、悲惨な仲間のできそこない、彼女自身の子孫は、彼女がスルーしていること、グレンからグレンに、エフェルドゥースから東の丘に、Dol GuldurとMirkwoodの堅牢さに広がった。 しかし、誰も不幸な世界を悩ませるために彼女、シェロブUngoliantの偉大な、最後の子供に匹敵することができませんでした。
Un-で始まる形容詞がたくさんありますが、私はトールキンがそれらを完全に愛していたはずだと思います(私は、ネイティブではない、またはunnative、またはunnate、英語のスピーカーと読者として):恩知らず、unfading、未踏、理不尽、平穏、この世の、unheeding、unhopefulなど。
私もクラスター分析を実行しようとしました。 テキスト分析では、クラスタリングプロセスは、どの単語が他の単語と厳密に近接して使用されているかを示すマップを生成します: このマップは、語彙的親和性を共有するいくつかのコンテンツ領域を個別化することを可能にし、その直接的な結果として、この分析は、分析されたテキ
LOTRテキストのクラスター分析から4つの主要なクラスを簡単に見つけることができます。2つのクラス(マップの上部にあるクラス)は、順番に2つのサブクラスに分割されます。
- レッドクラスはフロドとサムのモルドールへの旅を指しています。 あなたが簡単に見ることができるように、このクラスタは、カップルの絶望的な道徳的、物理的な努力に触れる短い、”ひびの入った”言葉で満たされてい 体の部分の多く、痛みを表現する動詞の多く、擬音語の多く(手、ヒス、頭、瞬間、ゴラム、ドラッグ、あえぎ、首、ステップ、バック、脚、叫び、Shagrat、グラインド、オーク、恐ろしい、腕、叫び、膝、グリップ、音、息、目、模索、ブレード、闘争、叫び声、鞭、ネクタイ、悪臭、クロール)。
- 淡いグリーンとアクアマリンのクラスは、フェローシップの旅を指します。 特に、緑のサブクラスは、”適切な”旅を暗示し、それは運動を扱う補題で満たされ、疲労と困難なハイキング(斜面、丘、道路、登る、ストリーム、ダウン、マイル、木、側、山、パス、銀行、急な、谷、雲、上昇、尾根、風、狭い、岩…)によって暗示されています。 一方、アクアマリンのサブクラスは、旅をスパングル”魔法の間奏”を扱っています:特に、古い森、Lórienと灰色の避難所。 このサブクラスは、色と自然を暗示し、美しさ、明快さ、新鮮さ(銀、葉、白、緑、星、輝き、歌う、花、髪、ゴールドベリー、金、水、太陽、甘い、木、光、黄色、クリア、船、明るい、噴水、盆地、帆、灰色、海、泡、歌、夏、金、風、宝石、露、雨、青、キャンドル、暖かい、細い、きらめき)によって暗示されている補題で満たされています。
- 灰色のクラスはシャイアとブリーを指し、居心地の良い、家庭的な、実用的な、日常の言葉、そして人間のコミュニケーションに関する言葉で満たされています: ホビットは、すべての後に、非常におしゃべりな人です。 それはあなたがすべての冒険の物語で見つけることができる”開始状況、とても穏やかで退屈な”の語彙です。 それにもかかわらず、このクラスは、来るものの形を予見し、いくつかの小さな忍び寄る言葉が含まれています(ストライダー、良い、ブリー、考える、話す、仮定、知っている、話、食べ物、先生、心配、一口、恐れて、ビジネス、フェリー、尋ねる、伝える、取引、本当の、仲間、笑い、時間、奇妙な、家主、旅館、冒険、ニュース、事件)。
- 青と紫のクラスは、サウロンに対する男性の適切な戦争を指します。 特に、ブルークラスは、その犠牲者とその敵(サウロン、ボロミア、パワー、敵、悪、Isildur、リング、サルマン、Elrond、賢明な、ミナスティリス、モリア、危険、破壊、滅びる、伝承、目的、モルドール、サーバント、疑い、恐怖、悩みの種、知恵、ベアラ、運命)と、リングの邪悪な影響を暗示しています。 紫色のクラスは、実際の戦争行為、ローハンとゴンドールの戦い(主、王、Éomer、Théoden、Éowyn、乗り物、男、Denethor、息子、都市、ゴンドール、家、Faramir、Beregond、癒し、戦い、ローハン、スチュワード、マーク、Imrahil、キャプテン、Aragorn、戦争、王子、騎士、監視員、馬、愛、姉妹、Edoras、ヒーラー、サービス、名誉、入札、女性、速攻)を暗示しています。
だから、LOTRの本の中でどのように多くの単語のために長いです。 うまくいけば、私の答えはTolkienのファンや、おそらく学者にとって興味深いものです。 誰かが答えに直接関係していない好奇心、分析の結果、または方法論について興味がある場合は、私にDMを送ってください。