흥미로운 질문.
나는 단어 철커덕 및 통계 해요,그래서 나는 그것을 대답 할 수 있다고 생각. 나는 디지털 텍스트(페이지 번호,머리글 및 바닥 글,줄 바꿈 된 줄 및 단어 등)에서 명백한 쓰레기를 제거하고 텍스트 분석 전문 소프트웨어로 처리했습니다. 주의:톨킨의 서문을 분석한 적이 있지만 부록은 아닙니다.
로트 텍스트에는 482,058 개의 발생이 있으며 12,972 개의 고유 보조 정리가 있습니다. 개념을 명확하게하기 위해:텍스트에서,모든 단어는 물론,두 번 이상 사용할 수 있습니다:로트 르,보조 정리 및 19,987 번 사용된다;그 19,987 발생 및 1 보조 정리한다.
로트르에서는 톨킨이 4,470 하팍스(헬라어 한 번,한 번만 의미하는 헬라어 단어는 텍스트에서 한 번만 사용됨)를 사용합니다.이 단어는 세 단어 중 한 단어(34.51%,더 정확하게 말하면)가 책에서 한 번만 사용된다는 것을 의미합니다.엘프,드워프 또는 오크 단어: 그것도 톨킨의 위대한 어휘 마스터 쉽의 표시 아닌가요?).
접속사,전치사,모달 및 시간 부사,기사 및 대명사를 제외하고 가장 많이 사용되는 단어는 무엇입니까? 이 목록은 특히 놀라운 일이 아닙니다:2015 년 11 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 1007
나는 구체적인 것을 가리키는이 목록에 포함 된 세 가지 내용이 반지(분명히),나무 및 도로라는 사실을 좋아합니다. 나무! 이 얼마나 좋은가요? 나무는 로트 르에서 가장 많이 사용되는 단어 중 하나이며,사물의 세 가지 상위 이름 중 하나입니다! 나무 애인 나 자신 이기 때문에,나는 이 결과를 많게 즐긴다.
운동에 관한 많은 단어(동사,전치사 및 실체),물론(로트는 여행에 관한 책이다),인간의 의사 소통에 관한 많은 동사,그리고 감각을 통해 세상을 인식하는 과정에 관한 몇 가지 단어가 있습니다:눈,어둠,빛,듣기.
거짓말에 대한 방법론 참고:내가 분석에 사용 된 소프트웨어는 나그네 쥐의 과정을 수행(분석 전에,각 단어는 사전 보조 정리로 전환:단수에 복수 명사,부정사 형태로 복합 동사: 이것은,데이터 매트릭스를 감소시키고,결과가 덜 분산하고,더 의미 있도록하기 위해). 그러나 소프트웨어는 의미 론적 분석을 수행 할 수 없으므로 현재의 형태 평신도,평신도,과거의 완벽한 형태 평신도,거짓말부터 말할 수 없습니다. 나는 명확성을 수행 했어야했지만,이 대답의 목적을 크게 과장했을 것이라고 생각합니다:어쨌든,소프트웨어는 373 거짓말,110 거짓말,89 거짓말,84 거짓말,22 거짓말 그리고 단지 1 거짓말. 우리는 거짓말이 로트르 이야기 개발에 알려지지 않은 과정이라고 말할 수 있습니다.
너무 하팍스를 분석하는 것은 매우 흥미로운 일이 될 것이다:예를 들어,(그냥 숟가락으로 바다를 비우려고),하나의 세금 단어가있다,비유적인 의미에서 사용:
‘당신은 거짓말을합니다. “네 주인이 친히 내 소유에 준 이 검.’
‘그리고 그는 이제 다시 당신에게 그것을 요구합니다. “그게 당신을 불쾌하게합니까?’
‘확실히 아닙니다. 주님,웜통게가 말했다. “나는 당신과 당신의 것을 내가 할 수있는 한 최선을 다합니다. 그러나 자신을 지치게 하지 말며,자신의 힘을 너무 과세하지 말아라. 다른 사람들이 이러한 귀찮은 손님을 처리 할 수 있습니다.
그리고 단 하나의 자식 단어가 있습니다.:
멀리 그녀의 작은 무리,비참한 동료의 놈들,그녀가 죽인 그녀의 자손은 글렌에서 글렌으로,에펠 디에서 동쪽 언덕까지,돌 굴두르와 머크 우드의 금식까지 퍼졌습니다. 그러나 아무도 그녀를 경쟁 할 수 없었다,위대한 셸롭,불굴의 마지막 아이 문제 불행한 세계에.
나는 톨킨이 그들을 완전히 사랑 했어야한다고 생각한다(나는 원어민이 아니거나 비 네이티브 또는 비 네이트,영어 연사 및 독자로서):배은망덕하지 않고,빛이 바래지 않고,탐험되지 않고,비논리적이며,사건이 없으며,소름 끼치며,주의를 기울이지 않고,도움이되지 않는 등.
클러스터 분석도 수행하려고했습니다. 텍스트 분석에서 클러스터링 프로세스는 다른 단어와 엄격하게 근접하여 사용되는 단어를 나타내는 맵을 생성합니다: 지도는 우리가 어휘 친화력을 공유하는 일부 콘텐츠 영역을 개별화 할 수 있습니다;그리고,그 직접적인 결과,이 분석은 분석 텍스트에 존재하는 주요 주제를 발견하는 학자를 할 수 있습니다.
두 개의 클래스(맵의 상단에 있는 클래스)가 차례로 두 개의 하위 클래스로 분할됩니다.
- 레드 클래스는 모르도르로 프로도와 샘의 여행을 의미한다. 당신은 쉽게 볼 수 있듯이,이 클러스터는 짧은 가득,부부의 필사적 인 도덕적,물리적 노력에 감동”금이”단어,둠 산을 향해 자신의 이동에,그리고 화산 황무지의 황량한 풍경에. 많은 신체 부위,고통을 표현하는 많은 동사,많은 의성어(손,히스,머리,순간,골룸,드래그,헐떡 거림,목,계단,등,다리,외침,샤 그라트,갈기,오크,끔찍한,팔,외침,무릎,그립,소리,호흡,눈,더듬기,칼날,투쟁,소리 지르기,채찍,넥타이,악취,크롤링).
- 옅은 녹색과 아쿠아마린 클래스는 펠로우쉽 여행을 말합니다. 특히,녹색 하위 클래스는”적절한”여행을 암시하며 움직임을 다루는 보조 정리로 가득 차 있으며 피로와 어려운 하이킹(경사,언덕,도로,등반,시내,아래,마일,나무,측면,산,경로,은행,가파른 계곡,구름,상승,능선,바람,좁은,바위…). 한편,아쿠아마린 서브클래스는 여행을 반짝이게 하는”마법의 막간”을 다루고 있다. 이 하위 클래스는 색상과 자연을 암시하는 보조 정리로 가득 차 있으며 아름다움,선명도 및 신선도(실버,리프,화이트,그린,스타,샤인,노래,꽃,머리,골드 베리,골드,물,태양,달콤한,나무,빛,노란색,맑은,배,밝은,분수,분지,항해,회색,바다,거품,노래,여름,황금,바람,보석,이슬,비,파랑,촛불,따뜻한,날씬한,쉬머).
- 그레이 클래스는 샤이어와 브리를 말하며 아늑하고 가정적이며 실용적이며 일상적인 단어와 인간의 의사 소통에 관한 단어로 가득 차 있습니다: 호빗은 결국 매우 수다 사람들이다. 그것은 당신이 모든 모험 이야기에서 발견 할 수있는”시작 상황,너무 조용하고 지루한”의 어휘입니다. 그럼에도 불구하고,이 클래스는 몇 가지 작은 들어온다 단어를 포함,올 사물의 모양을 예견(스트라이더,좋은,브리,생각,이야기,가정,알고,이야기,음식,선생님,걱정,물린,두려워,사업,페리,물어,말,거래,진짜,동료,웃음,시간,동성애,집주인,여관,모험,뉴스,사건).
- 파란색과 보라색 계급은 사우론에 대한 인간의 적절한 전쟁을 의미한다. 특히 블루 클래스는 피해자와 적(사우론,보로미르,권력,적,악,이실 두르,반지,사루만,엘론드,와이즈,미나스 티리스,모리아,위험,파괴,멸망,지식,목적,모르도르,하인,의심,두려움,베인,지혜,무기명,운명)과 함께 반지의 사악한 영향을 암시합니다. 보라색 계급은 실제 전쟁 행위,로한과 곤도르에서의 전투(주님,왕,소장,일,고든,고든,라이드,남자,데네 도르,아들,도시,곤도르,집,파라미르,베레 곤드,치유,전투,로한,청지기,마크,임라 힐,선장,아라곤,전쟁,왕자,기사,소장,말,사랑,자매,에도라스,치료자,봉사,명예,입찰,여자,서두름)를 암시합니다.
도에 대한 긴 얼마나 많은 단어에서 뽑 책입니다. 바라건대,내 대답은 톨킨의 팬들과 어쩌면 학자들에게 관심이 있습니다. 만약 누군가가 대답,분석 결과 또는 방법론과 직접적으로 관련이없는 호기심을 가지고 있다면,나를 자유롭게 느끼십시오.