¿Cuántas palabras hay en los libros de LOTR? – Quora

pregunta Interesante.

Soy un calculador de palabras y estadístico, así que creo que puedo responder. He destilado texto completo de LOTR de mi edición en PDF, he eliminado la basura obvia del texto digital (números de página, encabezados y pies de página, líneas y palabras envueltas, etc.), y lo he tratado con un software profesional de análisis de texto. Cuidado: He incluido el prólogo de Tolkien en el análisis, pero no en los Apéndices, ya que mi edición en PDF carece de ellos.

El texto LOTR tiene 482.058 ocurrencias, con 12.972 lemas distintos. Para hacer el concepto más claro: en un texto, cada palabra se puede usar más de una vez, por supuesto: en el LOTR, el lema y se usa 19,987 veces; eso hace 19,987 ocurrencias y 1 lema.

En LOTR, Tolkien utiliza 4.470 hapaxes (un hapax, una palabra griega que significa una sola vez, por una sola vez, es una palabra que se usa solo una vez en un texto): eso significa que una palabra de cada tres (34,51%, para ser más precisos) se usa solo una vez en el libro; esto es realmente una gran cantidad de hapaxes, para un texto tan masivo: un signo de la gran maestría léxica de Tolkien (algunos hapaxes, por supuesto, son palabras élficas, Enanas u orkish: ¿no es una señal de la gran maestría léxica de Tolkien también?).

¿Cuáles son las palabras más utilizadas, excluyendo conjunciones, preposiciones, adverbios modales y temporales, artículos y pronombres? La lista no es particularmente sorprendente:

  1. frodo1991
  2. long1351
  3. sam1290
  4. great1283
  5. down1203
  6. like1146
  7. gandalf1123
  8. think1107
  9. man1106
  10. back1007
  11. know938
  12. day841
  13. fall827
  14. time825
  15. dark818
  16. way800
  17. find790
  18. eye790
  19. pass783
  20. hand780
  21. leave760
  22. stand757
  23. hear756
  24. well749
  25. aragorn722
  26. pippin685
  27. light683
  28. lie679
  29. turn667
  30. thing665
  31. speak642
  32. ring639
  33. tree637
  34. road628
  35. merry603

Me gusta el hecho de que los tres sustantivos contenidos en esta lista que apuntan a cosas concretas son ring (obviamente), tree y road. Árbol! ¿Qué tan bonito es esto? Árbol es una de las palabras más utilizadas en LOTR, y uno de los tres nombres principales de las cosas! Al ser un amante de los árboles, disfruto mucho de este resultado.

Hay muchas palabras (verbos, preposiciones y sustantivos) relacionadas con el movimiento, por supuesto (LOTR es un libro sobre un viaje, después de todo), muchos verbos relacionados con la comunicación humana, y algunas palabras relacionadas con el proceso de percibir el mundo a través de los sentidos: ojos, oscuridad, luz, oído.

Una nota metodológica sobre lie: el software que utilicé para el análisis realiza un proceso de lematización (antes del análisis, cada palabra se convierte en su lema de diccionario: sustantivos plurales a singulares y verbos conjugados a infinitivos: esto, con el fin de reducir la matriz de datos y hacer que los resultados sean menos dispersos y más significativos). PERO el software no es capaz de realizar un análisis semántico, por lo que no puede distinguir la forma presente de lay, de to lay, de la forma pasada perfecta de lay, de to lie. Debería haber realizado una desambiguación, pero creo que eso habría exagerado en gran medida el propósito de esta respuesta: de todos modos, el software ha lematizado bajo mentira las ocurrencias posteriores: 373 mentira, 110 mentira, 89 mentiras, 84 mentiras, 22 mentiras y solo 1 mentira. Podemos decir que mentir es un proceso no desconocido para el desarrollo narrativo de LOTR.

Sería muy interesante analizar el hapax también: por ejemplo, (simplemente tratando de vaciar el mar con una cuchara), hay una palabra de impuesto, utilizada en un sentido figurado:

‘Mientes», dijo Wormtongue. Y esta espada que tu señor entregó a mi custodia.»

«Y ahora te lo exige de nuevo», dijo Théoden. ¿Eso te desagrada?’

‘Seguramente no. señor, dijo Lengua de Gusano. Me preocupo por ti y por los tuyos lo mejor que puedo. Pero no se canse, ni imponga demasiado sus fuerzas. Deja que otros se ocupen de estos molestos invitados.

Y solo hay una palabra bastarda, referida a la descendencia de Ungoliant:

A lo largo y ancho, sus crías menores, bastardos de sus compañeros miserables, su propia descendencia, que mató, se extendieron de cañada en cañada, desde el Ephel Dúath hasta las colinas orientales, hasta Dol Guldur y la rapidez del Bosque Negro. Pero nadie podía rivalizar con ella, Shelob, el gran y último hijo de Ungoliant, para perturbar al infeliz mundo.

Hay un montón de adjetivos que comienzan con no-, creo que Tolkien debería haberlos amado por completo (yo también, como hablante y lector de inglés no nativo, no innato o inconnato): ingratos, inmarcesibles, inexplorados, irrazonables, sin incidentes, sobrenaturales, sin sentido, sin esperanza, y así sucesivamente.

También he intentado realizar un análisis de clúster. En un análisis textual, el proceso de agrupación produce mapas que indican qué palabras se usan en estrecha proximidad con qué otras palabras: el mapa nos permite individualizar algunas áreas de contenido que comparten afinidad léxica; y, en consecuencia directa de ello, este análisis permite al estudioso identificar los principales temas presentes en el texto analizado.

Puede detectar fácilmente cuatro clases principales del análisis de clústeres del texto de LOTR; dos clases (las ubicadas en la parte superior del mapa) se dividen a su vez en dos subclases.

  • La Clase Roja se refiere al viaje de Frodo y Sam a Mordor. Como puedes ver fácilmente, este grupo está lleno de palabras cortas y «agrietadas» que tocan los desesperados esfuerzos morales y físicos de la pareja, en su movimiento hacia el Monte del Destino, y en el desolado paisaje del páramo volcánico. Muchas partes del cuerpo, muchos verbos que expresan dolor, muchas onomatopeyas (mano, siseo, cabeza, momento, Gollum, arrastre, jadeo, cuello, paso, espalda, pierna, grito, Shagrat, moler, orco, horrible, brazo, llanto, rodilla, agarre, sonido, respiración, ojo, tientas, espada, lucha, grito, látigo, corbata, hedor, gatear).
  • La Clase Verde Pálido y Aguamarina se refiere a los viajes de la Comunidad. En particular, la subclase Verde alude al viaje» adecuado», y está llena de lemas relacionados con el movimiento, y connotada por la fatiga y el senderismo difícil (pendiente, colina, carretera, subida, arroyo, bajada, milla, árbol, costado, montaña, camino, orilla, empinado, valle, nube, subida, cresta, viento, estrecho, roca)). Por otro lado, la subclase Aguamarina se ocupa de los «interludios mágicos» que salpican el viaje: en particular, el Bosque Viejo, Lórien y los Paraísos Grises. Esta subclase está llena de lemas que aluden a los colores y a la Naturaleza, y están connotados por belleza, claridad y frescura (plata, hoja, blanco, verde, estrella, brillo, canto, flor, cabello, Mora dorada, oro, agua, sol, dulce, árbol, claro , amarillo, claro, barco, brillante, fuente, lavabo, vela, gris, mar, espuma, canción, verano, dorado, viento, joya, rocío, lluvia, azul, vela, cálido, delgado, brillo).
  • La Clase Gris se refiere a la Comarca y Bree, y está llena de palabras acogedoras, hogareñas, prácticas y cotidianas, y con palabras sobre la comunicación humana: Después de todo, los hobbits son personas muy habladoras. Es el vocabulario de la «situación de partida, tan tranquila y aburrida» que puedes encontrar en cada cuento de aventuras. Sin embargo, esta Clase contiene algunas pequeñas palabras rastreras, previendo la forma de las cosas por venir (Strider, bueno, Bree, pensar, hablar, suponer, saber, historia , comida, Señor, preocuparse, morder, temeroso, negocios, transbordador, preguntar, contar, tratar, real, compañero, reír, tiempo, extraño, casero, posada , aventura, noticias, aventura).
  • La Clase Azul y Púrpura se refiere a la Guerra de Hombres contra Sauron. En particular, la Clase Azul alude a la influencia maligna del Anillo, con sus víctimas y sus enemigos (Sauron, Boromir, poder, enemigo, mal, Isldur, anillo, Saruman, Elrond, sabio, Minas Tirith, Moria, peligro, destruir, perecer, tradición, propósito, Mordor, sirviente, duda, miedo, pesadilla, sabiduría, portador, destino). La Clase Púrpura alude a los actos reales de guerra, las mismas batallas en Rohan y en Gondor (Señor, Rey, Éomer, Théoden, Éowyn, paseo, hombre, Denethor, hijo, ciudad, Gondor, casa, Faramir, Beregond, sanar, batalla, Rohan, Mayordomo, Marcos, Imrahil, capitán, Aragorn, guerra, príncipe, caballero, guardián, caballo, amor , hermana, Edoras, sanador, servicio, honor , oferta, mujer, prisa).

Hasta la cantidad de palabras en los libros de LOTR. Espero que mi respuesta sea de algún interés para los fans de Tolkien y, tal vez, para los académicos. Si alguien tiene alguna curiosidad no relacionada directamente con la respuesta, sobre los resultados del análisis o sobre las metodologías, siéntase libre de DM me.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.