Combien de mots y a-t-il dans les livres du LOTR ? – Quora

Question intéressante.

Je suis un croqueur de mots et un statisticien, donc je pense pouvoir y répondre. J’ai distillé du texte LOTR complet à partir de mon édition PDF, j’ai éliminé les déchets évidents du texte numérique (numéros de page, en-têtes et pieds de page, lignes enveloppées et mots, etc.), et je l’ai traité avec un logiciel professionnel d’analyse textuelle. Attention : j’ai pris l’avant-propos de Tolkien dans l’analyse, mais pas les Annexes, car mon édition PDF en manque.

Le texte du LOTR comporte 482 058 occurrences, avec 12 972 lemmes distincts. Pour rendre le concept plus clair: dans un texte, chaque mot peut être utilisé plus d’une fois, bien sûr: dans le LOTR, le lemme et est utilisé 19 987 fois; cela fait 19 987 occurrences et 1 lemme.

Dans LOTR, Tolkien utilise 4 470 hapaxes (un hapax, un mot grec signifiant une fois, pour une seule fois, est un mot utilisé une seule fois dans un texte): cela signifie qu’un mot sur trois (34,51%, pour être plus précis) n’est utilisé qu’une seule fois dans le livre; c’est vraiment une énorme quantité d’hapaxes, pour un texte aussi massif: un signe de la grande maîtrise lexicale de Tolkien (quelques hapaxes, bien sûr, sont des mots elfiques, Nains ou Orques: n’est-ce pas aussi un signe de la grande maîtrise lexicale de Tolkien?).

Quels sont les mots les plus utilisés, à l’exclusion des conjonctions, des prépositions, des adverbes modaux et temporels, des articles et des pronoms ? La liste n’est pas particulièrement surprenante:

  1. frodo1991
  2. long1351
  3. sam1290
  4. grand1283
  5. down1203
  6. like1146
  7. gandalf1123
  8. think1107
  9. man1106
  10. back1007
  11. know938
  12. day841
  13. fall827
  14. time825
  15. dark818
  16. way800
  17. find790
  18. eye790
  19. pass783
  20. hand780
  21. leave760
  22. stand757
  23. hear756
  24. well749
  25. aragorn722
  26. pippin685
  27. light683
  28. lie679
  29. turn667
  30. thing665
  31. speak642
  32. ring639
  33. tree637
  34. road628
  35. merry603

J’aime le fait que les trois substantifs contenus dans cette liste qui pointent vers des choses concrètes sont ring (évidemment), tree et road. Arbre! C’est bien comme ça ? Arbre est l’un des mots les plus utilisés dans LOTR, et l’un des trois noms principaux des choses! Étant moi-même un amoureux des arbres, j’apprécie beaucoup ce résultat.

Il y a beaucoup de mots (verbes, prépositions et substantifs) concernant le mouvement, bien sûr (LOTR est un livre sur un voyage, après tout), beaucoup de verbes concernant la communication humaine, et quelques mots concernant le processus de perception du monde à travers les sens: les yeux, les ténèbres, la lumière, l’ouïe.

Une note méthodologique sur le mensonge : le logiciel que j’ai utilisé pour l’analyse effectue un processus de lemmatisation (avant l’analyse, chaque mot est transformé en son lemme dictionnaire : les noms du pluriel au singulier, et les verbes conjugués à l’infinitif: ceci, afin de réduire la matrice de données et de rendre les résultats moins dispersés et plus significatifs). MAIS le logiciel n’est pas capable d’effectuer une analyse sémantique, il ne peut donc pas dire la forme actuelle, de à, de la forme parfaite passée, de à mentir. J’aurais dû effectuer une désambiguïsation, mais je pense que cela aurait largement exagéré le but de cette réponse: de toute façon, le logiciel a lemmatisé sous lie les autres occurrences: 373 lay, 110 lie, 89 lies, 84 lies, 22 lain et juste 1 lied. On peut dire que le mensonge est un processus qui n’est pas inconnu du développement narratif du LOTR.

Il serait très intéressant d’analyser aussi l’hapax: par exemple, (juste essayer de vider la mer avec une cuillère), il y a un mot fiscal, utilisé au sens figuré:

‘ Tu mens « , lui dit Wormtongue. Et cette épée que ton maître lui-même a donnée à ma garde. »

 » Et il l’exige maintenant de vous à nouveau « , dit Théoden. Cela vous déplaît-il ?’

‘ Certainement pas. seigneur », dit Wormtongue. Je prends soin de vous et des vôtres du mieux que je peux. Mais ne vous fatiguez pas, ou ne taxez pas trop votre force. Laissez les autres s’occuper de ces invités fâcheux.

Et il n’y a qu’un seul mot bâtard, faisant référence à la progéniture d’Ungoliant:

Au loin, ses petites couvées, bâtards des misérables compagnons, sa propre progéniture, qu’elle tua, se sont étendues de glen en glen, de l’Ephel Dúath aux collines orientales, à Dol Guldur et aux jeûnes de Mirkwood. Mais personne ne pouvait rivaliser avec elle, Shelob le Grand, dernier enfant d’Ungoliant à troubler le monde malheureux.

Il y a beaucoup d’adjectifs commençant par un-, je pense que Tolkien aurait dû les aimer complètement (moi aussi, en tant que locuteur et lecteur anglais non natif, ou non natif, ou non connecté): ingrat, indéfectible, inexploré, déraisonnable, sans incident, surnaturel, insalubre, sans espoir, etc.

J’ai également essayé d’effectuer une analyse de cluster. Dans une analyse textuelle, le processus de regroupement produit des cartes qui indiquent quels mots sont utilisés à proximité stricte des autres mots: la carte nous permet d’individualiser certaines zones de contenu qui partagent des affinités lexicales; et, en conséquence directe, cette analyse permet au chercheur de repérer les principaux thèmes présents dans le texte analysé.

Vous pouvez facilement repérer quatre classes principales à partir de l’analyse de cluster du texte du LOTR; deux classes (celles situées dans la partie supérieure de la carte) sont, à leur tour, divisées en deux sous-classes.

  • La Classe Rouge fait référence au voyage de Frodon et Sam en Mordor. Comme vous pouvez facilement le voir, cet amas est rempli de mots courts et « fissurés » touchant aux efforts moraux et physiques désespérés du couple, dans leur mouvement vers le mont Doom, et sur le paysage désolé de la friche volcanique. Beaucoup de parties du corps, beaucoup de verbes exprimant la douleur, beaucoup d’omatatopées (main, sifflement, tête, moment, Gollum, traîner, haleter, cou, pas, dos, jambe, crier, Shagrat, broyer, orc, hideux, bras, pleurer, genou, prise, son, souffle, œil, tâtonner, lame, lutte, crier, fouet, cravate, puanteur, ramper).
  • La classe Vert Pâle et Aigue-marine fait référence aux voyages de la Fraternité. En particulier, la sous-classe Verte fait allusion au « bon » voyage, et elle est remplie de lemmes traitant du mouvement, et connoté par la fatigue et la randonnée difficile (pente, colline, route, montée, ruisseau, descente, mile, arbre, flanc, montagne, sentier, rive, raide, vallée, nuage, montée, crête, vent, étroit, rocher…). D’autre part, la sous-classe Aigue-marine traite des « intermèdes magiques » qui jalonnent le voyage: en particulier, la Vieille Forêt, la Lórien et les Paradis gris. Cette sous-classe est remplie de lemmes qui font allusion aux couleurs et à la nature, et sont connotés par la beauté, la clarté et la fraîcheur (argent, feuille, blanc, vert, étoile, brillance, chant, fleur, cheveux, mûrier, or, eau, soleil, doux, arbre, lumière, jaune, clair, navire, brillant, fontaine, bassin, voile, gris, mer, mousse, chanson, été, doré, vent, bijou, rosée, pluie, bleu, bougie, chaud, mince, miroitant).
  • La classe Grise fait référence au comté et à la Bree, et elle est remplie de mots confortables, accueillants, pratiques, quotidiens et de mots sur la communication humaine: Les hobbits sont des gens très bavards, après tout. C’est le vocabulaire de la « situation de départ, si calme et ennuyeuse » que vous pouvez repérer dans chaque conte d’aventures. Néanmoins, cette classe contient quelques petits mots rampants, prévoyant la forme des choses à venir (Strider, bon, Bree, penser, parler, supposer, savoir, histoire, nourriture, Monsieur, s’inquiéter, mordre, avoir peur, affaires, ferry, demander, raconter, traiter, réel, camarade, rire, temps, queer, propriétaire, auberge, aventure, nouvelles, affaire).
  • La Classe Bleue et Violette fait référence à la Guerre proprement dite des Hommes contre Sauron. En particulier, la Classe Bleue fait allusion à l’influence maléfique de l’Anneau, avec ses victimes et ses ennemis (Sauron, Boromir, pouvoir, ennemi, mal, Isildur, anneau, Saruman, Elrond, sage, Minas Tirith, Moria, péril, détruire, périr, tradition, but, Mordor, serviteur, doute, peur, fléau, sagesse, porteur, destin). La Classe Pourpre fait allusion aux actes de guerre réels, aux batailles mêmes du Rohan et du Gondor (Seigneur, Roi, Éomer, Théoden, Éowyn, chevauchée, homme, Denethor, fils, ville, Gondor, maison, Faramir, Bérégonde, guérison, bataille, Rohan, Intendant, Marc, Imrahil, capitaine, Aragorn, guerre, prince, chevalier, gardien, cheval, amour, sœur, Edoras, guérisseur, service, honneur, offre, femme, hâte).

Si longtemps pour combien de mots dans les livres du LOTR. J’espère que ma réponse intéressera les fans de Tolkien et, peut-être, les érudits. Si quelqu’un a une curiosité qui n’est pas directement liée à la réponse, aux résultats d’analyse ou aux méthodologies, n’hésitez pas à me contacter.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.