test
Search publications, data, projects and authors

Free full text available

Article

French

ID: <

10670/1.1inf8f

>

Where these data come from
Une mesure de la distance intertextuelle : la connexion lexicale

Abstract

C’est une prise en compte globale du contenu lexical que, dès 1959, Pierre Guiraud proposait dans Problèmes et méthodes de la statistique linguistique (p. 129) : "On pourrait établir un tableau de corrélations lexicales entre les différentes oeuvres en les prenant deux à deux pour voir les mots qu'elles ont en commun et ceux qu'elles ont en propre ; mais c'est un travail énorme." Et Charles Muller, en 1967, dans son Etude de statistique lexicale (pp. 169-173) se livrait précisément à ce type de calcul, qu'il désigne sous le nom de connexion lexicale et dont il donne la théorie détaillée dans son Initiation à la statistique lexicale (pp. 210-215). On conçoit que Guiraud, démuni, à l'époque, de moyens de calcul, ait renoncé à entreprendre un "travail énorme", mais on peut s'étonner que la tentative de Muller ait été si rarement reprise, alors que la méthode était clairement définie et les outils de traitement disponibles. Il faut certes mettre en oeuvre des programmes spécifiques qui sont assez complexes et qui requièrent une puissance suffisante. Mais la programmation est devenue un exercice banal et les machines ont tellement progressé qu'on ne devrait plus reculer devant des recherches de ce genre. Et c'est ce que nous avons tenté sur le corpus de Hugo et dont nous nous proposons de rendre compte.

Your Feedback

Please give us your feedback and help us make GoTriple better.
Fill in our satisfaction questionnaire and tell us what you like about GoTriple!