Documents numériques et interprétation : corpus en lettres et sciences sociales
La constitution et l’analyse de corpus est en train de modifier les pratiques voire les théories en lettres et sciences sociales. Comme ces disciplines ont maintenant de plus en plus affaire à des documents numériques, cela engage pour elles un nouveau rapport à l’empirique. En outre, la numérisation des textes scientifiques eux-mêmes permet un retour réflexif sur leur élaboration et leurs parcours. Les nouveaux modes d’accès aux documents engagent-ils de nouvelles formes d’élaboration des connaissances ?
Les nouvelles initiatives prises au plan national (création du Centre d’édition numérique scientifique du CNRS) et international (TGE Adonis - Accès unique aux données et documents numériques des Lettres et sciences humaines) peuvent devenir l’occasion et donner les moyens d’un projet fédérateur pour les lettres et sciences sociales. De nombreuses collectivités sont de longue date engagées dans une réflexion sur la numérisation et l’analyse assistée des documents : outre bien entendu les sciences de l’information, il faut mentionner l’histoire, la sociologie, la linguistique, l’archéologie, les études littéraires — énumération évidemment non limitative.
Aussi ce colloque entend-il renforcer des liens et favoriser de nouvelles rencontres d’enseignants et chercheurs de ces disciplines avec ceux des collectivités de la linguistique de corpus et du document numérique. Sans trop d’égard pour l’objectivisme ordinaire, il traitera des problèmes philologiques et herméneutiques que pose le travail sur des corpus numériques, en fonction des tâches et des disciplines. Il s’attachera par exemple à la typologie des genres et discours, à la description de formes et de fonds sémantiques, au repérage de thèmes, à la caractérisation et à l’évolution de concepts, à l’étude des corrélations contenu/expression. Au plan pratique, il abordera sous forme didactique les questions que posent le recueil, l’établissement, le codage, l’étiquetage, le traitement des corpus, leur édition électronique. Des démonstrations de logiciels seront assurées, ainsi que des initiations aux problématiques propres aux différentes disciplines concernées.