Le projet ANR Textométrie (http://textometrie.ens-lsh.fr) a posé les bases d’une nouvelle plateforme logicielle de développement en mode open-source d’applications d’analyse textométrique (https://sourceforge.net/projects/textometrie). Cette plateforme est compatible avec le standard international de représentation des corpus textuels XML-TEI et intègre des composants de traitement automatique de la langue naturelle. Elle articule le moteur de recherche en texte intégral CWB (http://cwb.sourceforge.net) avec l’environnement de calcul statistique R (http://www.r-project.org).
Deux applications prototypes ont déjà été développées avec cette plateforme. Chacune offre un ensemble propre de fonctionnalités :
Après avoir présenté les enjeux théoriques des nouvelles notions disponibles pour la textométrie, nous ferons une démonstration d’importation d’un corpus encodé en XML-TEI, de son étiquetage avec le logiciel TreeTagger puis de son analyse avec l’application Windows. Cette démonstration sera suivie d’une présentation du prototype de l’application web.