Séminaire doctoral Informatique pour la recherche
Approches Textométriques – Ergonomies numérique

Séance 6 du 23 mars 2013

TXM, Iramuteq, TextObserver: outils open source pour l’analyse des données textuelles.

1. Introduction-rappels

– Rappel des séances précédentes.
– Panorama des outils existants.
– Quels outils pourquoi faire?

2. Weblex: Rappel de quelques fonctionnalités

– Cooccurrences associées à un pôle, lexicogrammes simples et récursifs
– Textes annotés, expressions CQP…

3. Initiation à TXM

– Installation, import de corpus, manipulations sur corpus de travail
– Etude de cas : A. Policka : Utilisation de la plate-forme TXM: Analyse du corpus Rapcor pour l’analyse socio-lexicale du français actuel (A confirmer)

4. Outils de visualisation

– Introduction: Lexicométrie, textométrie, data-visualisation…
– Treecloud, Gephi, Linkurious…

5. Présentation du logiciel Iramuteq

– Téléchargement, installation, expérimentation sur corpus de travail

6. Etude de cas : Analyser des corpus multimodaux

– Application de TextObserver à l’analyse automatisée de pages web.

7. Préparation de la séance du 20 avril (10h-13h00)

>> Télécharger le corpus vœux encodé pour TXM
>> Télécharger le corpus « genres »