Séminaire doctoral Informatique pour la recherche
Approches Textométriques – Ergonomies numérique
Séance 6 du 23 mars 2013
TXM, Iramuteq, TextObserver: outils open source pour l’analyse des données textuelles.
1. Introduction-rappels
– Rappel des séances précédentes.
– Panorama des outils existants.
– Quels outils pourquoi faire?
2. Weblex: Rappel de quelques fonctionnalités
– Cooccurrences associées à un pôle, lexicogrammes simples et récursifs
– Textes annotés, expressions CQP…
3. Initiation à TXM
– Installation, import de corpus, manipulations sur corpus de travail
– Etude de cas : A. Policka : Utilisation de la plate-forme TXM: Analyse du corpus Rapcor pour l’analyse socio-lexicale du français actuel (A confirmer)
4. Outils de visualisation
– Introduction: Lexicométrie, textométrie, data-visualisation…
– Treecloud, Gephi, Linkurious…
5. Présentation du logiciel Iramuteq
– Téléchargement, installation, expérimentation sur corpus de travail
6. Etude de cas : Analyser des corpus multimodaux
– Application de TextObserver à l’analyse automatisée de pages web.
7. Préparation de la séance du 20 avril (10h-13h00)
>> Télécharger le corpus vœux encodé pour TXM
>> Télécharger le corpus « genres »