Séance 2 : Construire et analyser des corpus textométriques – 12 décembre 2015
10h-17h salle 306 I2 Campus Centre
10h-10h30 : Retour sur la séance du 7 novembre (Initiation à Lexico3)
>> Prise en main de Lexico3 en 5 tutoriels interactifs
10h30-11h30 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
Approfondissement: L’analyse factorielle des correspondances 11h30-12h00:
L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico3/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
11h30-13h00 : Interprétations/visualisations
Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)
14h00-15h00 Travail en surface/catégorisations
Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels (l’exemple de TextObserver ou de Weblex)
Soumettre un corpus à TextObserver:
- Surface (forme graphique)
- Catégories prise en main de TextEndoder (M. Pérès)
- Présentation de la base Textopol, nouvelle version.
Exercice:
Constitution de corpus à partir d’une base de données médiatique:
Ressources
>> Motifs et expression régulières (Cordial/Weblex) >> Etiquettes Treetagger (français) >>Boîte à outils de Textopol
Corpus de travail
>> Corpus voeux xml (treetagger/TextObserver) >> Notes (fichier tab) >> Editos (tab) >> Textes genres (txt)