Séance 2 : Construire et analyser des corpus textométriques – 12 décembre 2015

10h-17h salle 306 I2 Campus Centre

10h-10h30 : Retour sur la séance du 7 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

10h30-11h30 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

Approfondissement: L’analyse factorielle des correspondances 11h30-12h00:

L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico3/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.

11h30-13h00 : Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)

14h00-15h00 Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels (l’exemple de TextObserver ou de Weblex)

Soumettre un corpus à TextObserver:

Surface (forme graphique)
Catégories prise en main de TextEndoder (M. Pérès)
Présentation de la base Textopol, nouvelle version.

Exercice:

Constitution de corpus à partir d’une base de données médiatique:

Ressources

>> Motifs et expression régulières (Cordial/Weblex) >> Etiquettes Treetagger (français) >>Boîte à outils de Textopol

Corpus de travail

>> Corpus voeux xml (treetagger/TextObserver) >> Notes (fichier tab) >> Editos (tab) >> Textes genres (txt)

Téléchargement de TextObserver :

>> fichiers log >> Version 39

Séance 2 – 12 décembre 2015