Séance 2 : Présentation et prise en main de TextObserver – 16 décembre 2017
10h-16h salle 317 I2 Campus Centre
1. Retour sur la séance du 18 novembre (Initiation à Lexico3)
>> Prise en main de Lexico3 en 5 tutoriels interactifs
2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
3. Approfondissement: L’analyse factorielle des correspondances
L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
4. Interprétations/visualisations
Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
Expressions régulières, spécificités, cooccurrences.
>> télécharger le fichier .lis
5. Travail en surface/catégorisations
Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels.
Exercice
Constitution de corpus : Les déclarations de candidature Balisage XML ou fichiers texte.
Ressources
- >> Motifs et expression régulières (Cordial/TXM)
- >> Etiquettes Treetagger (français)
- >> Boîte à outils de Textopol
- >> Expressions régulières sous TextObserver
- >> Importer un corpus au format txt
- >> Baliser un corpus au format xml
- >> Créer et utiliser une table morphosyntaxique
Corpus de travail
- >> Corpus voeux xml (treetagger/TextObserver)
- >> Notes (fichier tab)
- >> Editos (tab)
- >> Textes genres (txt)
Téléchargement de TextObserver
- >> dernière version