Séance 2 – 18 janvier 2020

Séance 2 – 18 janvier 2020

Présentation et prise en main de TextObserver [10h-13h salle 317 I2 Campus Centre]

  1. Retour sur la séance du 17 novembre (Initiation à Lexico3)
    >> Prise en main de Lexico3 en 5 tutoriels interactifs
  2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
    >>> télécharger le support
  3. Approfondissement: L’analyse factorielle des correspondances
    L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
  4. Interprétations/visualisations
    Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
    Expressions régulières, spécificités, cooccurrences.
    >> télécharger le fichier .lis
  5. Travail en surface/catégorisations
    Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

Exercice

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>  Boîte à outils de Textopol
  • >> Expressions régulières sous TextObserver
  • >> Importer un corpus au format txt
  • >> Baliser un corpus au format xml
  • >> Créer et utiliser une table morphosyntaxique

Corpus de travail

Téléchargement de TextObserver

>> Télécharger TextObserver 9.4.5

Questions des participants, travaux sur les corpus

  • >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)