Séminaire 2019-20

Séminaire 2019-20

>> Version imprimable du programme

Calendrier

  • 16 novembre 2019 : Introduction – Approches textométriques des discours.
  • 14 décembre 2019 : Présentation et prise en main de TextObserver [10h-16h]
  • 18 janvier 2020 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
  • 29 février 2020 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
  • 11 avril 2020 : De la textométrie à l’analyse des données, quels outils pour quels usages?
    Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.
  • 16 mai 2020 : Exploration textométrique sur une base annotée – Prise en main du Trameur [10h-16h]

séance 4 – 16 février 2019

séance 4 – 16 février 2019

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

TextObserver

  • module de préparation de corpus
  • module catégorisation morphosyntaxique
  • module d’annotation/commentaires
  • topologies, cooccurrences

séance 3 – 19 janvier 2019

séance 3 – 19 janvier 2019

[10h-13h salle 317 i2 Campus Centre]
  • Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi
  • Prise en main/présentation du logiciel R

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

  • Balisage, encodage, nettoyage des données
  • Expressions régulières, rechercher remplacer (notepad ++)

Ressources

Séance 2 – 15 décembre 2018

Séance 2 – 15 décembre 2018

Présentation et prise en main de TextObserver [10h-16h salle 317 I2 Campus Centre]

  1. Retour sur la séance du 17 novembre (Initiation à Lexico3)
    >> Prise en main de Lexico3 en 5 tutoriels interactifs
  2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
    >>> télécharger le support
  3. Approfondissement: L’analyse factorielle des correspondances
    L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
  4. Interprétations/visualisations
    Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
    Expressions régulières, spécificités, cooccurrences.
    >> télécharger le fichier .lis
  5. Travail en surface/catégorisations
    Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

Exercice

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>  Boîte à outils de Textopol
  • >> Expressions régulières sous TextObserver
  • >> Importer un corpus au format txt
  • >> Baliser un corpus au format xml
  • >> Créer et utiliser une table morphosyntaxique

Corpus de travail

Téléchargement de TextObserver

>> Télécharger TextObserver 9.4.5

Questions des participants, travaux sur les corpus

  • >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

Séminaire 2018-19

Séminaire 2018-19

>> Version imprimable du programme

Calendrier

  • 17 novembre 2018 : Introduction – Approches textométriques des discours.
  • 15 décembre 2018 : Présentation et prise en main de TextObserver [10h-16h]
  • 19 janvier 2019 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
  • 16 février 2019 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
  • 16 mars 2019 : Exploration textométrique sur une base annotée – Prise en main du Trameur [10h-16h]
  • 13 avril 2019 : De la textométrie à l’analyse des données, quels outils pour quels usages?
    Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.

Séance 5 – 24 mars 2018

Séance 5 – 24 mars 2018

Emilie Née (UPEC, Céditec) : i-Trameur

Matinée sera consacrée à la présentation et à la prise en main du Trameur et de i-Trameur, développés par Serge Fleury (Syled/Cla2T, université Sorbonne nouvelle Paris 3).

Ressources

  • >> corpus brut
  • >> base à importer
  • >> i-Trameur

Téléchargement

  • >> Exécutable windows
  • >> Exécutable windows (64 bits)
  • >> Exécutable Mac

Séance 4 – 24 février 2018

Séance 4 – 24 février 2018

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

TextObserver

  • module de préparation de corpus
  • module catégorisation morphosyntaxique
  • module d’annotation/commentaires
  • topologies, cooccurrences

 

Séminaire doctoral Aucune catégorie