séance 5 – 16 avril 2022

séance 5 – 16 avril 2022

[zoom]

Iramuteq

  • >> lien vers les documents de travail
  • >> télécharger et installer Iramuteq (attention le package proxy nécessite que R >= 3.4.0 soit installé)

Ressources

>> M.Kastberg Sjöblom et J.-M.Leblanc – Extraction des isotopies d’un corpus textuel : analyse systématique des structures sémantiques et des cooccurrences, à travers différents logiciels textométriques, Texto, VOL. XVII, N°3 (2012)

>> Corpus Voeux_59-2020_Alceste

séance 4 – 2 avril 2022

séance 4 – 2 avril 2022

[zoom]
  • Étiqueter un corpus
  • Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi (voir ci-dessous dans ressources pour installer le logiciel avant la séance)

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

  • Balisage, encodage, nettoyage des données
  • Expressions régulières, rechercher remplacer (notepad ++)

Ressources

Séminaire 2021-22

>> version imprimable du programme

  • 27 novembre 2021 : Introduction – Approches textométriques des discours
  • 15 janvier 2022 : Présentation et prise en main de TextObserver
  • 19 février 2022 : De la lexicométrie au traitement automatique des langues (TAL)
  • 19 mars 2022 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter)
  • 16 avril 2022 : Exploration textométrique sur un base annotée – Prise en main du Trameur
  • 21 mai 2022 : De la textométrie à l’analyse des données, quels outils pour quels usages?
    Corrélation et causalité interprétatives. Expérimentations, distance intertextuelle et voisinages

Séance 2 – 15 janvier 2022

Séance 2 – 15 janvier 2022

Présentation et prise en main de TextObserver [salle 306 I2 Campus Centre]

  1. Retour sur la séance du 27 novembre (Initiation à Lexico3)
    >> Prise en main de Lexico3 en 5 tutoriels interactifs
  2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
    >>> télécharger le support
  3. Approfondissement: L’analyse factorielle des correspondances
    L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
  4. Interprétations/visualisations
    Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
    Expressions régulières, spécificités, cooccurrences.
    >> télécharger le fichier .lis
  5. Travail en surface/catégorisations
    Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

EXERCICE

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

RESSOURCES

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>  Boîte à outils de Textopol
  • >> Expressions régulières sous TextObserver
  • >> Importer un corpus au format txt
  • >> Baliser un corpus au format xml
  • >> Créer et utiliser une table morphosyntaxique

CORPUS DE TRAVAIL

TÉLÉCHARGEMENT DE TEXTOBSERVER

>> Télécharger TextObserver 9.4.5

QUESTIONS DES PARTICIPANTS, TRAVAUX SUR LES CORPUS

  • >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

séance 1 – 27 novembre 2021

Séance 1 : Approches textométriques des discours – 27 novembre 2021

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

séance 6 – 29 mai 2021

séance 6 – 29 mai 2021

[zoom]
  • Étiqueter un corpus
  • Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi (voir ci-dessous dans ressources pour installer le logiciel avant la séance)

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

  • Balisage, encodage, nettoyage des données
  • Expressions régulières, rechercher remplacer (notepad ++)

Ressources

séance 4 – 6 mars 2021

Séance 4 – 6 mars 2021

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

séance 2 – 13 février 2021

Séance 2 – 13 février 2021

Présentation et prise en main de TextObserver [visio]

  1. Retour sur la séance du 16 janvier (Initiation à Lexico3)
    >> Prise en main de Lexico3 en 5 tutoriels interactifs
  2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
    >>> télécharger le support
  3. Approfondissement: L’analyse factorielle des correspondances
    L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
  4. Interprétations/visualisations
    Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
    Expressions régulières, spécificités, cooccurrences.
    >> télécharger le fichier .lis
  5. Travail en surface/catégorisations
    Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

EXERCICE

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

RESSOURCES

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>  Boîte à outils de Textopol
  • >> Expressions régulières sous TextObserver
  • >> Importer un corpus au format txt
  • >> Baliser un corpus au format xml
  • >> Créer et utiliser une table morphosyntaxique

CORPUS DE TRAVAIL

TÉLÉCHARGEMENT DE TEXTOBSERVER

>> Télécharger TextObserver 9.4.5

QUESTIONS DES PARTICIPANTS, TRAVAUX SUR LES CORPUS

  • >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

Séance 1 – 16 janvier 2021

Séance 1 : Approches textométriques des discours – 16 janvier 2021

zoom

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources: