Séminaire 2020-21

16 janvier 2021 : Introduction – Approches textométriques des discours (JM. Leblanc)
30 janvier 2021 : Exploration textométrique sur une base annotée – Prise en main du Trameur (E. Née)
13 février 2021 : Présentation et prise en main de TextObserver (JM. Leblanc)
6 mars 2021 : De la lexicométrie au traitement automatique des langues (TAL) (P. Gambette et C. Martineau)
10 avril 2021 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter,, visualiser, interpréter) (JM. Leblanc et M. Pérès)
29 mai 2021 : (JM. Leblanc)
- De la lexicométrie à l’analyse des données, quels outils pour quels usages?
- Corrélations et causalités interprétatives. expérimentations, distance intertextuelle et voisinages.

Séance 3 – 29 janvier 2020

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

>>http://unitexgramlab.org/fr

TextObserver

module de préparation de corpus
module catégorisation morphosyntaxique
module d’annotation/commentaires
topologies, cooccurrences

Présentation et prise en main de TextObserver [10h-13h salle 317 I2 Campus Centre]

Retour sur la séance du 17 novembre (Initiation à Lexico3)
>> Prise en main de Lexico3 en 5 tutoriels interactifs
Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
>>> télécharger le support
Approfondissement: L’analyse factorielle des correspondances
L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
Interprétations/visualisations
Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
Expressions régulières, spécificités, cooccurrences.
>> télécharger le fichier .lis
Travail en surface/catégorisations
Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

Exercice

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

Ressources

>> Motifs et expression régulières (Cordial/TXM)
>> Etiquettes Treetagger (français)
>> Boîte à outils de Textopol
>> Expressions régulières sous TextObserver
>> Importer un corpus au format txt
>> Baliser un corpus au format xml
>> Créer et utiliser une table morphosyntaxique

Corpus de travail

>> Corpus voeux xml (treetagger1959-2018/TextObserver1959-2018)
>> Notes (fichier tab)
>> Editos (tab)
>> Textes genres (txt)

Téléchargement de TextObserver

>> Télécharger TextObserver 9.4.5

Questions des participants, travaux sur les corpus

>> base textopol
>> expérimentation voeux
>> corpus candidatures
>> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

Séance 1 : Approches textométriques des discours – 16 novembre 2019

10h-13h salle 317 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

Ressources:

>> Lien vers google lab
>> Lien vers le support
>> Corpus de travail >> Accès à l’application
>> Enoncé – exercice-lexico
>> Quelques fonctionnalités de Lexico3
>> Barre d’outils de Lexico 3
>> Balisage Lexico3/Alceste
Liens à visiter et revues à consulter :
- http://jadt.org/
- http://www.cavi.univ-paris3.fr/lexicometrica/
- Ngram, un bon outil pour les Sciences Humaines ? (internetactu.net, article du 19/10/15, par Rémi Sussan)
En savoir plus sur Lexico 3

Séminaire 2019-20

Séminaire 2019-20

>> Version imprimable du programme

Calendrier

16 novembre 2019 : Introduction – Approches textométriques des discours.
14 décembre 2019 : Présentation et prise en main de TextObserver [10h-16h]
18 janvier 2020 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
29 février 2020 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
11 avril 2020 : De la textométrie à l’analyse des données, quels outils pour quels usages?
Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.
16 mai 2020 : Exploration textométrique sur une base annotée – Prise en main du Trameur [10h-16h]

Séance – 13 mai 2019

Séance 6 – 13 mai 2019

Iramuteq
>> lien vers les documents de travail
>> télécharger et installer Iramuteq (attention le package proxy nécessite que R >= 3.4.0 soit installé)
Nouvelles fonctionnalités de TextObserver
>> télécharger TextObserver 9.4.5 (Nb: enregistrez le dossier où vous voulez puis décompressez le)

séance 4 – 16 février 2019

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

>>http://unitexgramlab.org/fr

TextObserver

module de préparation de corpus
module catégorisation morphosyntaxique
module d’annotation/commentaires
topologies, cooccurrences

séance 3 – 19 janvier 2019

[10h-13h salle 317 i2 Campus Centre]

Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi
Prise en main/présentation du logiciel R

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

Balisage, encodage, nettoyage des données
Expressions régulières, rechercher remplacer (notepad ++)

Ressources

Séance 2 – 15 décembre 2018

Présentation et prise en main de TextObserver [10h-16h salle 317 I2 Campus Centre]

Retour sur la séance du 17 novembre (Initiation à Lexico3)
>> Prise en main de Lexico3 en 5 tutoriels interactifs
Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
>>> télécharger le support
Approfondissement: L’analyse factorielle des correspondances
L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
Interprétations/visualisations
Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
Expressions régulières, spécificités, cooccurrences.
>> télécharger le fichier .lis
Travail en surface/catégorisations
Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

Exercice

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

Ressources

>> Motifs et expression régulières (Cordial/TXM)
>> Etiquettes Treetagger (français)
>> Boîte à outils de Textopol
>> Expressions régulières sous TextObserver
>> Importer un corpus au format txt
>> Baliser un corpus au format xml
>> Créer et utiliser une table morphosyntaxique

Corpus de travail

>> Corpus voeux xml (treetagger1959-2017/TextObserver1959-2017)
>> Notes (fichier tab)
>> Editos (tab)
>> Textes genres (txt)

Téléchargement de TextObserver

>> Télécharger TextObserver 9.4.5

Questions des participants, travaux sur les corpus

>> base textopol
>> expérimentation voeux
>> corpus candidatures
>> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

Séance 1 – 17 novembre 2018

Séance 1- 17 novembre 2018

Introduction – Approches textométriques des discours

…

Séance 3 – 29 janvier 2020

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

TextObserver

Séance 2 – 18 janvier 2020

Présentation et prise en main de TextObserver [10h-13h salle 317 I2 Campus Centre]

Exercice

Ressources

Corpus de travail

Téléchargement de TextObserver

Questions des participants, travaux sur les corpus

Séance 1 : Approches textométriques des discours – 16 novembre 2019

10h-11h: Introduction :

11h-13h Atelier pratique

Questions des participants

Ressources:

Séminaire 2019-20

Calendrier

Séance 6 – 13 mai 2019

séance 4 – 16 février 2019

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

TextObserver

séance 3 – 19 janvier 2019

Ressources

Séance 2 – 15 décembre 2018

Présentation et prise en main de TextObserver [10h-16h salle 317 I2 Campus Centre]

Exercice

Ressources

Corpus de travail

Téléchargement de TextObserver

Questions des participants, travaux sur les corpus

Séance 1- 17 novembre 2018

Introduction – Approches textométriques des discours