séance 5 – 16 avril 2022

[zoom]

Iramuteq

>> lien vers les documents de travail
>> télécharger et installer Iramuteq (attention le package proxy nécessite que R >= 3.4.0 soit installé)

Ressources

>> M.Kastberg Sjöblom et J.-M.Leblanc – Extraction des isotopies d’un corpus textuel : analyse systématique des structures sémantiques et des cooccurrences, à travers différents logiciels textométriques, Texto, VOL. XVII, N°3 (2012)

>> Corpus Voeux_59-2020_Alceste

séance 4 – 2 avril 2022

[zoom]

Étiqueter un corpus
Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi (voir ci-dessous dans ressources pour installer le logiciel avant la séance)

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

Balisage, encodage, nettoyage des données
Expressions régulières, rechercher remplacer (notepad ++)

Ressources

Séminaire 2021-22

>> version imprimable du programme

27 novembre 2021 : Introduction – Approches textométriques des discours
15 janvier 2022 : Présentation et prise en main de TextObserver
19 février 2022 : De la lexicométrie au traitement automatique des langues (TAL)
19 mars 2022 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter)
16 avril 2022 : Exploration textométrique sur un base annotée – Prise en main du Trameur
21 mai 2022 : De la textométrie à l’analyse des données, quels outils pour quels usages?
Corrélation et causalité interprétatives. Expérimentations, distance intertextuelle et voisinages

Présentation et prise en main de TextObserver [salle 306 I2 Campus Centre]

Retour sur la séance du 27 novembre (Initiation à Lexico3)
>> Prise en main de Lexico3 en 5 tutoriels interactifs
Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
>>> télécharger le support
Approfondissement: L’analyse factorielle des correspondances
L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
Interprétations/visualisations
Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
Expressions régulières, spécificités, cooccurrences.
>> télécharger le fichier .lis
Travail en surface/catégorisations
Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

EXERCICE

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

RESSOURCES

>> Motifs et expression régulières (Cordial/TXM)
>> Etiquettes Treetagger (français)
>> Boîte à outils de Textopol
>> Expressions régulières sous TextObserver
>> Importer un corpus au format txt
>> Baliser un corpus au format xml
>> Créer et utiliser une table morphosyntaxique

CORPUS DE TRAVAIL

>> Corpus voeux xml (treetagger1959-2018/TextObserver1959-2018)
>> Corpus voeux xml (1959-2021)
>> Notes (fichier tab)
>> Editos (tab)
>> Textes genres (txt)

TÉLÉCHARGEMENT DE TEXTOBSERVER

>> Télécharger TextObserver 9.4.5

QUESTIONS DES PARTICIPANTS, TRAVAUX SUR LES CORPUS

>> base textopol
>> expérimentation voeux
>> corpus candidatures
>> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

Séance 1 : Approches textométriques des discours – 27 novembre 2021

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

Ressources:

>> Lien vers google lab
>> Lien vers le support
>> Corpus de travail (voeux 1959-2020 Lexico)
>> Accès à l’application
>> Enoncé – exercice-lexico
>> Quelques fonctionnalités de Lexico3
>> Barre d’outils de Lexico 3
>> Balisage Lexico3/Alceste
Liens à visiter et revues à consulter :
- http://jadt.org/
- http://www.cavi.univ-paris3.fr/lexicometrica/
- Ngram, un bon outil pour les Sciences Humaines ? (internetactu.net, article du 19/10/15, par Rémi Sussan)
En savoir plus sur Lexico 3

séance 6 – 29 mai 2021

[zoom]

Étiqueter un corpus
Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi (voir ci-dessous dans ressources pour installer le logiciel avant la séance)

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

Balisage, encodage, nettoyage des données
Expressions régulières, rechercher remplacer (notepad ++)

Ressources

séance 5 – 10 avril 2021

Séance 5 – 10 avril 2021

Iramuteq
>> lien vers les documents de travail
>> télécharger et installer Iramuteq (attention le package proxy nécessite que R >= 3.4.0 soit installé)
Nouvelles fonctionnalités de TextObserver
>> télécharger TextObserver 9.4.5 (Nb: enregistrez le dossier où vous voulez puis décompressez le)

séance 4 – 6 mars 2021

Séance 4 – 6 mars 2021

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

>>http://unitexgramlab.org/fr

séance 2 – 13 février 2021

Séance 2 – 13 février 2021

Présentation et prise en main de TextObserver [visio]

Retour sur la séance du 16 janvier (Initiation à Lexico3)
>> Prise en main de Lexico3 en 5 tutoriels interactifs
Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)
>>> télécharger le support
Approfondissement: L’analyse factorielle des correspondances
L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
Interprétations/visualisations
Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.
Expressions régulières, spécificités, cooccurrences.
>> télécharger le fichier .lis
Travail en surface/catégorisations
Catégoriseurs morphosyntaxiques (cordial, Treetagger), Catégoriseurs sémantiques (Tropes), Recherche de motifs textuels.

EXERCICE

Constitution de corpus : Recueil, balisage XML ou fichiers texte, étiquetage.

RESSOURCES

>> Motifs et expression régulières (Cordial/TXM)
>> Etiquettes Treetagger (français)
>> Boîte à outils de Textopol
>> Expressions régulières sous TextObserver
>> Importer un corpus au format txt
>> Baliser un corpus au format xml
>> Créer et utiliser une table morphosyntaxique

CORPUS DE TRAVAIL

>> Corpus voeux xml (treetagger1959-2018/TextObserver1959-2018)
>> Notes (fichier tab)
>> Editos (tab)
>> Textes genres (txt)

TÉLÉCHARGEMENT DE TEXTOBSERVER

>> Télécharger TextObserver 9.4.5

QUESTIONS DES PARTICIPANTS, TRAVAUX SUR LES CORPUS

>> base textopol
>> expérimentation voeux
>> corpus candidatures
>> candidatures étudiants et politiques pour TO (clic-droit >enregistrer la cible du lien…)

Séance 1 – 16 janvier 2021

Séance 1 : Approches textométriques des discours – 16 janvier 2021

zoom

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Questions des participants

Ressources:

>> Lien vers google lab
>> Lien vers le support
>> Corpus de travail (voeux 1959-2020 Lexico)
>> Accès à l’application
>> Enoncé – exercice-lexico
>> Quelques fonctionnalités de Lexico3
>> Barre d’outils de Lexico 3
>> Balisage Lexico3/Alceste
Liens à visiter et revues à consulter :
- http://jadt.org/
- http://www.cavi.univ-paris3.fr/lexicometrica/
- Ngram, un bon outil pour les Sciences Humaines ? (internetactu.net, article du 19/10/15, par Rémi Sussan)
En savoir plus sur Lexico 3

séance 5 – 16 avril 2022

séance 4 – 2 avril 2022

Ressources

Séance 2 – 15 janvier 2022

Présentation et prise en main de TextObserver [salle 306 I2 Campus Centre]

EXERCICE

RESSOURCES

CORPUS DE TRAVAIL

TÉLÉCHARGEMENT DE TEXTOBSERVER

QUESTIONS DES PARTICIPANTS, TRAVAUX SUR LES CORPUS

Séance 1 : Approches textométriques des discours – 27 novembre 2021

10h-11h: Introduction :

11h-13h Atelier pratique

Questions des participants

Ressources:

séance 6 – 29 mai 2021

Ressources

Séance 5 – 10 avril 2021

Séance 4 – 6 mars 2021

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Séance 2 – 13 février 2021

Présentation et prise en main de TextObserver [visio]

EXERCICE

RESSOURCES

CORPUS DE TRAVAIL

TÉLÉCHARGEMENT DE TEXTOBSERVER

QUESTIONS DES PARTICIPANTS, TRAVAUX SUR LES CORPUS

Séance 1 : Approches textométriques des discours – 16 janvier 2021

10h-11h: Introduction :

11h-13h Atelier pratique

Questions des participants

Ressources: