séance 6 – 07 mai 2016

Séance 6 : 07 avril 2016

10h-14h salle i2 317 Campus Centre

  1. Présentation du logiciel Iramuteq sur le corpus vœux et autres données (Xavier MABIRE, Université Lumière Lyon 2,EA 4163 GRePS)
  2. Présentation et prise en main de l’outil Hyperbase. Présentation générale, exercice sur le corpus des vœux présidentiels
  3. Sandy Emonot UPE/ Céditec) : Quelques considérations sur richesse du vocabulaire et hapax sur un texte littéraire.
    >>> support de communication (pdf)
    >>> support de communication (ppt)
  4. Présentation du logiciel Nvivo. (M. Pérès, UFR LLH, UPEC).

Séance 5 – 19 mars 2016

Séance 5 : Protocoles d’analyses lexicométriques – 19 mars 2016

10h-13h salle i2 306/I2 317 Campus Centre  

Présentation et pris en main d’Alceste

>>Prise en main du logiciel Hyperbase (2/2) – Enoncé

Références Hyperbase

  • >>2012: «Extraction des isotopies d’un corpus textuel», [En ligne], Volume XVII – n°3 (2012). Coordonné par Christophe Cusimano, revue Texto (avec Margareta KASTBERG SJÖBLOM)

 

Utiliser les résultats d’un outil pour les soumettre aux autres: pour un protocole d’analyse lexicométrique multi-logiciels

Typologie et méthodes pour identifier les « thématiques » d’un texte ou d’un corpus

Séance 4 – 6 février 2016

Séance 4 : Analyses arborées, motifs, grammaires – 6 février 2016 – 10h00-16h00

 P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

Séance 3 – 16 janvier 2016

Séance 3 : Des corpus textuels aux corpus multimodaux – 16 janvier 2016

10h-13h salle 306 I2 Campus Centre

Problèmes de visualisation

Analyses factorielles des correspondances, analyses arborées, classifications. Quelles unités de mesure, quelles représentations, quelles interprétations?

Utiliser les résultats d’un outil pour les soumettre aux autres: pour un protocole d’analyse lexicométrique multi-logiciels

Typologie et méthodes pour identifier les « thématiques » d’un texte ou d’un corpus

Expérimentations au moyen de Tropes

Présentation des méthodes dites « cooccurrentielles ».

– Une démarche expérimentale: utilisation récursive d’Alceste pour identifier des formules rituelles et en observer la variation – Présentation et pris en main d’Alceste

 Myriam Merad, INERIS : Pollutions atmosphériques et analyse des controverses : Contribution de Tropes à l’analyse des éléments de controverses en France et à l’étranger sur la mesure de régulation du chauffage au bois

Séance 2 – 12 décembre 2015

Séance 2 : Construire et analyser des corpus textométriques – 12 décembre 2015

10h-17h salle 306 I2 Campus Centre

10h-10h30 : Retour sur la séance du 7 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

10h30-11h30 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

Approfondissement: L’analyse factorielle des correspondances 11h30-12h00:

L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico3/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.

11h30-13h00 : Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)

14h00-15h00 Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels (l’exemple de TextObserver ou de Weblex)

Soumettre un corpus à TextObserver:

  • Surface (forme graphique)
  • Catégories prise en main de TextEndoder (M. Pérès)
  • Présentation de la base Textopol, nouvelle version.

Exercice:

Constitution de corpus à partir d’une base de données médiatique:

Ressources

>> Motifs et expression régulières (Cordial/Weblex) >> Etiquettes Treetagger (français) >>Boîte à outils de Textopol

Corpus de travail

>> Corpus voeux xml (treetagger/TextObserver) >> Notes (fichier tab) >> Editos (tab) >> Textes genres (txt)

Téléchargement de TextObserver :

>> fichiers log >> Version 39

Questions des participants, travaux sur les corpus

Séance 1 – 7 novembre 2015

Séance 1 : Approches textométriques des discours – 7 novembre 2015

10h-13h salle 306 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

seminaire doctoral 2012-13
séances 2012-13
accueil seminaire doct
séances ouvertes
2013-14
séances 2013-14
séances 2014-15
2014-15
2015-16
2016-17
séances 2016-17
2017-18
séances 2017-18