Séminaire 2016-17

Séminaire 2016-17

>> Version imprimable du programme

Calendrier

  • 5 novembre 2016 : Introduction – Approches textométriques des discours.
  • 10 décembre 2016 : Présentation et prise en main de TextObserver [10h-16h]
  • 21 janvier 2017 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
  • 25 février 2017 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
  • 25 mars 2017 : Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.
  • 22 avril 2017 : De la textométrie à l’analyse des données, quels outils pour quels usages?

Courant 2016 – 2017 : 3e journée de présentation des outils de traitements de corpus textuels ; Stages de formation à TextObserver (dates à préciser)

Outils de traitement de corpus textuels développés à Paris Est – 2eme édition

Outils de traitement de corpus textuels développés à Paris Est : Démonstrations, formations, ateliers – 2eme édition

Cette journée se tiendra le 29 juin prochain à l’UPEC, Campus Centre, salles I2-306 et I2-317, 61 avenue du Général de Gaulle, 94000 Créteil (ligne 8 – Métro Université) .   A l’interface entre sciences du langage, informatique et statistique, le traitement automatique de données textuelles vise des applications multiples : tests d’hypothèses à partir de productions écrites ou orales, analyses exploratoires de corpus web, journalistiques, politiques ou littéraires, visualisation d’opinions, extraction d’informations, etc. Plusieurs laboratoires de l’Université Paris-Est développent des outils dédiés au traitement automatique de données textuelles : TextObserver, Unitex/ Gramlab, TreeCloud, CorText Manager. Ils se proposent de les présenter, le 29 juin 2016 à l’UPEC, à leurs utilisateurs potentiels, mais aussi aux concepteurs de méthodologies ou d’outils qui exploitent des données textuelles.

>> télécharger le programme

Atelier Treecloud (i2 306)

Atelier CorText Manager (i2 306)

Atelier Unitex/Gramlab (i2 317)

>> Unitex/Gramlab

Atelier Textobserver (i2 317)

Merci de confirmer votre participation au moyen du formulaire suivant :

http://goo.gl/forms/RuKrrBx7xSvgjLG22

la journée du 29 juin sur le site d’ECLAVIT

séance 6 – 07 mai 2016

Séance 6 : 07 avril 2016

10h-14h salle i2 317 Campus Centre

  1. Présentation du logiciel Iramuteq sur le corpus vœux et autres données (Xavier MABIRE, Université Lumière Lyon 2,EA 4163 GRePS)
  2. Présentation et prise en main de l’outil Hyperbase. Présentation générale, exercice sur le corpus des vœux présidentiels
  3. Sandy Emonot UPE/ Céditec) : Quelques considérations sur richesse du vocabulaire et hapax sur un texte littéraire.
    >>> support de communication (pdf)
    >>> support de communication (ppt)
  4. Présentation du logiciel Nvivo. (M. Pérès, UFR LLH, UPEC).

Séance 5 – 19 mars 2016

Séance 5 : Protocoles d’analyses lexicométriques – 19 mars 2016

10h-13h salle i2 306/I2 317 Campus Centre  

Présentation et pris en main d’Alceste

>>Prise en main du logiciel Hyperbase (2/2) – Enoncé

Références Hyperbase

  • >>2012: «Extraction des isotopies d’un corpus textuel», [En ligne], Volume XVII – n°3 (2012). Coordonné par Christophe Cusimano, revue Texto (avec Margareta KASTBERG SJÖBLOM)

 

Utiliser les résultats d’un outil pour les soumettre aux autres: pour un protocole d’analyse lexicométrique multi-logiciels

Typologie et méthodes pour identifier les « thématiques » d’un texte ou d’un corpus

Séance 4 – 6 février 2016

Séance 4 : Analyses arborées, motifs, grammaires – 6 février 2016 – 10h00-16h00

 P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

Séance 3 – 16 janvier 2016

Séance 3 : Des corpus textuels aux corpus multimodaux – 16 janvier 2016

10h-13h salle 306 I2 Campus Centre

Problèmes de visualisation

Analyses factorielles des correspondances, analyses arborées, classifications. Quelles unités de mesure, quelles représentations, quelles interprétations?

Utiliser les résultats d’un outil pour les soumettre aux autres: pour un protocole d’analyse lexicométrique multi-logiciels

Typologie et méthodes pour identifier les « thématiques » d’un texte ou d’un corpus

Expérimentations au moyen de Tropes

Présentation des méthodes dites « cooccurrentielles ».

– Une démarche expérimentale: utilisation récursive d’Alceste pour identifier des formules rituelles et en observer la variation – Présentation et pris en main d’Alceste

 Myriam Merad, INERIS : Pollutions atmosphériques et analyse des controverses : Contribution de Tropes à l’analyse des éléments de controverses en France et à l’étranger sur la mesure de régulation du chauffage au bois

Séance 2 – 12 décembre 2015

Séance 2 : Construire et analyser des corpus textométriques – 12 décembre 2015

10h-17h salle 306 I2 Campus Centre

10h-10h30 : Retour sur la séance du 7 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

10h30-11h30 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

Approfondissement: L’analyse factorielle des correspondances 11h30-12h00:

L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico3/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.

11h30-13h00 : Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)

14h00-15h00 Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels (l’exemple de TextObserver ou de Weblex)

Soumettre un corpus à TextObserver:

  • Surface (forme graphique)
  • Catégories prise en main de TextEndoder (M. Pérès)
  • Présentation de la base Textopol, nouvelle version.

Exercice:

Constitution de corpus à partir d’une base de données médiatique:

Ressources

>> Motifs et expression régulières (Cordial/Weblex) >> Etiquettes Treetagger (français) >>Boîte à outils de Textopol

Corpus de travail

>> Corpus voeux xml (treetagger/TextObserver) >> Notes (fichier tab) >> Editos (tab) >> Textes genres (txt)

Téléchargement de TextObserver :

>> fichiers log >> Version 39

Questions des participants, travaux sur les corpus

Séance 1 – 7 novembre 2015

Séance 1 : Approches textométriques des discours – 7 novembre 2015

10h-13h salle 306 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

Séminaire 2015-16

Séminaire 2015-16

>> Version imprimable du programme
>> Atelier infographie

Calendrier

  • 7 novembre 2015 : Introduction – Approches textométriques des discours.
  • 12 décembre 2015 : Présentation et prise en main de l’outil TextObserver [10h-16h].
  • 16 janvier 2016 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter).
  • 6 février 2016 : Visualisation et interprétations des résultats. Analyse de contenu et analyse de discours.
  • 19 mars 2016 : Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.
  • 7 mai 2016 : De la textométrie à l’analyse des données, quels outils pour quels usages?

 

Courant 2015 – 2016 : 2e journée de présentation des outils de traitements de corpus textuels Stages de formation à TextObserver (dates à préciser).

Workshop lexicométrie

Workshop lexicométrie

Vendredi 10 juillet, salles I2 306 et I2 314 de Campus Centre. 10h00-17h00

Workshop organisé par : Emilie Née, Jean-Marc Leblanc

Merci de confirmer pour la matinée et pour l’après midi de façon à ce que nous organisions au mieux : http://doodle.com/8p5i269psd5r8p6e

  • 10h00-10h20 Présentation HAl (Philippe Gambette)
  • 10h30-13h00: Présentation et prise en main de Lexico 3.6 Emilie Née
  • Après midi: Approfondissement sur l’Analyse Factorielle des correspondances et présentation prise en main de TextoBserver (JML)
  • Présentation de la méthodologie Alceste (JML)