Séance 3 – 20 janvier 2018

Séance 3 – 20 janvier 2018

10h-13h salle 317 I2 Campus Centre

Transformer des textes pour les soumettre à des traitements automatisés.

>> diaporama REGEX et notepad++

Un outil de visualisation et de « design » de graphes: Gephi

>> diaporama Gephi

Questions des participants, travail sur les corpus, (TextObserver)

 

Séance 2 – 16 décembre 2017

Séance 2 : Présentation et prise en main de TextObserver – 16 décembre 2017

10h-16h salle 317 I2 Campus Centre

1. Retour sur la séance du 18 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

3. Approfondissement: L’analyse factorielle des correspondances

L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
 

4. Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.

Expressions régulières, spécificités, cooccurrences.

>> télécharger le fichier .lis

5. Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels.

Exercice

Constitution de corpus :  Les déclarations de candidature Balisage XML ou fichiers texte.

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >> Boîte à outils de Textopol
  • >> Expressions régulières sous TextObserver
  • >> Importer un corpus au format txt
  • >> Baliser un corpus au format xml
  • >> Créer et utiliser une table morphosyntaxique

Corpus de travail

  • >> Corpus voeux xml (treetagger/TextObserver)
  • >> Notes (fichier tab)
  • >> Editos (tab)
  • >> Textes genres (txt)

Téléchargement de TextObserver

  • >> dernière version

Questions des participants, travaux sur les corpus

  •  >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO

Séance 1 – 18 novembre 2017

Séance 1 : Approches textométriques des discours – 18 novembre 2017

10h-13h salle 317 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

Séminaire 2017-18

Séminaire 2017-18

>> Version imprimable du programme

Calendrier

  • 18 novembre 2017 : Introduction – Approches textométriques des discours.
  • 16 décembre 2017 : Présentation et prise en main de TextObserver [10h-16h]
  • 20 janvier 2018 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
  • 24 février 2018 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
  • 24 mars 2018 : Exploration textométrique sur une base annotée – Prise en main du Trameur [10h-16h]
  • 21 avril 2018 : De la textométrie à l’analyse des données, quels outils pour quels usages? Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.

24-25 novembre – 2017 : Workshop ECLAVIT – Analyse et représentation de données textuelles expériences d’interaction entre concepteurs et utilisateurs https://eclavit.hypotheses.org/150

séance 5 – 22 avril 2017

Séance 5 : Corrélations et causalités interprétatives. Expérimentations, distancce intertextuelle et voisinages – 22 avril 2017

10h-13h salle i2 I2 317 Campus Centre

Présentation et pris en main d’Hyperbase

Hyperbase version local

Hyperbase en ligne

Références Hyperbase

  • >>2012: «Extraction des isotopies d’un corpus textuel», [En ligne], Volume XVII – n°3 (2012). Coordonné par Christophe Cusimano, revue Texto (avec Margareta KASTBERG SJÖBLOM)

séance 2 – 10 décembre 2016

Séance 2 : Présentation et prise en main de TextObserver – 10 décembre 2016

10h-16h salle 317 I2 Campus Centre

10h-10h15 : Retour sur la séance du 5 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

10h15-11h00 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

Approfondissement: L’analyse factorielle des correspondances 11h00-11h30:

L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.

11h30-13h00 : Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)

14h00-15h00 Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels.

15h00-16h00: Expérimentations: Lexico 5

(Tutoriel à venir)

Soumettre un corpus à TextObserver:

  • Surface (forme graphique)
  • Présentation de la base Textopol, nouvelle version.

Exercice:

Constitution de corpus :  Les déclarations de candidature

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>Boîte à outils de Textopol

Corpus de travail

  • >> Corpus voeux xml (treetagger/TextObserver)
  • >> Notes (fichier tab)
  • >> Editos (tab)
  • >> Textes genres (txt)

Téléchargement de TextObserver :

  • >> fichiers log
  • >> Version 39

Questions des participants, travaux sur les corpus

  •  >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO

Séance 1 – 5 novembre 2016

Séance 1 : Approches textométriques des discours – 5 novembre 2016

10h-13h salle 317 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

Séminaire 2016-17

Séminaire 2016-17

>> Version imprimable du programme

Calendrier

  • 5 novembre 2016 : Introduction – Approches textométriques des discours.
  • 10 décembre 2016 : Présentation et prise en main de TextObserver [10h-16h]
  • 21 janvier 2017 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
  • 25 février 2017 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
  • 25 mars 2017 : Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.
  • 22 avril 2017 : De la textométrie à l’analyse des données, quels outils pour quels usages?

Courant 2016 – 2017 : 3e journée de présentation des outils de traitements de corpus textuels ; Stages de formation à TextObserver (dates à préciser)

Outils de traitement de corpus textuels développés à Paris Est – 2eme édition

Outils de traitement de corpus textuels développés à Paris Est : Démonstrations, formations, ateliers – 2eme édition

Cette journée se tiendra le 29 juin prochain à l’UPEC, Campus Centre, salles I2-306 et I2-317, 61 avenue du Général de Gaulle, 94000 Créteil (ligne 8 – Métro Université) .   A l’interface entre sciences du langage, informatique et statistique, le traitement automatique de données textuelles vise des applications multiples : tests d’hypothèses à partir de productions écrites ou orales, analyses exploratoires de corpus web, journalistiques, politiques ou littéraires, visualisation d’opinions, extraction d’informations, etc. Plusieurs laboratoires de l’Université Paris-Est développent des outils dédiés au traitement automatique de données textuelles : TextObserver, Unitex/ Gramlab, TreeCloud, CorText Manager. Ils se proposent de les présenter, le 29 juin 2016 à l’UPEC, à leurs utilisateurs potentiels, mais aussi aux concepteurs de méthodologies ou d’outils qui exploitent des données textuelles.

>> télécharger le programme

Atelier Treecloud (i2 306)

Atelier CorText Manager (i2 306)

Atelier Unitex/Gramlab (i2 317)

>> Unitex/Gramlab

Atelier Textobserver (i2 317)

Merci de confirmer votre participation au moyen du formulaire suivant :

http://goo.gl/forms/RuKrrBx7xSvgjLG22

la journée du 29 juin sur le site d’ECLAVIT

séance 6 – 07 mai 2016

Séance 6 : 07 avril 2016

10h-14h salle i2 317 Campus Centre

  1. Présentation du logiciel Iramuteq sur le corpus vœux et autres données (Xavier MABIRE, Université Lumière Lyon 2,EA 4163 GRePS)
  2. Présentation et prise en main de l’outil Hyperbase. Présentation générale, exercice sur le corpus des vœux présidentiels
  3. Sandy Emonot UPE/ Céditec) : Quelques considérations sur richesse du vocabulaire et hapax sur un texte littéraire.
    >>> support de communication (pdf)
    >>> support de communication (ppt)
  4. Présentation du logiciel Nvivo. (M. Pérès, UFR LLH, UPEC).

seminaire doctoral Pas de catégorie