Séance 5 – 24 mars 2018

Séance 5 – 24 mars 2018

Emilie Née (UPEC, Céditec) : i-Trameur

Matinée sera consacrée à la présentation et à la prise en main du Trameur et de i-Trameur, développés par Serge Fleury (Syled/Cla2T, université Sorbonne nouvelle Paris 3).

Ressources

  • >> corpus brut
  • >> base à importer
  • >> i-Trameur

Téléchargement

  • >> Exécutable windows
  • >> Exécutable windows (64 bits)
  • >> Exécutable Mac

Séance 4 – 24 février 2018

Séance 4 – 24 février 2018

P. Gambette (LIGM-MLV) : Les nuages arborés dans TextObserver et Treecloud.

C. Martineau (LIGM-MLV) : Présentation et prise en main du logiciel UNITEX.

Étude de cas : Phraséologie, recherche de cooccurrences multiples, grammaires. Extraction et analyse de formules rituelles : l’exemple du corpus vœux.

TextObserver

  • module de préparation de corpus
  • module catégorisation morphosyntaxique
  • module d’annotation/commentaires
  • topologies, cooccurrences

 

Séance 3 – 20 janvier 2018

Séance 3 – 20 janvier 2018

10h-13h salle 317 I2 Campus Centre

Transformer des textes pour les soumettre à des traitements automatisés.

>> diaporama REGEX et notepad++

Un outil de visualisation et de « design » de graphes: Gephi

>> diaporama Gephi

Questions des participants, travail sur les corpus, (TextObserver)

 

Séance 2 – 16 décembre 2017

Séance 2 : Présentation et prise en main de TextObserver – 16 décembre 2017

10h-16h salle 317 I2 Campus Centre

1. Retour sur la séance du 18 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

2. Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

3. Approfondissement: L’analyse factorielle des correspondances

L’analyse factorielle des correspondances, le tableau lexical. Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.
 

4. Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation.

Expressions régulières, spécificités, cooccurrences.

>> télécharger le fichier .lis

5. Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels.

Exercice

Constitution de corpus :  Les déclarations de candidature Balisage XML ou fichiers texte.

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >> Boîte à outils de Textopol
  • >> Expressions régulières sous TextObserver
  • >> Importer un corpus au format txt
  • >> Baliser un corpus au format xml
  • >> Créer et utiliser une table morphosyntaxique

Corpus de travail

  • >> Corpus voeux xml (treetagger/TextObserver)
  • >> Notes (fichier tab)
  • >> Editos (tab)
  • >> Textes genres (txt)

Téléchargement de TextObserver

  • >> dernière version

Questions des participants, travaux sur les corpus

  •  >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO

Séance 1 – 18 novembre 2017

Séance 1 : Approches textométriques des discours – 18 novembre 2017

10h-13h salle 317 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

Séminaire 2017-18

Séminaire 2017-18

>> Version imprimable du programme

Calendrier

  • 18 novembre 2017 : Introduction – Approches textométriques des discours.
  • 16 décembre 2017 : Présentation et prise en main de TextObserver [10h-16h]
  • 20 janvier 2018 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter, visualiser, interpréter).
  • 24 février 2018 : De la lexicométrie au traitement automatique des langues (TAL) [10h-16h]
  • 24 mars 2018 : Exploration textométrique sur une base annotée – Prise en main du Trameur [10h-16h]
  • 21 avril 2018 : De la textométrie à l’analyse des données, quels outils pour quels usages? Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.

24-25 novembre – 2017 : Workshop ECLAVIT – Analyse et représentation de données textuelles expériences d’interaction entre concepteurs et utilisateurs https://eclavit.hypotheses.org/150

séance 5 – 22 avril 2017

Séance 5 : Corrélations et causalités interprétatives. Expérimentations, distancce intertextuelle et voisinages – 22 avril 2017

10h-13h salle i2 I2 317 Campus Centre

Présentation et pris en main d’Hyperbase

Hyperbase version local

Hyperbase en ligne

Références Hyperbase

  • >>2012: «Extraction des isotopies d’un corpus textuel», [En ligne], Volume XVII – n°3 (2012). Coordonné par Christophe Cusimano, revue Texto (avec Margareta KASTBERG SJÖBLOM)

séance 2 – 10 décembre 2016

Séance 2 : Présentation et prise en main de TextObserver – 10 décembre 2016

10h-16h salle 317 I2 Campus Centre

10h-10h15 : Retour sur la séance du 5 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

10h15-11h00 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

Approfondissement: L’analyse factorielle des correspondances 11h00-11h30:

L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.

11h30-13h00 : Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)

14h00-15h00 Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels.

15h00-16h00: Expérimentations: Lexico 5

(Tutoriel à venir)

Soumettre un corpus à TextObserver:

  • Surface (forme graphique)
  • Présentation de la base Textopol, nouvelle version.

Exercice:

Constitution de corpus :  Les déclarations de candidature

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>Boîte à outils de Textopol

Corpus de travail

  • >> Corpus voeux xml (treetagger/TextObserver)
  • >> Notes (fichier tab)
  • >> Editos (tab)
  • >> Textes genres (txt)

Téléchargement de TextObserver :

  • >> fichiers log
  • >> Version 39

Questions des participants, travaux sur les corpus

  •  >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO

Séance 1 – 5 novembre 2016

Séance 1 : Approches textométriques des discours – 5 novembre 2016

10h-13h salle 317 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

seminaire doctoral Pas de catégorie