Quantilille séance 2 : 23/06/2017

Quantilille séance 2 : 23/06/2017 – matin

Marie Pérès – Construire un corpus

Bien préparer son corpus avec word

>> télécharger le diaporama

  • utiliser les styles
  • rechercher remplacer
  • exporter au format txt

Notepad++

>> télécharger le diaporama expressions régulières

  • passer d’un balisage à un autre avec les expressions régulières

>> étiqueter un fichier xml pour TextObserver

Quantilille séance 2 : 23/06/2017 – après-midi

Jean-MArc Leblanc – Atelier pratique : Prise en main de Lexico 3 :

– Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

Introduction aux méthodes d’analyse informatique du discours

Introduction aux méthodes d’analyse informatique du discours

Crêt-Bérard – 24 au 26 mai 2017

>> https://www.cuso.ch/activity/?p=882&uid=3502

Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

Liens à visiter et revues à consulter :

En savoir plus sur Lexico 3

 

séance 5 – 22 avril 2017

Séance 5 : Corrélations et causalités interprétatives. Expérimentations, distancce intertextuelle et voisinages – 22 avril 2017

10h-13h salle i2 I2 317 Campus Centre

Présentation et pris en main d’Hyperbase

Hyperbase version local

Hyperbase en ligne

Références Hyperbase

  • >>2012: «Extraction des isotopies d’un corpus textuel», [En ligne], Volume XVII – n°3 (2012). Coordonné par Christophe Cusimano, revue Texto (avec Margareta KASTBERG SJÖBLOM)

séance 2 – 10 décembre 2016

Séance 2 : Présentation et prise en main de TextObserver – 10 décembre 2016

10h-16h salle 317 I2 Campus Centre

10h-10h15 : Retour sur la séance du 5 novembre (Initiation à Lexico3)

>> Prise en main de Lexico3 en 5 tutoriels interactifs

10h15-11h00 : Visualisation des données textuelles : Lexicométrie, Textométrie, Datasciences, Bigdatas, TAL et… Sciences du langage (PPT, JML)

>>> télécharger le support

Approfondissement: L’analyse factorielle des correspondances 11h00-11h30:

L’analyse factorielle des correspondances, le tableau lexical L’analyse factorielle, Lexico/TextObserver Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes l’exemple du carnet de notes.

11h30-13h00 : Interprétations/visualisations

Présentation/Démonstration de TextObserver (Corpus « voeux ») Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes, Problèmes de visualisation)

14h00-15h00 Travail en surface/catégorisations

Catégoriseurs morhposyntaxiques (cordial, Treetagger) Catégoriseurs sémantiques (Tropes) Recherche de motifs textuels.

15h00-16h00: Expérimentations: Lexico 5

(Tutoriel à venir)

Soumettre un corpus à TextObserver:

  • Surface (forme graphique)
  • Présentation de la base Textopol, nouvelle version.

Exercice:

Constitution de corpus :  Les déclarations de candidature

Ressources

  • >> Motifs et expression régulières (Cordial/TXM)
  • >> Etiquettes Treetagger (français)
  • >>Boîte à outils de Textopol

Corpus de travail

  • >> Corpus voeux xml (treetagger/TextObserver)
  • >> Notes (fichier tab)
  • >> Editos (tab)
  • >> Textes genres (txt)

Téléchargement de TextObserver :

  • >> fichiers log
  • >> Version 39

Questions des participants, travaux sur les corpus

  •  >> base textopol
  • >> expérimentation voeux
  • >> corpus candidatures
  • >> candidatures étudiants et politiques pour TO

Séance 1 – 5 novembre 2016

Séance 1 : Approches textométriques des discours – 5 novembre 2016

10h-13h salle 317 I2 Campus Centre

10h-11h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

11h-13h Atelier pratique

Prise en main de Lexico 3: – Fonctions documentaires, décomptes statistiques, modèles probabilistes. – Distributions statistiques, distributions linguistiques. – Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources: