Séance 6 séminaire Textopol 23/03/13

Séminaire doctoral Informatique pour la recherche
Approches Textométriques – Ergonomies numérique

 

Séance 6 du 23 mars 2013

TXM, Iramuteq, TextObserver: outils open source pour l’analyse des données textuelles.

1. Introduction-rappels

- Rappel des séances précédentes.
- Panorama des outils existants.
- Quels outils pourquoi faire?

2. Weblex: Rappel de quelques fonctionnalités

- Cooccurrences associées à un pôle, lexicogrammes simples et récursifs
- Textes annotés, expressions CQP…

3. Initiation à TXM

- Installation, import de corpus, manipulations sur corpus de travail
- Etude de cas : A. Policka : Utilisation de la plate-forme TXM: Analyse du corpus Rapcor pour l’analyse socio-lexicale du français actuel  (A confirmer)

4. Outils de visualisation

- Introduction: Lexicométrie, textométrie, data-visualisation…
- Treecloud, Gephi, Linkurious…

5. Présentation du logiciel Iramuteq

- Téléchargement, installation, expérimentation sur corpus de travail

6. Etude de cas : Analyser des corpus multimodaux

- Application de TextObserver à l’analyse automatisée de pages web.

7. Préparation de la séance du 20 avril (10h-13h00)

>> Télécharger le corpus vœux encodé pour TXM
>> Télécharger le corpus « genres »

Séance 5 séminaire Textopol 23/02/13

Séance 5 du 23 février 2013

1. Rappel des séances précédentes.

- Rappel: approches longitudinales et contrastives: Alceste et Lexico sur un corpus de discours politiques.

2. Statistique multidimensionnelle:

- Classes Alceste, axes factoriels, des résultats identiques? Exemple corpus IREB

3. Cooccurrences

- Rappel: les calculs de cooccurrences

4. Prise en main du logiciel Hyperbase

- Présentation Hyperbase…

Fonctionnalités documentaires, statistiques et structurelles.
Listes: Recherche par mots, lemmes catégories, cumul détail…Distributions, AFC, une arborée, radiale ou rectangulaire…
Structure/distribution : Calculs de distance, accroissement lexical (par tranches ou par partition), richesse du vocabulaire
Evolution et coefficient de corrélation.
Thème, cooccurrences, réseaux, associations, corrélats

5. Etude de cas : Analyser des corpus multimodaux

- Application de TextObserver à l’analyse automatisée de pages web.

6. Questions corpus des participants.

Préparation de la séance 6: Installation/Présentation du logiciel Iramuteq

Pièce jointe : Corpus Balzac

Séance 4 séminaire Textopol 19/01/13

Séance 4 :Ontologies et mondes sémantiques : Tropes, Alceste, Astartex… – 19 janvier 2013

 

1. Cours – Rappel Identifier des thématiques:

annotation/ontologie de type tropes / méthode des cooccurrences
Cooccurrences généralisées, cooccurrences inter énoncés…

2. La méthodologie Alceste et les « mondes lexicaux »

- Quelques exemples de résultats:
Prise en main d’Alceste
- Balisage, mots étoilés, UCE, UCI…
- Exercice sur le corpus voeux 1959-2012 / Comparaison aux résultats 1959-2001
Expérimentations textométriques:
Alceste: Analyse en tri croisé
Utiliser les résultats d’un logiciel pour le soumettre à d’autres outils:
- Exemple d’Alceste et de Lexico [quantifier les énoncés rituels, politiques…)
- Analyse récursive au moyen d’Alceste:
Représentations factorielles Alceste/Lexico3

 

3. Exercice lexico3/Alceste/Tropes sur la campagne présidentielle de 2012 – meetings 1er tour

 

4. Après-midi : Travail sur le corpus des participants ou atelier Web design

- Comprendre le web : Outils graphiques. Initiation à illustrator
- Développement web : Prise en main de Dreamweaver. Ergonomie des interfaces

5. Séance du 23 février 2013:

Approfondissement Hyperbase/ Prise en main d’un logiciel open source: Iramuteq

Ressources:

>> Voeux 1959-2012 ALC
>> Premier tour lexico.txt
>> Base textopol

séance 3 Séminaire Textopol 15/12/12

Séance 3 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, explorer, analyser) – 15 décembre 2012


1. Cours – Rappels

-  Caractériser un texte: types grammaticaux, lexicaux propriétés linguistiques et statistiques. L’exemple de Cordial et de Tropes
- Explorations textuelles en surface et sur les catégories morphosyntaxiques

2. Annotation de corpus textuels : Forme graphique, catégories morphosyntaxiques, univers sémantiques

2.1. Prise en main de quelques catégoriseurs, évaluateurs, étiqueteurs (cordial, treetager, tropes)

 - Prise en main de Cordial: Catégoriser un texte, le situer par rapport à un corpus de référence…
- Prise en main de Tropes: Ontologies sémantiques et catégories grammaticales.
- Catégoriser un corpus avec Treetager

2.2. Utiliser les résultats d’un outil pour le soumettre aux autres

- Tropes et TextObserver/ Cordial Textobserver)

 2.2. Exploration de corpus textuels

- Première prise en main du logiciel Hyperbase (préparation de la séance de février)
Formes/Catégories/Structures
- Rechercher des motifs textuels – En surface ou à partir de catégories morphosyntaxiques, sémantiques…
L’exemple de Weblex: Interrogation langage CQP (préparation de la séance TXM)

3. Etude de cas : Analyser des corpus multimodaux

 - Application de TextObserver à l’analyse automatisée de pages web.

4. Après-midi : Atelier Web design ou travail sur le corpus des participants

- Comprendre le web : Outils graphiques. Initiation à illustrator
- Développement web : Prise en main de Dreamweaver. Ergonomie des interfaces.

 Ressources  

>>  Corpus test pour Cordial/Treetager/Tropes

>>  Corpus test Hypertag

>>  Recherche de motifs textuels

>> Lien vers ressources infographie édition web

>> tutoriels Dreamweaver, Illustrator, indesign, Flash…

 

 

séance 2 Séminaire Textopol 24/11/12

Séance 2 : Construire et analyser des corpus textométriques – 24 novembre 2012

10h-10h30
Retour sur la séance du 28 octobre (Initiation à Lexico3)

10h30-11h30
Approfondissement: L’analyse factorielle des correspondances

L’analyse factorielle des correspondances, le tableau lexical
L’analyse factorielle, Lexico3/TextObserver
Comprendre l’analyse factorielle des correspondances, profils lignes et colonnes
l’exemple du carnet de notes.

11h30-13h00
Interprétations/visualisations

Démonstration de TextObserver
Prise en main de TextObserver éléments d’interprétation (points contributifs, affichage points lignes et points colonnes,
Problèmes de visualisation)

14h -17h
Ateliers:

Travaux sur les corpus des participants
Outils bureautiques et multimédia: Transformer des textes pour les soumettre à des traitements automatisés. Repérer les régularités d’un document, extraire de motifs textuels.
>>> Ressources

17h00
 Préparation de la séance du 15 décembre

 Ressources
>>> Présentation de TextObserver
>>> Téléchargement version 22
>>> Téléchargement version 37

fichiers log

séance 1 Séminaire Textopol 20/10/12

Séance 1 : Approches textométriques des discours – 20 octobre 2012

10h-17h salle 306 I2 Campus Centre

10h-13h: Introduction :

Présentation et typologie pratique de logiciels standard et d’analyseurs de données textuelles. Options théoriques, principes méthodologiques, limites interprétatives.

14h-17h Atelier pratique

Prise en main de Lexico 3:

- Fonctions documentaires, décomptes statistiques, modèles probabilistes.

- Distributions statistiques, distributions linguistiques.

- Analyse factorielle des correspondances, spécificités, fréquences…..

Questions des participants

 

Ressources:

>> Lien vers le support

>> Corpus de travail

>> Accès à l’application

>> Enoncé – exercice-lexico

>> Quelques fonctionnalités de Lexico3

>> Barre d’outils de Lexico 3

>> Balisage Lexico3/Alceste 

 

Liens à visiter et revues à consulter :

http://jadt.org/

http://www.cavi.univ-paris3.fr/lexicometrica/

 En savoir plus sur Lexico 3

>>  Lexico 3 Paris3 Syled

>> Tutoriels (version provisoire page Textopol)

 

 

seminaire doctoral 2012-13
accueil seminaire doct
séances ouvertes
2013-14
séances 2013-14
séances 2014-15
2014-15
2015-16
séances 2015-16
2016-17
séances 2016-17