Séminaire 2014-15

Séminaire 2014-15

>> Version imprimable du programme
>> Atelier infographie

Calendrier

  • 8 novembre 2014 : Introduction – Approches textométriques des discours.
  • 13 décembre 2014 : Comprendre l’analyse factorielle des correspondances.
  • 17 janvier 2015 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, étiqueter).
  • 7 février 2015 : Visualisation et interprétations des résultats. Analyse de contenu et analyse de discours.
  • 14 mars 2015 : Corrélations et causalités interprétatives. Expérimentations, distance intertextuelle et voisinages.
  • 11 avril 2015 : De la textométrie à l’analyse des données, quels outils pour quels usages?
  • Courant 2014 – 2015 : 2e journée de présentation des outils de traitements de corpus textuels
  • Stages de formation à TextObserver (dates à préciser)

sources Trameur

Trameur 
http://www.tal.univ-paris3.fr/trameur/

Mises à jour :

Téléchargement :

>> Vidéo de démonstration

séance 3 Séminaire Textopol 15/12/12

Séance 3 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, explorer, analyser) – 15 décembre 2012


1. Cours – Rappels

-  Caractériser un texte: types grammaticaux, lexicaux propriétés linguistiques et statistiques. L’exemple de Cordial et de Tropes
- Explorations textuelles en surface et sur les catégories morphosyntaxiques

2. Annotation de corpus textuels : Forme graphique, catégories morphosyntaxiques, univers sémantiques

2.1. Prise en main de quelques catégoriseurs, évaluateurs, étiqueteurs (cordial, treetager, tropes)

 - Prise en main de Cordial: Catégoriser un texte, le situer par rapport à un corpus de référence…
- Prise en main de Tropes: Ontologies sémantiques et catégories grammaticales.
- Catégoriser un corpus avec Treetager

2.2. Utiliser les résultats d’un outil pour le soumettre aux autres

- Tropes et TextObserver/ Cordial Textobserver)

 2.2. Exploration de corpus textuels

- Première prise en main du logiciel Hyperbase (préparation de la séance de février)
Formes/Catégories/Structures
- Rechercher des motifs textuels – En surface ou à partir de catégories morphosyntaxiques, sémantiques…
L’exemple de Weblex: Interrogation langage CQP (préparation de la séance TXM)

3. Etude de cas : Analyser des corpus multimodaux

 - Application de TextObserver à l’analyse automatisée de pages web.

4. Après-midi : Atelier Web design ou travail sur le corpus des participants

- Comprendre le web : Outils graphiques. Initiation à illustrator
- Développement web : Prise en main de Dreamweaver. Ergonomie des interfaces.

 Ressources  

>>  Corpus test pour Cordial/Treetager/Tropes

>>  Corpus test Hypertag

>>  Recherche de motifs textuels

>> Lien vers ressources infographie édition web

>> tutoriels Dreamweaver, Illustrator, indesign, Flash…

 

 

RapCor

RapCor

RAPCOR est un corpus de rap pour l’analyse socio-lexicale du français contemporain et une base de données textuelles pour l’enrichissement du lexique à destination des apprenants.

Créé à partir de 2008 au sein de l’Institut des Langues et Littératures romanes de la Faculté des Lettres de l’Université Masaryk de Brno, RAPCOR sert de base à des analyses sociodidactiques, traductologiques et lexicométriques. Quelques 2000 chansons sont en cours de traitement et plus de 700 chansons sont déjà annotées et disponibles pour des recherches quantitatives via un module adapté de la plate-forme TXM.

L’import de la base RAPCOR à TEXTBOSERVER permettra d’apporter des preuves de la naissance et de la diffusion des néologismes, (Les hapax idiolectaux des rappeurs peuvent se transformer en mots identitaires à travers la chanson), permettra d’observer en synchronie dynamique les chaînes synonymiques, les procédés typiques du français substandard tels que la verlanisation, les hésitations graphiques, etc.

Le projet ciblera également les analyses thématiques et les analyses sur les sous-genres musicaux (gansta rap, rap revendicatif…)

Alena Podhorná-Polická, Université Masaryk, Brno.

>> Vers le site RapCor

Textopol

BASE TEXTUELLE ET OUTILS INFORMATISÉS POUR L’ANALYSE DES DISCOURS SOCIOPOLITIQUESTextopol est un dispositif de recherche et de formation en lexicométrie pour le traitement automatisé des discours politiques. Il associe des instruments linguistiques et statistiques et des corpus textuels sociopolitiques. Il permet :

  • de prendre en main et de comparer divers logiciels et leurs propriétés,

  • de mener des analyses expérimentales sur des données à caractère politique, médiatique, institutionnel, sociolinguistique, voire littéraire,

  • de réaliser des recherches et des expérimentations discursives, énonciatives, lexicales, syntaxiques, sémantiques, dans des perspectives typologiques, argumentatives, communicationnelles, historiques, sociolinguistiques, rhétoriques, stylistiques, terminologiques, thématiques.

Le chantier Textopol du Céditec développe en outre TextObserver, outil de d’observation et d’exploitation des données textuelles multidimensionnelles

Le dispositif donne accès :

  • à la base de corpus textuels sociopolitiques Textopol,
  • au descriptif comparatif des outils statistiques ainsi qu’aux liens vers ces instruments et leur documentation,

  • à un pôle d’enseignement proposant un cours et des exercices de lexicométrie-textométrie,

  • aux ressources documentaires et aux liens sur les équipes et les recherches du domaine,

  • à une archive ouverte,
  • à un forum de discussion,
  • à un blog sur les voeux et le rituel politique.

outils
nouveau sur Textopol
accueil
domaine
Ressources
Enseignement
base textopol
Agora
Archives
contact
annonces
en savoir plus sur Textobserver
voeux
seminaires exterieurs