séance 3 Séminaire Textopol 15/12/12

Séance 3 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, explorer, analyser) – 15 décembre 2012


1. Cours – Rappels

–  Caractériser un texte: types grammaticaux, lexicaux propriétés linguistiques et statistiques. L’exemple de Cordial et de Tropes
– Explorations textuelles en surface et sur les catégories morphosyntaxiques

2. Annotation de corpus textuels : Forme graphique, catégories morphosyntaxiques, univers sémantiques

2.1. Prise en main de quelques catégoriseurs, évaluateurs, étiqueteurs (cordial, treetager, tropes)

 – Prise en main de Cordial: Catégoriser un texte, le situer par rapport à un corpus de référence…
– Prise en main de Tropes: Ontologies sémantiques et catégories grammaticales.
– Catégoriser un corpus avec Treetager

2.2. Utiliser les résultats d’un outil pour le soumettre aux autres

– Tropes et TextObserver/ Cordial Textobserver)

 2.2. Exploration de corpus textuels

– Première prise en main du logiciel Hyperbase (préparation de la séance de février)
Formes/Catégories/Structures
– Rechercher des motifs textuels – En surface ou à partir de catégories morphosyntaxiques, sémantiques…
L’exemple de Weblex: Interrogation langage CQP (préparation de la séance TXM)

3. Etude de cas : Analyser des corpus multimodaux

 – Application de TextObserver à l’analyse automatisée de pages web.

4. Après-midi : Atelier Web design ou travail sur le corpus des participants

– Comprendre le web : Outils graphiques. Initiation à illustrator
– Développement web : Prise en main de Dreamweaver. Ergonomie des interfaces.

 Ressources  

>>  Corpus test pour Cordial/Treetager/Tropes

>>  Corpus test Hypertag

>>  Recherche de motifs textuels

>> Lien vers ressources infographie édition web

>> tutoriels Dreamweaver, Illustrator, indesign, Flash…