Séance 3 : Des corpus textuels aux corpus multimodaux (annoter, catégoriser, explorer, analyser) – 15 décembre 2012
1. Cours – Rappels
– Caractériser un texte: types grammaticaux, lexicaux propriétés linguistiques et statistiques. L’exemple de Cordial et de Tropes
– Explorations textuelles en surface et sur les catégories morphosyntaxiques
2. Annotation de corpus textuels : Forme graphique, catégories morphosyntaxiques, univers sémantiques
2.1. Prise en main de quelques catégoriseurs, évaluateurs, étiqueteurs (cordial, treetager, tropes)
– Prise en main de Cordial: Catégoriser un texte, le situer par rapport à un corpus de référence…
– Prise en main de Tropes: Ontologies sémantiques et catégories grammaticales.
– Catégoriser un corpus avec Treetager
2.2. Utiliser les résultats d’un outil pour le soumettre aux autres
– Tropes et TextObserver/ Cordial Textobserver)
2.2. Exploration de corpus textuels
– Première prise en main du logiciel Hyperbase (préparation de la séance de février)
Formes/Catégories/Structures
– Rechercher des motifs textuels – En surface ou à partir de catégories morphosyntaxiques, sémantiques…
L’exemple de Weblex: Interrogation langage CQP (préparation de la séance TXM)
3. Etude de cas : Analyser des corpus multimodaux
– Application de TextObserver à l’analyse automatisée de pages web.
4. Après-midi : Atelier Web design ou travail sur le corpus des participants
– Comprendre le web : Outils graphiques. Initiation à illustrator
– Développement web : Prise en main de Dreamweaver. Ergonomie des interfaces.
Ressources
>> Corpus test pour Cordial/Treetager/Tropes
>> Corpus test Hypertag
>> Recherche de motifs textuels
>> Lien vers ressources infographie édition web
>> tutoriels Dreamweaver, Illustrator, indesign, Flash…