séance 4 – 2 avril 2022

séance 4 – 2 avril 2022

[zoom]
  • Étiqueter un corpus
  • Expérimentations au moyen du logiciel TextObserver et visualisation des données sous Gephi (voir ci-dessous dans ressources pour installer le logiciel avant la séance)

Transformer des textes pour les soumettre à des traitements automatisés. (sous réserve)

  • Balisage, encodage, nettoyage des données
  • Expressions régulières, rechercher remplacer (notepad ++)

Ressources