Importer un corpus au format TXT

Dans cette configuration, il s’agit de traiter un dossier contenant plusieurs fichiers texte.

Dans ce cas il n’est pas nécessaire d’introduire de balisage, la partition sera créée en fonction du nom des fichiers.

Procédure: placer dans un dossier les différentes parties du corpus au format texte brut. (Un fichier par partie).

Exemple du corpus textes_genres

>> Télécharger ce corpus

Décompresser l’archive et copier le dossier textes_genres dans le répertoire de TextObserver

Le dossier textes_ genres contient 5 fichiers txt

Lancer TextObserver (voir procédure)

Importer le corpus au moyen de la procédure suivante :

Menu Fichier > Importer> Répertoire de corpus> Format TXT…

importer-fichiers-texte

Choisir le dossier contenant les fichiers texte

importer-fichiers-texte2

Cliquer sur « Ouvrir » après avoir choisi le bon encodage

choix_partition

Choisir les propriétés lorsque le panneau ci-dessus apparaît.

Cliquer sur « Créer les tables lexicales ».

A l’issue de la procédure le message suivant s’affiche.

creation_table

Après validation, ouvrir la table ainsi créée.  (Fichier > Ouvrir > Table(s) Lexicale(s)…)

menu-ouvrir-table-lex

ouverture_table

Le corpus est prêt, l’exploration peut commencer…

resultat