Archives pour la catégorie Quick start

Formes spécifiques (par parties)

Calcul de spécificité sur une forme graphique

Une fois la table lexicale chargée dans TextObserver (voir billets précédents), le calcul des spécificités pour une partie considérée peut s’effectuer de deux façons différentes.

1. Dans le tutoriel qui suit, l’utilisateur est tout d’abord invité à cliquer sur un point colonne de l’AFC (clic droit sur une partie du corpus).
Cette action a pour effet de créer la liste des formes spécifiques pour la partie considérée.
2. La deuxième option consiste à utiliser l’onglet formes spécifiques, à choisir une partie du corpus dans le menu déroulant. Il convient ensuite de valider ce choix en activant le bouton « appliquer »
Le tableau produit peut être exporté au format XLS (données tabulées).

>> tutoriel interactif

Importer un corpus au format TXT

Dans cette configuration, il s’agit de traiter un dossier contenant plusieurs fichiers texte.

Dans ce cas il n’est pas nécessaire d’introduire de balisage, la partition sera créée en fonction du nom des fichiers.

Procédure: placer dans un dossier les différentes parties du corpus au format texte brut. (Un fichier par partie).

Exemple du corpus textes_genres

>> Télécharger ce corpus

Décompresser l’archive et copier le dossier textes_genres dans le répertoire de TextObserver

Le dossier textes_ genres contient 5 fichiers txt

Lancer TextObserver (voir procédure)

Importer le corpus au moyen de la procédure suivante :

Menu Fichier > Importer> Répertoire de corpus> Format TXT…

importer-fichiers-texte

Choisir le dossier contenant les fichiers texte

importer-fichiers-texte2

Cliquer sur « Ouvrir » après avoir choisi le bon encodage

choix_partition

Choisir les propriétés lorsque le panneau ci-dessus apparaît.

Cliquer sur « Créer les tables lexicales ».

A l’issue de la procédure le message suivant s’affiche.

creation_table

Après validation, ouvrir la table ainsi créée.  (Fichier > Ouvrir > Table(s) Lexicale(s)…)

menu-ouvrir-table-lex

ouverture_table

Le corpus est prêt, l’exploration peut commencer…

resultat

Charger une table lexicale existante

TextObserver permet de générer des analyses factorielles des correspondances sur tout tableau de données, qu’il s’agisse d’une table lexicale générée par TextObserver,  par un autre outil ou d’un tableau de données construit avec un tableur comme excel ou open office.

1. Créer manuellement un tableau de données

L’exemple qui suit consiste à soumettre à TextObserver un tableau de données (notes) qui a été saisi manuellement.

Construire une table de données pour TextObserver (sur un tableur). Exemple carnet de notes (Télécharger le fichier compressé, NB : le décompresser avant de l’utiliser).

notes_eleve

Enregistrer le fichier au format « Texte (séparateur : tabulation) (*.txt) »

enregitrer

Renommer le fichier en changeant l’extension « .txt » pour « .tab »

renommer

Placer ce fichier en racine du répertoire de TextObserver

placer_fichier

Lancer TextObserver et charger la table en faisant Ouvrir > Table(s) lexicale(s)… (voir ci-dessous)

menu-ouvrir-table-lex

Choisir notes_eleves.tab

ouvrir_notes

Résultat :

result_notes

2.Ouvrir une table générée par TextObserver

Le fichier voeux.tab a été généré par TextObserver après import de corpus.

Pour l’ouvrir:

ouvrir-table

Choisir la table que vous désirez charger…

9-choix-table lexicale

NB : Il est également possible de charger une table lexicale calculée sur Lexico3 ou Astartext

imports-tables-astartext

imports-tables-lexico3

Importer un corpus xml

TextObserver permet d’importer des corpus sous forme de fichiers texte partitionnés (un fichier par partition, le tout dans un dossier), des corpus balisés en xml (pour faciliter la tâche nous avons développé un utilitaire nommé TextEncoder. Celui-ci permet de transformer facilement un corpus étiqueté sous Cordial, Treetagger ou tout autre outil générant des données tabulées en fichier xml).

>> voir rubrique : Balisage xml sur la forme graphique

1. Import du fichier xml

Ce fichier dont l’extension doit impérativement être xml, doit être placé dans un dossier en racine de TextObserver.

Lancer TextObserver puis :

Menu Fichier>Importer>Répertoire de corpus>Format xml…

2-importer-xmlV2

Choisir le dossier contenant le fichier xml à importer et, si nécessaire, modifier le type d’encodage (*)

3-choix-dossier-xml

2. Création des tables lexicales

Une fois le calcul fait, TextObserver affiche la fenêtre ci-dessous proposant de choisir les partitions et les propriétés permettant de créer différentes tables lexicales. Ainsi, TextObserver, dans l’exemple ci-dessous, créera une table lexicale discours_date sur la propriété word et une table discours_loc sur la même propriété. Sur un corpus catégorisé, il n’est pas nécessaire de cocher les cases pos ou lemme pour effectuer des recherches portant sur toutes les dimensions du corpus. En revanche si l’on souhaite créer une analyse factorielle portant sur les pos ou les lemmes il faudra cocher ces options.

Remarque : Les propriétés dépendent de l’encodage choisi pour construire le fichier xml et ne sont pas limitées aux trois de cet exemple (>> voir rubrique création d’un corpus xml)

5-sellection-element-table-lexicale

Valider « Créer les tables lexicales » lance leur fabrication.

7-reussite-creation-table

3. Chargement des tables lexicales

Menu Fichier>Ouvrir>Table(s) lexicale(s) (.tab)…

8-import-table-lexcaleV2

Choisir la table que vous désirez charger…

9-choix-table lexicale

11-affichage-debut-AFC

* : Le type d’encodage d’un fichier peut facilement être vérifié ou modifié grâce au logiciel gratuit et libre Notepad++ (voir manuel Notepad++ sur Textopol) Il permet également de transformer rapidement un fichier balisé pour Lexico3 en fichier xml (idem)

Affichage simultané de 4 partitions d’un même corpus xml

4tables-issues-meme-corpus-xml

Télécharger et installer TextObserver

1. télécharger le dossier compressé et le placer dans le dossier de votre choix sur votre ordinateur
(TextObserver ne nécessite pas d’installation)

1-TO-dossiercompresse

2. décompresser le dossier précédemment téléchargé (clic-droit > extraire tout ou extraire ici)

2-decompresser-le-dossier

3. contenu du dossier décompressé

3-contenu-dossier-TO

4. Pour lancer TextObserver double-cliquer sur run.bat ou run-log.bat (le fichier run-log.bat génère un fichier texte  [log.txt] que vous pouvez nous envoyer en cas d’erreur pour identifier les problèmes éventuels)

5. TextObserver est prêt à être utilisé (Import de corpus, de table lexicale…).

1-interface_TO