Archives de catégorie : Quick start

Formes spécifiques (par parties)

Calcul de spécificité sur une forme graphique

Une fois la table lexicale chargée dans TextObserver (voir billets précédents), le calcul des spécificités pour une partie considérée peut s’effectuer de deux façons différentes.

1. Dans le tutoriel qui suit, l’utilisateur est tout d’abord invité à cliquer sur un point colonne de l’AFC (clic droit sur une partie du corpus).
Cette action a pour effet de créer la liste des formes spécifiques pour la partie considérée.
2. La deuxième option consiste à utiliser l’onglet formes spécifiques, à choisir une partie du corpus dans le menu déroulant. Il convient ensuite de valider ce choix en activant le bouton « appliquer »
Le tableau produit peut être exporté au format XLS (données tabulées).

>> tutoriel interactif

Importer un corpus au format TXT

Dans cette configuration, il s’agit de traiter un dossier contenant plusieurs fichiers texte.

Dans ce cas il n’est pas nécessaire d’introduire de balisage, la partition sera créée en fonction du nom des fichiers.

Procédure: placer dans un dossier les différentes parties du corpus au format texte brut. (Un fichier par partie).

Exemple du corpus textes_genres

>> Télécharger ce corpus

Décompresser l’archive et copier le dossier textes_genres dans le répertoire de TextObserver

Le dossier textes_ genres contient 5 fichiers txt

Lancer TextObserver (voir procédure)

Importer le corpus au moyen de la procédure suivante :

Menu Fichier > Importer> Répertoire de corpus> Format TXT…

importer-fichiers-texte

Choisir le dossier contenant les fichiers texte

importer-fichiers-texte2

Cliquer sur « Ouvrir » après avoir choisi le bon encodage

choix_partition

Choisir les propriétés lorsque le panneau ci-dessus apparaît.

Cliquer sur « Créer les tables lexicales ».

A l’issue de la procédure le message suivant s’affiche.

creation_table

Après validation, ouvrir la table ainsi créée.  (Fichier > Ouvrir > Table(s) Lexicale(s)…)

menu-ouvrir-table-lex

ouverture_table

Le corpus est prêt, l’exploration peut commencer…

resultatYou can load several text files once by loading a directory.

You don’t need to tag it. The parting will be done using the text files (one text eq. one partition).

In order to do that, place in a directory all the text files forming your corpus in plain text format (one file for each part).

An exemple : textes_genres corpus

Down load : >> http://textopol2.u-pec.fr/wp-content/uploads/2013/11/textes_genre.zip

Unzip the file and copy-paste the directory in the root directory of TextObserver

There is 5 text files in textes_ genres directory

 
 

Charger une table lexicale existante

TextObserver permet de générer des analyses factorielles des correspondances sur tout tableau de données, qu’il s’agisse d’une table lexicale générée par TextObserver,  par un autre outil ou d’un tableau de données construit avec un tableur comme excel ou open office.

1. Créer manuellement un tableau de données

L’exemple qui suit consiste à soumettre à TextObserver un tableau de données (notes) qui a été saisi manuellement.

Construire une table de données pour TextObserver (sur un tableur). Exemple carnet de notes (Télécharger le fichier compressé, NB : le décompresser avant de l’utiliser).

notes_eleve

Enregistrer le fichier au format « Texte (séparateur : tabulation) (*.txt) »

enregitrer

Renommer le fichier en changeant l’extension « .txt » pour « .tab »

renommer

Placer ce fichier en racine du répertoire de TextObserver

placer_fichier

Lancer TextObserver et charger la table en faisant Ouvrir > Table(s) lexicale(s)… (voir ci-dessous)

menu-ouvrir-table-lex

Choisir notes_eleves.tab

ouvrir_notes

Résultat :

result_notes

2.Ouvrir une table générée par TextObserver

Le fichier voeux.tab a été généré par TextObserver après import de corpus.

Pour l’ouvrir:

ouvrir-table

Choisir la table que vous désirez charger…

9-choix-table lexicale

NB : Il est également possible de charger une table lexicale calculée sur Lexico3 ou Astartext

imports-tables-astartext

imports-tables-lexico3TextObserver can create FAC using whatever data table you want. It can be a lexical table already created by TextObserver or another tool or a data table builds with a spreadsheet program (Excel, OpenOffice).

>> how to built a data table for TextObserver

The former exemple show how to submit a datad table to TextObserver (school marks). This data had been manually inputs.

The voeux.tab file has been processed by TextObserver at the end of the import of the corpus files.

Load it :

1. Loading of a lexical table already compute by TextObserver

ouvrir-table

Choose the file you want to load…

9-choix-table lexicale

2. You can load a file from Lexico3 or Astartext

imports-tables-astartext

imports-tables-lexico3

Importer un corpus xml

TextObserver permet d’importer des corpus sous forme de fichiers texte partitionnés (un fichier par partition, le tout dans un dossier), des corpus balisés en xml (pour faciliter la tâche nous avons développé un utilitaire nommé TextEncoder. Celui-ci permet de transformer facilement un corpus étiqueté sous Cordial, Treetagger ou tout autre outil générant des données tabulées en fichier xml).

>> voir rubrique : Balisage xml sur la forme graphique

1. Import du fichier xml

Ce fichier dont l’extension doit impérativement être xml, doit être placé dans un dossier en racine de TextObserver.

Lancer TextObserver puis :

Menu Fichier>Importer>Répertoire de corpus>Format xml…

2-importer-xmlV2

Choisir le dossier contenant le fichier xml à importer et, si nécessaire, modifier le type d’encodage (*)

3-choix-dossier-xml

2. Création des tables lexicales

Une fois le calcul fait, TextObserver affiche la fenêtre ci-dessous proposant de choisir les partitions et les propriétés permettant de créer différentes tables lexicales. Ainsi, TextObserver, dans l’exemple ci-dessous, créera une table lexicale discours_date sur la propriété word et une table discours_loc sur la même propriété. Sur un corpus catégorisé, il n’est pas nécessaire de cocher les cases pos ou lemme pour effectuer des recherches portant sur toutes les dimensions du corpus. En revanche si l’on souhaite créer une analyse factorielle portant sur les pos ou les lemmes il faudra cocher ces options.

Remarque : Les propriétés dépendent de l’encodage choisi pour construire le fichier xml et ne sont pas limitées aux trois de cet exemple (>> voir rubrique création d’un corpus xml)

5-sellection-element-table-lexicale

Valider « Créer les tables lexicales » lance leur fabrication.

7-reussite-creation-table

3. Chargement des tables lexicales

Menu Fichier>Ouvrir>Table(s) lexicale(s) (.tab)…

8-import-table-lexcaleV2

Choisir la table que vous désirez charger…

9-choix-table lexicale

11-affichage-debut-AFC

* : Le type d’encodage d’un fichier peut facilement être vérifié ou modifié grâce au logiciel gratuit et libre Notepad++ (voir manuel Notepad++ sur Textopol) Il permet également de transformer rapidement un fichier balisé pour Lexico3 en fichier xml (idem)

Affichage simultané de 4 partitions d’un même corpus xml

4tables-issues-meme-corpus-xmlWith TextObserver you can import multi-text files corpus (1 file per partition) or an xml tagged corpus (we have developed TextEncoder software in order to help you to quickly transform Cordial or Treetagger file in xml file).

1. Import xml file

Put the folder containing the xml file in the TextObserver root folder

In Textobserver :

Menu Fichier>Importer>Répertoire de corpus>Format xml…

2-importer-xmlV2

Select the folder containing the xml files you want to import, and eventually modify the encoding type (*)

3-choix-dossier-xml

2. Creating lexical tables

When the computing is complete, Textobserver open the following window and propose to choose which partition and properties you want in order to create matching lexical tables. The easiest way consists in using default settings. This let Textobserver create all lexical tables matching with xml main partition tags attributes.

In the example, theTextEncoder generated xml file is structure as follows :

corpus-xml-exemple-commentaire

TextObserver repère donc les deux attributs de la balise discours ce qui permet de créer deux tables une pour les discours par « date » l’autre pour les discours par « loc » (locuteurs).

5-sellection-element-table-lexicale

Valider « Créer les tables lexicales » lance leur fabrication.

7-reussite-creation-table

3. Chargement des tables lexicales

Menu Fichier>Ouvrir>Table(s) lexicale(s) (.tab)…

8-import-table-lexcaleV2

Choisir la table que vous désirez charger…

9-choix-table lexicale

11-affichage-debut-AFC

* : Le type d’encodage d’un fichier peut facilement être vérifié ou modifié grâce au logiciel gratuit et libre Notepad++ (voir manuel Notepad++ sur Textopol) Il permet également de transformer rapidement un fichier balisé pour Lexico3 en fichier xml (idem)

Télécharger et installer TextObserver

1. télécharger le dossier compressé et le placer dans le dossier de votre choix sur votre ordinateur
(TextObserver ne nécessite pas d’installation)

1-TO-dossiercompresse

2. décompresser le dossier précédemment téléchargé (clic-droit > extraire tout ou extraire ici)

2-decompresser-le-dossier

3. contenu du dossier décompressé

3-contenu-dossier-TO

4. Pour lancer TextObserver double-cliquer sur run.bat ou run-log.bat (le fichier run-log.bat génère un fichier texte  [log.txt] que vous pouvez nous envoyer en cas d’erreur pour identifier les problèmes éventuels)

5. TextObserver est prêt à être utilisé (Import de corpus, de table lexicale…).

1-interface_TO1. Upload the file and put it in whatever folder you want
(No software installation is required for TextObserver)

1-TO-dossiercompresse

2. Unzip the file you just download (Right-click > extract all or extract here)

2-decompresser-le-dossier

3. Folder content

3-contenu-dossier-TO

4. To launch TextObserver double-clicks on run.bat or run-log.bat (run-log.bat create a text file [log.txt] which you can send us in order to solve your problems)

5. TextObserver is ready to be used (corpus import, lexical table import...).

1-interface_TO