Retour au texte => Recherche de motif

- Sur la forme graphique à partir de la fenêtre concordance -

Quelques fonctionnalités pour bien démarrer

Recherche d’une forme unique (forme graphique). Dans la fenêtre requête de l’onglet concordances saisir la forme recherchée et cliquer sur « appliquer ».

recherche d’une suite mots, portion de phrase, syntagme

Lorsque l’on recherche une suite de mots, une portion de phrase, un syntagme, chaque élément doit être saisi entre guillemets et séparé du suivant par un espace :

motif-suite-mots

Il est possible d’examiner la répartition du motif recherché entre les différentes parties du corpus en cliquant sur le bouton « spécificité »

Expressions régulières : rechercher la fin d’un mot

=> tout caractère suivi d’une suite fixe de caractères :
.*isme

motif-fin

>> tutoriel vidéo (constituer une liste à partir des résultats de la requête et modifier l’analyse factorielle des correspondances)

=> mot commençant par une suite fixe de caractères :
immigr.*

motif-debut

=> un mot suivi d’un autre avec un intervalle de x mots entre les deux :
« je » []{1,3} « voudrais »

motif-mot-suivit-mot-intervale

Cet exemple permet de trouver « je » suivi de 1 à 3 mots quelconques suivi de « voudrais ».

=> recherche de deux mots séparés par un intervalle quelconque
« an »[]* »disais »

« an » suivi de 0 à n mots quelconques suivi de « disais »

motif-mot-suivit-mot-intervaleinfini

=> disjonction :
« nous|Nous » « devons »

« nous » OU « Nous » suivi de « devons »

motif-OU1

=> exemple combinant la disjonction et des suites de mots :
« nous » « avons » []* « espérer|espoir|confiance »
« nous » « avons » []{1,20} « espérer|espoir|confiance »
« nous|Nous » « avons » []{1,20} « espérer|espoir|confiance|raison|raisons »

Le premier exemple permet de trouver « nous avons » suivi de « espérer » ou « espoir » ou « confiance » avec un intervalle libre de mots entre « nous avons » et l’autre mot.

motif-combine2

le second permet la même recherche mais définit un intervalle de 1 à 20 mots.

motif-combine1

le troisième ajoute permet d’obtenir le résultat qui suit

motif-combine3

Syntaxe du motif de recherche

Les caractères:

  • . : un point désigne n’importe quel caractère
  • ? : le point d’interrogation rend le caractère qui précède optionnel
  • tout autre caractère (s’il ne fait pas partie de la syntaxe des expressions) se désigne lui même (a désigne un a, b un b, etc… mais une * à une signification autre que le caractère *)

La recherche ci-dessous combine ainsi un v et un t avec un caractère libre entre les deux

motif-caractere-libre-caractere

La recherche ci-après rend le s en fin de mot optionnel

motif-caract-optionnel

Les répétitions

  • * : une étoile indique que le caractère présent juste avant se répète n’importe quel nombre de fois (de 0 à l’infini)
  • + : un plus indique que le caractère présent juste avant se répète au moins une fois et peut être présent plusieurs fois

Les ensembles

  • [] : un ensemble de crochets vide désigne un mot (ensemble de caractère)
  • []* : désigne un nombre infini de mots (de 0 à l’infini)
  • []{1,4} : désigne un nombre fini de mots (entre 1 et 4 compris)

[à venir : recherche de motifs sur catégories morphosyntaxiques]