Examen lexicométrique d’un dossier de presse audio-visuel : la libération d’Ingrid Betancourt mise en toile par le Figaro.fr

Sandra Tarazona
(M2, INFOCOM)

Dans le cadre du mémoire (M2), nous allons porter notre analyse sur les textes journalistiques de la presse française en ligne. Ces articles abordent une affaire polémique en Colombie et en France : l’ex-otage franco-colombienne Ingrid Betancourt. Nous allons donc examiner le « dossier spécial » que le Le Figaro.fr a dédié à la libération d’Ingrid Betancourt. Ce dossier est composé,  au présent  (04/04/2009),  de trente-cinq hyperliens dans la première page du site. Ces liens ont été archivés entre le 01/04/2008 et le 10/03/2009. Il faut aussi préciser la mise en toile des hyperliens. Placés par date d’apparition, ils créent une arborescence  contenant d’autres hyperliens reliés à l’affaire. Nous avons privilégiés les liens appartenant au Figaro.fr. Parmi ces hyperliens, nous trouvons d’une part des genres divers de la presse écrite : les récits, les études, l’opinion, et les commentaires. Et d’une autre part, les dispositifs appartenant au support électronique : les blogs, les forums, et les galeries multimédias.

Dans notre travail d’analyse la dimension lexicale est importante, et il nous a fallu évaluer la pertinence des outils lexicométriques dans une analyse de type non-contrastive. Nous allons donc caractériser le vocabulaire des textes en utilisant le logiciel Lexico 3. Premièrement, nous préciserons la constitution du corpus et des sous-corpus d’analyse, son « nettoyage » et <balisage>. Ensuite, nous présenterons une indexation hiérarchique qui met en relief la fréquence des formes contenues dans le dossier. Ceci permettra de repérer les protagonistes et les sujets privilégiés dans le dossier.  Les graphiques de ventilation pour les partitions « genre » et « date » illustreront l’apparition des groupes de formes concernant la France et la Colombie. Et le calcul de leurs spécificités montrera les formes sous et sur-employées.