RapCor

RapCor

RAPCOR est un corpus de rap pour l’analyse socio-lexicale du français contemporain et une base de données textuelles pour l’enrichissement du lexique à destination des apprenants.

Créé à partir de 2008 au sein de l’Institut des Langues et Littératures romanes de la Faculté des Lettres de l’Université Masaryk de Brno, RAPCOR sert de base à des analyses sociodidactiques, traductologiques et lexicométriques. Quelques 2000 chansons sont en cours de traitement et plus de 700 chansons sont déjà annotées et disponibles pour des recherches quantitatives via un module adapté de la plate-forme TXM.

L’import de la base RAPCOR à TEXTBOSERVER permettra d’apporter des preuves de la naissance et de la diffusion des néologismes, (Les hapax idiolectaux des rappeurs peuvent se transformer en mots identitaires à travers la chanson), permettra d’observer en synchronie dynamique les chaînes synonymiques, les procédés typiques du français substandard tels que la verlanisation, les hésitations graphiques, etc.

Le projet ciblera également les analyses thématiques et les analyses sur les sous-genres musicaux (gansta rap, rap revendicatif…)

Alena Podhorná-Polická, Université Masaryk, Brno.

>> Vers le site RapCor

Base textopol

Base de données textuelles socio-politiques

La base Textopol propose, à des fins de recherche et de formation, des textes socio-politiques contemporains réunis en corpus, issus des travaux des enseignants chercheurs et des doctorants du Céditec (2000 – 2006). Elle contient également des données textuelles antérieures (18ème au 20ème siècle), recueillies au Laboratoire de lexicologie politique et de lexicométrie de l’ENS St Cloud (1967-2000, UMR 8503 du CNRS).

 

 

La version statique donne un accès simplifié au texte

La version dynamique permettra à court terme d’interroger la base au moyen de fonctionnalités portant sur les différents champs descriptifs (auteur, date, thématique, titre…) mais offre dès à présent la possibilité de rechercher un document par mots du titre, d’accéder à une fiche descriptive détaillée, puis au texte, selon la disponibilité du document.

Elle offre par ailleurs aux utilisateurs membres la possibilité d’enrichir les données, soit en mettant leur corpus à disposition soit en le référençant simplement, sans donner l’accès au texte.

Une procédure est en développement, qui permettra à chacun de modifier les champs descriptifs du corpus dont il a la responsabilité

 

Bases de données textuelles

Bases de données textuelles

FRANTEXT

>> http://www.atilf.fr/frantext.htm

>> http://www.frantext.fr/

Guide d’interrogation de FRANTEXT – (site de l’ENS-LSH). Rédigé par Charles Bernet

(ICAR, UMR 5191 du CNRS) et Gisèle Kahn (CID, ENS-LSH)

>> http://cid.ens-lsh.fr/

POLITEXT

>> http://www.unice.fr/bcl/rubrique57

>> http://bcl.unice.fr/politext/

DOCUMENTATION FRANÇAISE (Bibliothèque des discours publics)

>> http://discours-publics.ladocumentationfrancaise.fr

LEXISNEXIS

>> http://global.lexisnexis

PROJET GUTEMBERG

>> http://www.gutenberg.org/wiki/Main_Page