Outils de traitement de corpus textuels développés à Paris Est – 2eme édition

Outils de traitement de corpus textuels développés à Paris Est : Démonstrations, formations, ateliers – 2eme édition

Cette journée se tiendra le 29 juin prochain à l’UPEC, Campus Centre, salles I2-306 et I2-317, 61 avenue du Général de Gaulle, 94000 Créteil (ligne 8 – Métro Université) .   A l’interface entre sciences du langage, informatique et statistique, le traitement automatique de données textuelles vise des applications multiples : tests d’hypothèses à partir de productions écrites ou orales, analyses exploratoires de corpus web, journalistiques, politiques ou littéraires, visualisation d’opinions, extraction d’informations, etc. Plusieurs laboratoires de l’Université Paris-Est développent des outils dédiés au traitement automatique de données textuelles : TextObserver, Unitex/ Gramlab, TreeCloud, CorText Manager. Ils se proposent de les présenter, le 29 juin 2016 à l’UPEC, à leurs utilisateurs potentiels, mais aussi aux concepteurs de méthodologies ou d’outils qui exploitent des données textuelles.

>> télécharger le programme

Atelier Treecloud (i2 306)

Atelier CorText Manager (i2 306)

Atelier Unitex/Gramlab (i2 317)

>> Unitex/Gramlab

Atelier Textobserver (i2 317)

Merci de confirmer votre participation au moyen du formulaire suivant :

http://goo.gl/forms/RuKrrBx7xSvgjLG22

la journée du 29 juin sur le site d’ECLAVIT

Workshop lexicométrie

Workshop lexicométrie

Vendredi 10 juillet, salles I2 306 et I2 314 de Campus Centre. 10h00-17h00

Workshop organisé par : Emilie Née, Jean-Marc Leblanc

Merci de confirmer pour la matinée et pour l’après midi de façon à ce que nous organisions au mieux : http://doodle.com/8p5i269psd5r8p6e

  • 10h00-10h20 Présentation HAl (Philippe Gambette)
  • 10h30-13h00: Présentation et prise en main de Lexico 3.6 Emilie Née
  • Après midi: Approfondissement sur l’Analyse Factorielle des correspondances et présentation prise en main de TextoBserver (JML)
  • Présentation de la méthodologie Alceste (JML)

Le rituel politique en discours

Le rituel politique en discours

séminaire du Céditec, 12 juin 2015, 10h-17h

Bâtiment des Sciences Economiques et de Gestion – Mail des Mèches
matin : salle 302
après-midi : salle Keynes

Séminaire organisé par Loïse Billat (Unil) et JM. Leblanc (Upec – CEDITEC)

Cette journée d’étude, en amont de la préparation d’un numéro de revue sur le rituel politique, souhaite favoriser le dialogue entre plusieurs disciplines traitant chacune du rite en lien avec l’exercice du pouvoir. Cette journée d’étude souhaite creuser le rituel politique dans une perspective d’analyse du discours (à la suite par exemple de l’ouvrage sur le discours épidictique La mise en scène des valeurs : la rhétorique de l’éloge et du blâme, sous la direction de Marc Dominicy et Madeleine Frédéric, Jean-Michel Adam et alii) tout en incluant les contributions d’approches ou disciplines comme l’anthropologie, l’ethnographie, l’ethnométhodologie ou encore la sociologie politique. Néanmoins, toutes les communications devront prendre en considération la dimension énonciative du rituel politique et l’articuler à leur perspective théorique. Par rituel politique, nous entendons une pratique politique au sens large, citoyenne, fortement codifiée ou en cours de codification, qui peut se réaliser dans une pluralité de contextes : manifestations politiques, réunions délibératives, meetings partisans de plus ou moins grande importance, Assemblées Générales, allocutions lors de mobilisations (cortèges, grèves, mouvements sociaux), débats, allocutions présidentielles ou ministérielles à l’Assemblée nationale, télévisuelles, en public. Parmi les communications envisagées, les rituels « en devenir » ou « en train de se faire » sont fortement encouragés. Grâce notamment à l’internationalisation des mouvements protestataires au XXIème siècle et à internet, nous pouvons en effet remarquer des formes ressemblantes de prises de parole et de contexte d’énonciation comme c’est le cas pour le mouvement occupy, qui à la suite des Indignés espagnols, mettent en place des prises de parole publiques se réclamant de la démocratie « radicale » (Le Principe démocratie. Enquête sur les nouvelles formes du politique, Laugier, Ogien, 2014). Voit-on apparaitre des pratiques ritualisées dans ces mouvements horizontaux remettant en question la représentation politique et plus largement dans les multiples processus de « démocratie participative » ?

Cette journée se veut l’occasion de discuter la définition du rituel politique dans ses différents contextes socio-historiques, entre récurrences et discontinuités : Quelles sont les spécificités du rituel ? Pourrions-nous en proposer une définition qui soit généralisable à toutes les pratiques ritualisantes en politique ? Comment de nouveaux types de rituels apparaissent-ils ? Existe-t-il une pratique politique totalement indépendante d’éléments ritualisants, de mises en scène de la démocratie, de l’expertise, du pouvoir, ou de la participation ? Si les rituels sont codifiés de manière « rigide et immuable » pour légitimer le pouvoir, comment les citoyennes et citoyens peuvent-ils les investir ? Comment donner une modalité de sincérité à un rituel qui apparait comme un canevas préétabli ? Que se passe-t-il lorsque le rituel « échoue » ?

>> télécharger le programme

Résumés des interventions

Le discours de meeting électoral, entre rituel républicain et impératifs de médiatisation – Raphaël Haddad

Cette présentation est un état d’avancement d’une thèse portant sur le discours de meeting électoral démarrée en septembre 2011 à l’Université de Créteil sous la direction de Caroline Ollivier-Yaniv, et que je mène depuis l’origine en parallèle d’une activité de conseil en communication.

J’ai du opérer à une sélection des aspects qu’il me semblait important d’évoquer avec vous dans le temps imparti. Aussi, je vous propose d’intervenir pour 30 min en 3 directions.

En guise d’introduction, je rappellerai ce que l’analyse du discours a pu déjà dire du discours de meeting électoral.

Ensuite, je m’intéresserai au meeting électoral en tant que fait social, en rappelant ce que la sociologie politique et l’anthropologie politique ont pu en dire. Je montrerai comment le meeting électoral tente d’articuler tradition et modernité, ou plus précisément respect du rituel d’affrontement républicain d’une part et nécessités de sa médiatisation par des moyens divers d’autre part. Sur la base de cette hypothèse, je m’intéresserai plus particulièrement au succès des meetings sur la voie publique initiés par Jean-Luc Mélenchon en 2012 et qui, par mimétisme organisationnel se sont propagés à l’ensemble des formations politiques pendant la dernière élection présidentielle française.

Enfin, j’essaierai d’observer les manières dont ces deux dimensions, celle du rituel et celle de la médiatisation s’observent en discours. J’ai choisi de circonscrire notre observation sur un aspect du discours de meeting : ce que nous appelons «la formule d’adresse » en la situant notamment par rapport à la fonction rhétorique de l’exorde.

Exploration textométrique dans les « Causeries radiophoniques » de Pierre Mendès : parcourir le banal pour inférer le spécifique – Julien Bonneau

Le 11 novembre 1944, Pierre Mendès France – alors ministre de l’Economie nationale du Gouvernement provisoire – expose pour la première fois son « intention de revenir ici vous parler à intervalles réguliers pour vous indiquer les objectifs (…) la manière de les atteindre – et aussi pour vous tenir au courant (…) des résultats obtenus » (Mendès France, 1985, p. 75). Il entame ainsi son premier cycle de « causeries radiophoniques » – 20 interventions radiophoniqes qu’il instaure en « rituel » (Charaudeau & Maingueneau, 2002) réparties entre ce 11 novembre 1944 et le 6 janvier 1945 ; expérience qui se reproduira 10 ans plus tard lors de son mandat de Président du Conseil des ministres de la IVe République – avec 25 interventions supplémentaires entre le 26 juin 1954 et le 29 janvier 1955.

Souhaitant interroger le code et sa codification, nous décrirons les caractéristiques génériques de ces « causeries » et leur évolution diachronique en nous appuyant sur le corpus des Oeuvres Complètes de Pierre Mendès France. Pour ce faire, nous rechercherons les fonds et les formes sémantiques (Rastier, 2011) de ces interventions que nous définirons respectivement comme les régularités et les ruptures (Rastier, 2007) dans les réseaux cooccurrentiels (Mayaffre, 2014) des intertextes constitués (Bonneau, 2012) ; le sens étant le produit du contraste entre ces deux positions.

Outils de traitement de corpus textuels développés à Paris Est

Outils de traitement de corpus textuels développés à Paris Est : Présentations, démonstrations, formations

Cette journée se tiendra le 18 juin prochain à l’UPEC, Campus Centre, salles I2-306 et I2-314, 61 avenue du Général de Gaulle, 94000 Créteil (ligne 8 – Métro Université) A l’interface entre sciences du langage, informatique et statistique, le traitement automatique de données textuelles vise des applications multiples : tests d’hypothèses à partir de productions écrites ou orales, analyses exploratoires de corpus web, journalistiques, politiques ou littéraires, visualisation d’opinions, etc. Plusieurs laboratoires de l’Université Paris-Est développent des outils dédiés au traitement automatique de données textuelles : TextObserver, Unitex/Gramlab, TreeCloud, etc. Ils se proposent de les présenter, le 18 juin 2014 à l’UPEC, à leurs utilisateurs potentiels, mais aussi aux concepteurs de méthodologies ou d’outils qui exploitent des données textuelles.

Merci de confirmer votre participation au moyen du formulaire suivant: https://docs.google.com/forms/d/1I2BIOH26yRLZ6k9bGiXSCxtvEnjQQtuz4KZ-4fSdjhA/viewform

>> télécharger le programme  
>> Treecloud  
>> Unitex/Gramlab  
>> TextObserver  
>> Cortex  
>> seminaire Data Digital methods and mapping social complexity  

>> L. Villard – Présentation CorText Partie1
>> L. Villard – Présentation CorText Partie2

Séminaire du CEDITEC du 21 mars 2014

Corpus issus du web : enjeux, méthodes et outils

Séminaire du CEDITEC, vendredi 21 mars 2014, 14h-17h30

Séminaire organisé par Christine Barats, maître de conférences en sciences de l’information et de la communication et Jean-Marc Leblanc, maître de conférences en sciences du langage à l’UPEC, membres du Céditec.

Cette séance se propose d’examiner les enjeux méthodologiques liés à la constitution de corpus issus du web. L’accent portera sur ce que change le web par rapport aux méthodes de collecte de corpus propres aux analyses textométriques. Il s’agira d’examiner en quoi le web contribue à renouveler le questionnement sur ce moment privilégié d’une recherche que constitue la définition des critères de sélection d’un corpus et le choix des outils d’analyse. Les particularités des corpus issus du web exigent-elles une documentation spécifique des corpus ? Comment définir des critères de clôture et tenir compte des spécificités du dispositif (liens hypertextes, images, émoticon, flux…) ? Il s’agira également de mieux appréhender les outils de traitement et la nécessité d’articuler des approches quantitatives avec des approches qualitatives. Des exemples illustreront les interventions.

Intervants :

- « Collecte et analyse de corpus issus du web : une introduction »
Christine Barats, enseignante-chercheuse en SIC et membre du Céditec
Jean-Marc Leblanc, maître de conférence en Sciences du langage à l’UPEC, membre du Céditec, UPEC.

- « Le métalangage XML et les langages dérivés utilisés en sciences humaines, tels que Text Encoding Initiative (TEI) : quels apports pour le traitement, l’annotation, l’enrichissement de corpus textuels et multimodaux ? »
Florence Clavaud, conservateur en chef du patrimoine, responsable des référentiels documentaires aux Archives nationales, membre de l’EA 3624 (Centre Jean-Mabillon) de l’École nationale des chartes.

- « Les corpus web et l’approche textométrique: conditions de collecte et nécessaire combinaison d’approches quantitatives et qualitatives. »
Valérie Beaudoin, Enseignante-chercheuse en sciences sociales, Télécom ParisTech.

>> télécharger le diaporama de V. Beaudouin

>> télécharger le diaporama de la présentation de C. Barats et JM. Leblanc

Séminaire du CEDITEC du 24 mai 2013

Réflexion sur les visualisations en sciences humaines, quels apports pour la textométrie?

Séminaire du CEDITEC, vendredi 24 mai 2013, 10h30-17h30

Salle Keynes – Bâtiment des Sciences Economiques et de Gestion
Mail des Mèches
61 avenue du Général de Gaulle
94010 Créteil

>> programme
Métro Créteil Université, Ligne 8
Séance coordonnée par
JM Leblanc – UPEC – Céditec (EA 3119) – Chantier Textopol
jean-marc.leblanc@u-pec.fr

Supports de communication

« Modèles tridimensionnels pour la représentation de l’état des connaissances »
Marie Pérès: Docteure en histoire ancienne, plasticienne, (UPEC)

Proposera une contribution portant sur les problèmes posés par l’interprétation des données dans le cadre de la modélisation des sites archéologiques, et présentera des productions artistiques interrogeant les modalités de la représentation des données.

partie 1 : Données et visualisations

You need to install or upgrade Flash Player to view this content, install or upgrade by clicking here.

partie 2 : exemples de modélisation de site archéologique et productions artistiques

You need to install or upgrade Flash Player to view this content, install or upgrade by clicking here.

« Extraction automatisée et analyse de données à partir des pages web, quelles perspectives ? »
Jérôme Baray, PR géomarketing, (UPEC), Chercheur à l’Institut de Recherche en Gestion

Evoquera les problèmes de visualisation qui se posent dans le domaine des S.I.G (Systèmes d’Information Géographique) et proposera par ailleurs un outil d’extraction automatique de données à partir des pages web pour analyser le rayonnement des territoires, la notoriété et la valeur financière des marques ou encore établir un classement plus rationnel des revues de recherche.
L’intervention permettra en outre de poser les jalons d’un échange entre visualisation en SIG et textométrie et d’évoquer quelques perspectives de développement.

>> voir le support

« Nuages arborés et analyse textuelle. Présentation de l’outil TreeCloud »
Philippe Gambette, MCF informatique, LIGM, Université Paris-Est Marne la Vallée

Présentera la visualisation de textes en nuages arborés et ses applications en analyse textuelle, sur un corpus de théâtre et un corpus de presse, puis fera une démonstration du logiciel libre TreeCloud, téléchargeable sur treecloud.org, pour construire ces visualisations.

« Opérations sur graphes lexicographiques issus de corpus à des fins de visualisation sémantique »
Romain Loth, MoDyCo – UMR 7114 Université Paris Ouest Nanterre

Présentera des opérations sur graphes lexicaux permises par les librairies R et autres outils (définition matricielle, clustering puis travail sur les zones : sélection de parangon, intersections de zones,…), de ce que cela permet d’envisager comme visualisations de données et des pistes que cela alimente en retour sur la recherche lexicographique/sémantique.

>> voir le support

« Propositions de visualisations pour l’analyse des corpus textuels et multimodaux. TextObserver/WebObserver, état d’avancement des développements et perspectives »
JM Leblanc – MCF Linguistique informatique UPEC Céditec

Nous ferons plus particulièrement état des développements de TextObserver outil d’exploration des données textuelles multidimensionnelles et multimodales, conçu par notre équipe de recherche.
TextObserver est fondé initialement sur des préoccupations ergonomiques. Il propose des fonctionnalités originales sur le plan de la visualisation, rendues explicites par l’interactivité, et du traitement dynamique des données et des résultats textométriques. Il rend possible l’intégration de données textuelles diversifiées dans un cadre multimédia.
Il répond en temps réel aux questionnements expérimentaux comme les facteurs de la variation discursive.
Nous en présenterons les principes essentiels en prenant pour terrain d’expérimentation un corpus constitué de discours politiques rituels, (voeux de présidents de la cinquième République, de 1959 à 2012)

>> http://textopol.u-pec.fr/textobserver

>> voir le support

«TextObserver/WebObserver: L’utilisation d’agents communicants pour l’extraction et la visualisation de corpus textuels.»
Amani Daknou docteure en informatique, post-doc Ceditec

Nous proposons un système multi agent dynamique et ouvert qui vise à la recherche, la classification et l’extraction des informations nécessaires et pertinentes de pages web pour créer un corpus évolutif interrogeable en temps réel. Cette approche présente un grand avantage dans la mesure où elle déploie une collecte coopérative d’informations à base d’agents. Le système proposé permet donc de prendre en compte des contextes de recherche en considérant des regroupements de pages Web liés à des domaines particuliers. Ce système, couplé à la visualisation dynamique des résultats propre à TextObserver, constituera une fonctionnalité importante du dispositif.

>> voir le support

seminaire doctoral 2012-13
séances 2012-13
accueil seminaire doct
2013-14
séances 2013-14
séances 2014-15
2014-15
2015-16
séances 2015-16
2016-17
séances 2016-17
2017-18
séances 2017-18