Network


Latest external collaboration on country level. Dive into details by clicking on the dots.

Hotspot


Dive into the research topics where Cédric Lopez is active.

Publication


Featured researches published by Cédric Lopez.


CINEO 2015 | 2016

« La néographie dans un grand corpus de SMS français : 88milSMS ».

Mathieu Roche; Bertrand Verine; Cédric Lopez; Rachel Panckhurst

Depuis 2014, le corpus 88milSMS est disponible en telechargement public (Panckhurst et al., 2014, http://88milsms.huma-num.fr/). Contenant plus de 88 000 SMS authentiques en francais recueillis dans le cadre du projet sud4scienceLR (http://www.sud4science.org/), ce corpus anonymise permet aux chercheurs d’analyser, en employant ou non des techniques de traitement automatique des langues (TAL), l’evolution de l’une des facettes de la langue francaise, l’ecriture SMS (eSMS). nDans cet article, nous laisserons de cote la neologie dans sa dimension de creativite lexicale — derivation, les mots-valises (cinglicite), les emprunts (now, wesh), l’ecriture non intentionnee, correspondant souvent a des erreurs de saisie (tladucteur), ou l’ecriture incluant des caracteres speciaux, des chiffres (resto+cine, Ar5gggggggh), (Detrie 2015), pour aborder plus specifiquement la neographie, ou la creativite scripturale, bien que les frontieres entre neologie (« une realite difficile a cerner » selon Pruvost/Sablayrolles, 2012) et neographie soient parfois tenues (Cougnon 2015). Comme Anis (1998), nous designons par neographie des variantes de graphie qui s’eloignent de la langue standardisee, souvent de maniere deliberee, ludique, et qui sont tres presentes et instables dans l’eSMS. Dans des travaux preliminaires, nous avons rencontre, entre autres, des phenomenes neographiques de substitution (o/eau, ossi/aussi, kikou/coucou, twa/toi), d’ajout (repetition de caracteres/signes de ponctuation : booooooooof/bof, j’arrriiiiiiivvve !!!!!, ajouts de caracteres : les zamours, representations semiologiques/frimousses/emoji,:), ^^,J), de suppression (signes diacritiques: europeen/europeen, ponctuation), et de reduction, (abregements morpho-lexicaux: mdr/mort de rire, apocopes : ordi/ordinateur, aphereses : zou/bisou, suppression de consonnes doubles : ele/elle, fins de mots effacees : tro/trop, agglutinations : tetrangle, squelettes consonantiques : slt/salut, abreviations : qd/quand, abreviations semantisees : f=fais/fera(i)s/faisais : tu f koi ?). nNous confronterons notre typologie, § 1 (Panckhurst 2009, Panckhurst et al. 2013), au corpus 88milSMS a partir d’un fichier genere informatiquement (Lopez/Roche/Panckhurst 2015), apres exclusion des mots apparaissant au sein du Lexique Electronique des Formes Flechies du Francais (LEFFF, (Sagot 2010)). Il s’agit de mieux comprendre quelles sont les pratiques scripturales de l’eSMS qui sont les plus redondantes au sein de 88milSMS. Outre une etude statistique § 2, nous focaliserons cette communication sur les lettres uniques qui renvoient a un mot (« tu f koi ? »), en etudiant dans quelle mesure un meme scripteur varie ses pratiques, et en correlant les usages aux caracteristiques sociologiques indiquees dans le questionnaire annexe a la collecte § 3.


IC | 2010

Titrage automatique de documents électroniques par extraction de syntagmes nominaux.

Cédric Lopez; Violaine Prince; Mathieu Roche


PLIN-Day | 2016

“Non-standard texts: from theoretical positions to Natural Language Processing normalisation”.

Cédric Lopez; Mathieu Roche; Rachel Panckhurst


Revue Tranel (Travaux neuchâtelois de linguistique) | 2015

« Classification des items inconnus de 88milSMS : aide à l’identification automatique de la créativité scripturale »,

Cédric Lopez; Mathieu Roche; Rachel Panckhurst


Archive | 2015

88milSMS. A corpus of authentic text messages in French

Rachel Panckhurst; Catherine Détrie; Cédric Lopez; Claudine Moïse; Mathieu Roche; Bertrand Verine


north american chapter of the association for computational linguistics | 2012

NOMIT: Automatic Titling by Nominalizing

Cédric Lopez; Violaine Prince; Mathieu Roche


TALN: Traitement Automatique des Langues Naturelles | 2011

Approche de construction automatique de titres courts par des méthodes de Fouille du Web

Cédric Lopez; Mathieu Roche


INFORSID | 2011

Recherche documentaire par titrage automatique.

Cédric Lopez; Violaine Prince; Mathieu Roche


TALN 2017 | 2017

Typologies pour l’annotation de textes non standard en français.

Louise Tarrade; Cédric Lopez; Rachel Panckhurst; Georges Antoniadis


Archive | 2016

« 88milSMS. A corpus of authentic text messages in French ». In Chanier T. (éd) Banque de corpus CoMeRe. Ortolang : Nancy. https://hdl.handle.net/11403/comere/cmr-88milsms

Rachel Panckhurst; Catherine Détrie; Cédric Lopez; Claudine Moïse; Mathieu Roche; Bertrand Verine

Collaboration


Dive into the Cédric Lopez's collaboration.

Top Co-Authors

Avatar

Mathieu Roche

Centre national de la recherche scientifique

View shared research outputs
Top Co-Authors

Avatar

Violaine Prince

Centre national de la recherche scientifique

View shared research outputs
Top Co-Authors

Avatar

Romain Ravignot

Paris-Sorbonne University

View shared research outputs
Researchain Logo
Decentralizing Knowledge