Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Skip to main content

    Mathieu VALETTE

    Cet article propose une methodologie de semantique de corpus pour les applications en fouille de textes s’adossant sur l’examen critique des points de divergence du traitement automatique des langues (TAL) et de l’analyse statistique des... more
    Cet article propose une methodologie de semantique de corpus pour les applications en fouille de textes s’adossant sur l’examen critique des points de divergence du traitement automatique des langues (TAL) et de l’analyse statistique des donnees textuelles (et plus particulierement de la textometrie). Nous souhaitons mettre en evidence leurs specificites methodologiques et tirer parti a la fois de l’intelligence hermeneutique de la textometrie fondee sur un soin philologique particulier et de la rigueur des methodes d’evaluation mises en œuvre dans le TAL. Nous illustrons notre propos a l’aide d’une etude de fouille d’opinion portant sur la detection automatique des prises de position des deputes sur un corpus de debats parlementaires (28832 interventions). L’etude permet de mettre en evidence qu’un nombre relativement reduit de marqueurs semantiques relevant de la dialogique (positions enonciatives) et de la dialectique (strategie rhetorique) suffisait a caracteriser les positions ideologiques et d’identifier des acteurs stereotypes que nous appelons des agonistes.
    Fonds audiovisuel de l’Inalco, France, © 2019L'Inalco organise la conférence internationale sur l'arménien à l'ère du numérique, rassemblant chercheurs et entreprises : nouvelles technologies pour l'arménien, traitement... more
    Fonds audiovisuel de l’Inalco, France, © 2019L'Inalco organise la conférence internationale sur l'arménien à l'ère du numérique, rassemblant chercheurs et entreprises : nouvelles technologies pour l'arménien, traitement automatique de la langue, e-enseignement, e-corpus, intelligence artificielle, etc. Digital Armenian est le rendez-vous des acteurs de la dynamisation de la langue arménienne à l'ère du numérique. Thème 1 : E-corpus, E-dictionnaires, Traitement automatique des Langues Dictionnaires numériques, corpus annotés, banque de textes, les ressources pour l'arménien sont nombreuses et complémentaires. Ce thème envisage de dresser un état de l’art de ces ressources et des innovations qu'elles proposent.Il peut aussi permettre de mettre en lumière les liens que ces ressources peuvent nouer. Quelles sont leurs spécificités ? Peut-on envisager un portage des fonctionnalités ? Quelles normes d’annotation suivent ces corpus ? Un partage des données peut-...
    National audienc
    National audienc
    This article aims to review a possible contribution of corpus semantics to digital humanities, relying on an example of text profiling and text mining based on data from the social Web. We will focus, in particular, on the expression of... more
    This article aims to review a possible contribution of corpus semantics to digital humanities, relying on an example of text profiling and text mining based on data from the social Web. We will focus, in particular, on the expression of contrasting values and points of view, allowing us to develop the concept of ‘agonist’. First, we sketch out a critical overview of the relationship between NLP and semantics. Then we quickly outline how to provide text mining tools to corpus semantics. Finally, we illustrate our discussion with an example from applications. We wish, in particular, to highlight the potential benefit of a methodological dialogue between theory (text semantics), textometric methods and current NLP practices in terms of algorithms but, above all, evaluation.
    This paper is in the context of strategic and competitive intelligence on the Web (medium sized corpora). We propose a linguistic approach for document clustering based on the analysis of a second-order cooccurrences graph. The topic we... more
    This paper is in the context of strategic and competitive intelligence on the Web (medium sized corpora). We propose a linguistic approach for document clustering based on the analysis of a second-order cooccurrences graph. The topic we build can overlap (i.e. a word can be part of more than 1 topic – polysemic words, homographs, etc.) and only include the strongest words. Because of graph theory formalism, we are able to express subtle semantic relations between words within each topic, which are thus not only sets of words. Using these words, we are then able to assign one or more topics to each document.
    A partir d<right single quotation mark>un travail de relecture reposant sur un corpus composé d<right single quotation mark>articles, de conférences, mais aussi de brouillons et de réflexions inédites, l<right single... more
    A partir d<right single quotation mark>un travail de relecture reposant sur un corpus composé d<right single quotation mark>articles, de conférences, mais aussi de brouillons et de réflexions inédites, l<right single quotation mark>A. rend compte de l<right single quotation ...
    When Humanities scientists are writes, their theories can considered as text. Our purpose is to discuss the consequences of this claim, sketching out a methodology based on text semantics and corpora linguistics. In a certain way, we hope... more
    When Humanities scientists are writes, their theories can considered as text. Our purpose is to discuss the consequences of this claim, sketching out a methodology based on text semantics and corpora linguistics. In a certain way, we hope to continue European philogical tradition. Our analysis is based on a 1,600,000-word corpus mad eup of conferences, books and articles written by French linguist Gustave Guillaume (1883-1960). After a brief epistemological introduction, the paper will focus on three topics : (i) the correlated evolution of lexicon and conceptual systems during the inception of theory (from philosophical speculation to scientific theory) ; (ii) linkage between lexicalisation and conceptualisation by means of morphemic variations and lexical creativity (concept of "act" and its derivations) ; (iii) recourse to trope analysis to characterise and define a concept regardless of the scientist's aim (concept of "mechanism).
    Le filtrage de contenus illicites sur Internet est une problématique difficile qui est actuellement résolue par des approches à base de listes noires et de mots-clés. Les systèmes de classification textuelle par apprentissage automatique... more
    Le filtrage de contenus illicites sur Internet est une problématique difficile qui est actuellement résolue par des approches à base de listes noires et de mots-clés. Les systèmes de classification textuelle par apprentissage automatique nécessitant peu d’interventions humaines, elles peuvent avantageusement remplacer ou compléter les méthodes précédentes pour faciliter les mises à jour. Ces techniques, traditionnellement utilisées avec des catégories définies par leur sujet (économie ou sport par exemple), sont fondées sur la présence ou l’absence de mots. Nous présentons une évaluation de ces techniques pour le filtrage de contenus racistes. Contrairement aux cas traditionnels, les documents ne doivent pas être catégorisés suivant leur sujet mais suivant le point de vue énoncé (raciste ou antiraciste). Nos résultats montrent que les classifieurs, essentiellement lexicaux, sont néanmoins bien adaptées : plus de 90% des documents sont correctement classés, voir même 99% si l’on acce...
    L'etude se situe dans un contexte de veille lexicale. Elle cherche a faire emerger de facon semi-automatique l'evolution de sens du nom propre Outreau, analysee manuellement dans une etude anterieure (Lecolle, 2007).
    Nous etudions dans cet article la distribution d'unites lexicales designant les pratiquant·e·s de sport de plein air (joggeur/joggeuse, randonneur/randonneuse, runneur/runneuse, promeneur/promeneuse) afin d'identifier les... more
    Nous etudions dans cet article la distribution d'unites lexicales designant les pratiquant·e·s de sport de plein air (joggeur/joggeuse, randonneur/randonneuse, runneur/runneuse, promeneur/promeneuse) afin d'identifier les correlations entre genres sexuels, themes semantiques et genres textuels dans le discours journalistique en francais. Le corpus est constitue a partir d'un echantillonnage d'articles de la presse quotidienne regionale. Il apparait que dans le discours journalistique, on observe une convergence entre genres sexuels et genres textuels par le biais des classes semantiques instanciees.
    La presente etude met en œuvre une procedure d'annotation de corpus en traits semantiques inspiree de principes de la semantique textuelle. Elle cherche a evaluer d'une part la validite de l'annotation, d'autre part ses... more
    La presente etude met en œuvre une procedure d'annotation de corpus en traits semantiques inspiree de principes de la semantique textuelle. Elle cherche a evaluer d'une part la validite de l'annotation, d'autre part ses apports par rapport a une approche lexicale classique a partir d'un outil lexicometrique classique, le calcul des specificites.
    Ce papier expose une expérience de classification menée sur un corpus de définitions dictionnairiques. Le cadre général de cette recherche est la constitution d’une ressource lexico-sémantique fondée sur une conception structuraliste du... more
    Ce papier expose une expérience de classification menée sur un corpus de définitions dictionnairiques. Le cadre général de cette recherche est la constitution d’une ressource lexico-sémantique fondée sur une conception structuraliste du sens (le contenu sémantique d’une unité lexicale est structuré en sèmes ; le sens d’un texte émerge de faisceaux de regroupements sémiques stabilisés). L’objectif de l’expérience rapportée est de découvrir des classes sémantiques à partir de définitions dictionnairiques avec la méthode CAH. Les classes sémantiques regroupent des unités lexicales en fonction de sèmes génériques (i.e. communs à toutes les unités lexicales de la classe) et s’organisent différentiellement en fonction de sèmes spécifiques. À partir d’une sélection d’entrées dictionnairiques partageant le sème générique /arbre/, nous étudions la distribution et l’organisation d’une hypothétique classe sémantique liée au domaine de la sylviculture.
    La terminologie textuelle s’est particulièrement consacrée à l’extraction de candidats termes dans les textes pour les expertiser et le cas échéant les valider comme concepts termes. Elle s’est en revanche peu intéressée à l’émergence de... more
    La terminologie textuelle s’est particulièrement consacrée à l’extraction de candidats termes dans les textes pour les expertiser et le cas échéant les valider comme concepts termes. Elle s’est en revanche peu intéressée à l’émergence de ces concepts dans les textes. Cependant, elle a promu l’idée que les textes sont les lieux de production des termes. Notre objectif est d’illustrer l’hypothèse qu’avant d’accéder au statut de signes dont les signifiés sont normés (les termes), les concepts émergents se manifestent dans les textes sous des formes hétérogènes telles que de coalitions récurrentes de traits sémantiques qui se coaguleront ou non en unités lexicales nouvelles. Ces coalitions ont valeur de préconcepts.
    Cet article entend dresser, dans un premier temps, un panorama critique des relations entre TAL et linguistique. Puis, il esquisse une discussion sur l’apport possible d’une sémantique de corpus dans un contexte applicatif en s’appuyant... more
    Cet article entend dresser, dans un premier temps, un panorama critique des relations entre TAL et linguistique. Puis, il esquisse une discussion sur l’apport possible d’une sémantique de corpus dans un contexte applicatif en s’appuyant sur plusieurs expériences en fouille de textes subjectifs (analyse de sentiments et fouille d’opinions). Ces expériences se démarquent des approches traditionnelles fondées sur la recherche de marqueurs axiologiques explicites par l’utilisation de critères relevant des représentations des acteurs (composante dialogique) et des structures argumentatives et narratives des textes (composante dialectique). Nous souhaitons de cette façon mettre en lumière le bénéfice d’un dialogue méthodologique entre une théorie (la sémantique textuelle), des méthodes de linguistique de corpus orientées vers l’analyse du sens (la textométrie) et les usages actuels du TAL en termes d’algorithmiques (apprentissage automatique) mais aussi de méthodologie d’évaluation des ré...
    Dans cet article, nous présentons une méthodologie pour l’identification de messages suspectés d’être produits par des Community Managers à des fins commerciales déguisées dans des documents du Web 2.0. Le champ d’application est la... more
    Dans cet article, nous présentons une méthodologie pour l’identification de messages suspectés d’être produits par des Community Managers à des fins commerciales déguisées dans des documents du Web 2.0. Le champ d’application est la malbouffe (junkfood) et le corpus est multilingue (anglais, chinois, français). Nous exposons dans un premier temps la stratégie de constitution et d’annotation de nos corpus, en explicitant notamment notre guide d’annotation, puis nous développons la méthode adoptée, basée sur la combinaison d’une analyse textométrique et d’un apprentissage supervisé.
    Depuis une dizaine d'annees, le TAL s'interesse a la subjectivite, notamment dans la perspective d'applications telles que la fouille d'opinion et l'analyse des sentiments. Or, la linguistique de corpus outillee par... more
    Depuis une dizaine d'annees, le TAL s'interesse a la subjectivite, notamment dans la perspective d'applications telles que la fouille d'opinion et l'analyse des sentiments. Or, la linguistique de corpus outillee par des methodes textometriques a souvent aborde la question de la subjectivite dans les textes. Notre objectif est de montrer d'une part, ce que pourrait apporter a l'analyse des sentiments l'analyse textometrique et d'autre part, comment mutualiser les avantages d'une association entre celle-ci et une methode de classification automatique basee sur l'apprentissage supervise. En nous appuyant sur un corpus de temoignages issus de forums de discussion, nous montrerons que la prise en compte de criteres selectionnes suivant une analyse textometrique permet d'obtenir des resultats de classification satisfaisants par rapport a une vision purement lexicale.
    Notre objectif est de faire se rencontrer les pratiques courantes de Traitement Automatique des Langues (TAL) avec celles de la semantique textuelle outillee par la textometrie. Nous dressons un panorama de ces deux pratiques qui... more
    Notre objectif est de faire se rencontrer les pratiques courantes de Traitement Automatique des Langues (TAL) avec celles de la semantique textuelle outillee par la textometrie. Nous dressons un panorama de ces deux pratiques qui etablissent peu de liens alors qu'elles travaillent avec le meme materiau textuel. Afin de provoquer une rencontre, nous nous appuyons sur l'exemple d'une application d'analyse des sentiments. Comme c'est le cas pour beaucoup d'autres applications du domaine, nous utilisons les algorithmes d'apprentissage automatique mais les descripteurs choisis sont issus d'une analyse textometrique du corpus et structures suivant une grille de lecture inspiree de la semantique textuelle. Ainsi, nous mettons en evidence que les criteres axiologiques (thymiques) habituellement utilises dans l'analyse de sentiments ne contribuent que marginalement dans la classification. D'autres criteres (dialogiques et dialectiques), lies au deroule...
    Ce papier propose une reflexion sur les lexiques semantiques generalistes. L'expose s'articule en deux parties : nous esquissons un parcours critique sur les ressources lexico-semantiques existantes en questionnant leur... more
    Ce papier propose une reflexion sur les lexiques semantiques generalistes. L'expose s'articule en deux parties : nous esquissons un parcours critique sur les ressources lexico-semantiques existantes en questionnant leur arriere-plan theorique et en tentant de repondre a la question de leurs finalites ; puis, en guise d'ouverture, nous presentons un projet de constitution de lexique semantique dont les presupposes epistemologiques se singularisent par la volonte de prendre en consideration les pratiques textuelles d'une part et par le choix des niveaux de description (infralexicaux et textuels, plutot que lexicaux et propositionnels) d'autre part.
    Il s'agit d'esquisser les conditions theoriques d'une approche textuelle de la conceptualisation. Nous souhaitons illustrer l'hypothese qu'avant d'acceder au statut de signes dont les signifies sont normes (i.e.... more
    Il s'agit d'esquisser les conditions theoriques d'une approche textuelle de la conceptualisation. Nous souhaitons illustrer l'hypothese qu'avant d'acceder au statut de signes dont les signifies sont normes (i.e. les termes), les concepts emergents se manifestent dans les textes sous des formes heterogenes telles que des groupements recurrents de traits semantiques qui se stabiliseront – ou non – en unites lexicales nouvelles. Ces coalitions ont valeur de preconcepts ou de protosemies. L'enjeu est de decrire et de modeliser ce processus d'emergence pour lui donner, a terme, une place dans une theorie de la terminologie. Au plan pratique, l'objectif est de fournir a moyen termes des outils d'identification et de detection pour la veille et la constitution de terminologies.
    Nous presentons une plateforme de veille lexicale destinee a l'etude des phenomenes neologiques. La methode generale que mise en oeuvre vise a identifier les candidats a la neologie en confortant des corpus, c'est-a-dire des... more
    Nous presentons une plateforme de veille lexicale destinee a l'etude des phenomenes neologiques. La methode generale que mise en oeuvre vise a identifier les candidats a la neologie en confortant des corpus, c'est-a-dire des archives des pratiques linguistiques, et des lexiques, consideres comme les simulations des usages lexicaux correspondants. Dans le cadre de cette etude, nous detaillons deux des modules de la plateforme : un logiciel d'acquisition automatique de candidats a la neologie formelle et categorielle et une base de donnees dediee a l'observation des candidats. Puis, nous exposons notre problematique en nous appuyant sur une etude de cas. Nous construisons a cette occasion les notions de richesses neologique et de creativite lexicale, en lien avec les genres textuels.
    Cette etude se situe dans le contexte de recherches en veille lexicale. L'enjeu est d'obtenir une representation du sememe du nom Outreau a partir d'un corpus annote en traits semantiques. Cette representation est construite... more
    Cette etude se situe dans le contexte de recherches en veille lexicale. L'enjeu est d'obtenir une representation du sememe du nom Outreau a partir d'un corpus annote en traits semantiques. Cette representation est construite de facon semi-automatique sur critere de renforcement semique d'informations presentes sur le plan lexical, evalue par des indicateurs statistiques. Nous etudierons l'evolution diachronique de deux types de sememes : d'une part, des sememes ponctuels du mot Outreau, propres a differents stades de l'affaire judiciaire eponyme et a traits semantiques variables, d'autre part un sememe global, representatif de l'affaire dans son ensemble mais a structure variable dans le temps par phenomenes d'actualisations. La validation s'appuiera sur la confrontation des resultats obtenus par la procedure semi-automatique a une etude linguistique anterieure de l'evolution diachronique d'Outreau.
    This paper gives an overview of the MultiTal project, which aims to create a research infrastructure that ensures long-term distribution of NLP tools descriptions. The goal is to make NLP tools more accessible and usable to end-users of... more
    This paper gives an overview of the MultiTal project, which aims to create a research infrastructure that ensures long-term distribution of NLP tools descriptions. The goal is to make NLP tools more accessible and usable to end-users of different disciplines. The infrastructure is built on a meta-data scheme modelling and standardising multilingual NLP tools documentation. The model is conceptualised using an OWL ontology. The formal representation of the ontology allows us to automatically generate organised and structured documentation in different languages for each represented tool.
    Il est un clivage entre les linguistiquescognitives nord-americaines et les linguistes cognitives et/ou enonciatives francaises qu'on ne peut ignorer : les Etats-Unis, les grammaires cognitives de la cote ouest occupent le haut du... more
    Il est un clivage entre les linguistiquescognitives nord-americaines et les linguistes cognitives et/ou enonciatives francaises qu'on ne peut ignorer : les Etats-Unis, les grammaires cognitives de la cote ouest occupent le haut du pave et les theories europeennes y sont manifestement inconnues ; tandis qu'en France les travaux des Anglo-Saxons cohabitent sans difficulte avec les theories hexagonales.
    Historique d'actualisation et d'enonciation francaise de Saussure a Benveniste ; retour paradigmatique initiee par Culioli a la fin des annees 60 comme reaction a la grammaire generative ; etude des theories de Culioli.
    RESUME . Cet article entend faire le point sur la contribution possible d’une semantique de corpus (Rastier, 2011) aux humanites numeriques, en s’appuyant sur differents exemples de traitement de fouilles de textes issus du Web social.... more
    RESUME . Cet article entend faire le point sur la contribution possible d’une semantique de corpus (Rastier, 2011) aux humanites numeriques, en s’appuyant sur differents exemples de traitement de fouilles de textes issus du Web social. Nous entendrons donc les humanites numeriques, dans cet article, dans l’acception emergente liees l’analyse des donnees sociales issues du Web. Nous nous interesserons en particulier aux productions textuelles d’internautes exprimant des valeurs et des points de vue clives, ce qui nous permet d’elaborer le concept d’agoniste. Mots-cles  : Semantique de corpus ; humanites numeriques ; Web social. ABSTRACT. This article aims to review the possible contribution of a corpus of semantics (Rastier, 2011) to the digital humanities, relying on several examples of texts excavated treatment from the social Web. We hear the digital humanities, in this article, in the emerging sense related analyzing social data from the Web. We will focus in particular on textua...
    La demande pressante des institutions en matiere de protection des usagers contre les contenus illicites ou prejudiciables sur Internet (racisme, xenophobie, pedophilie) invite a depasser les systemes de filtrage automatique... more
    La demande pressante des institutions en matiere de protection des usagers contre les contenus illicites ou prejudiciables sur Internet (racisme, xenophobie, pedophilie) invite a depasser les systemes de filtrage automatique conventionnels bases sur des listes de mots-cles ou des annuaires d'adresses preetablies, peu efficaces et exigeant de frequentes mises a jour. Princip, la plate-forme multilingue de detection de pages Web racistes dont nous presentons quelques aspects, met en jeu une analyse semantique globale, multicritere, et differentielle des documents. Elle repose a la fois sur les propositions theoriques de la semantique interpretative et les possibilites offertes par l'implementation dans un systeme multi-agents, tout en se demarquant des approches ontologiques classiques.
    La demande pressante des institutions en matiere de protection des usagers contre les contenus illicites ou prejudiciables sur Internet (racisme, xenophobie, pedophilie) invite a depasser les systemes de filtrage automatique... more
    La demande pressante des institutions en matiere de protection des usagers contre les contenus illicites ou prejudiciables sur Internet (racisme, xenophobie, pedophilie) invite a depasser les systemes de filtrage automatique conventionnels bases sur des listes de mots-cles ou des annuaires d'adresse preetablies, peu efficaces et exigeant de frequentes mises a jour. L'objectif de la plate-forme multilingue de detection de pages web racistes et revisionnistes PRINCIP est de mettre en oeuvre une analyse semantique globale, multi-criteres, et differentielle des documents reposant a la fois sur les statistiques textuelles, l'extraction de syntagmes, et les propositions theoriques de la semantique de Francois Rastier. Nous presentons ici les resultats obtenus dans cette optique en combinant l'utilisation de deux outils distincts, Lexter (Didier Bourigault) et Hyperbase (Etienne Brunet).
    Cet article s’inscrit dans les recherches sur l’exploitation de ressources terminologiques pour l’analyse de textes de spécialité, leur annotation et leur indexation. Les ressources en présence sont, d’une part, un thesaurus des Sciences... more
    Cet article s’inscrit dans les recherches sur l’exploitation de ressources terminologiques pour l’analyse de textes de spécialité, leur annotation et leur indexation. Les ressources en présence sont, d’une part, un thesaurus des Sciences du Langage, le Thesaulangue et, d’autre part, un corpus d’échantillons issus de cinq ouvrages relevant du même domaine. L’article a deux objectifs. Le premier est de déterminer dans quelle mesure les termes de Thesaulangue sont représentés dans les textes. Le second est d’évaluer si les occurrences des unités lexicales correspondant aux termes de Thesaulangue relèvent majoritairement d’emplois terminologiques ou de langue courante. A cette fin, les travaux présentés utilisent une mesure de richesse lexicale telle qu’elle a été définie par Brunet (rapporté dans Muller, 1992) dans le domaine de la lexicométrie, l’indice W. Cette mesure est adaptée afin de mesurer la richesse terminologie (co-occurrents lexicaux et sémantiques qui apparaissent dans The...
    Polarity classification (positive, negative or neutral opinion detection) is well developed in the field of opinion mining. However, existing tools, which perform with high accuracy on short sentences and explicit expressions, have... more
    Polarity classification (positive, negative or neutral opinion detection) is well developed in the field of opinion mining. However, existing tools, which perform with high accuracy on short sentences and explicit expressions, have limited success interpreting narrative phrases and inference contexts. In this article, we will discuss an important aspect of opinion mining: inference. We will give our definition of inference, classify different types, provide an annotation framework and analyze the annotation results. While inferences are often studied in the field of Natural-language understanding (NLU), we propose to examine inference as it relates to opinion mining. Firstly, based on linguistic analysis, we clarify what kind of sentence contains an inference. We define five types of inference: logical inference, pragmatic inference, lexical inference, enunciative inference and discursive inference. Second, we explain our annotation framework which includes both inference detection ...
    The aim of this paper is to set out some of the proposals of text semantics for information retrieval - more specifically for content-based text classification. To start with, we will assess the contribution of linguistics to information... more
    The aim of this paper is to set out some of the proposals of text semantics for information retrieval - more specifically for content-based text classification. To start with, we will assess the contribution of linguistics to information retrieval by means of natural language processing techniques. This will give us an opportunity to look at the achievements that have been secured and to examine standard linguistic approaches to information retrieval. In particular, we will focus on the slow emergence of text considerations as the web expands. We intend to show that the ever-greater attention raised by text linguistics comes at a critical juncture in the evolution of information retrieval on the web. We will show how text categorisation is a departure from traditional approaches. The second and third parts will go into greater detail and examine the way text linguistics can apply to information retrieval. We will first lay out the methods used within the framework of a project aimin...
    La place croissante du numerique dans les pratiques langagieres, textuelles et discursives, et le developpement des donnees, ressources et outils numeriques interrogent fondamentalement le linguiste.L'echange propose s'ancrera... more
    La place croissante du numerique dans les pratiques langagieres, textuelles et discursives, et le developpement des donnees, ressources et outils numeriques interrogent fondamentalement le linguiste.L'echange propose s'ancrera plus specifiquement dans le terrain de la linguistique textuelle et de l'analyse du discours, et decrira les modifications que le numerique implique dans la production et la circulation des textes et des discours, ainsi que dans les modalites de leur analyse et interpretation linguistiques. Ces modifications se situent a plusieurs niveaux.Modifications des formes langagieres, textuelles et discursivesLa production verbale en contexte numerique (en ligne ou hors ligne) implique des modifications dans les formes langagieres elles-memes (sur les plans graphique, morphographique, technomorphographique notamment) ; dans les formes phrastiques et discursives en production comme en reception (delinearisation hypertextuelle par exemple, qui implique un en...

    And 22 more