International Journal of Applied Linguistics, 2020
This article proposes to define a “new” discipline within applied linguistics: ergonomic linguist... more This article proposes to define a “new” discipline within applied linguistics: ergonomic linguistics. The article addresses issues concerning language use within organizations, focusing on human‐oriented controlled natural languages (CNLs) whose role is to limit the problems encountered with natural language, in professional contexts in particular. An ergonomic linguistics approach involves first taking into account real linguistic productions and analyzing them with corpus linguistics methods, and then evaluating the efficacy of linguists’ recommendations using cognitive evaluation or acceptance tests. Two projects concerning human‐oriented CNLs that adopt an ergonomic linguistics approach are presented, the first in the space domain and the second in aeronautics.
This paper studies how the notion of Knowledge Rich Contexts (KRCs), initially defined as passage... more This paper studies how the notion of Knowledge Rich Contexts (KRCs), initially defined as passages of text allowing access to elements that define terms, has evolved. It discusses related work in Natural Language Processing (NLP), which has led to disciplinary convergence. It mainly presents the way in which KRCs can manifest themselves within a corpus, in the form of explicit or implicit markers and lexico-syntactic or morphological markers. Extra-linguistic elements are examined through the study of the domain and the textual genre of the corpus studied, and by the adaptation of KRCs to a particular demand (evolution in time, interdisciplinarity…). All types of functioning are illustrated with real data from different corpus-based studies. The study of the notion of KRC allows us to address fundamental questions in the linguistic study of specialized texts, such as the link between form and meaning and between linguistic and extra-linguistic contexts.
Manifestations linguistiques de la constitution d'une nouvelle science : le cas de l'exob... more Manifestations linguistiques de la constitution d'une nouvelle science : le cas de l'exobiologie
L’un des aspects de l’opposition verbo-nominale qui a ete le plus etudie dans les travaux de ling... more L’un des aspects de l’opposition verbo-nominale qui a ete le plus etudie dans les travaux de linguistique est sans doute l’opposition nominalisation deverbale/verbe. Que ce soit en syntaxe, en semantique ou en morphologie, nombre de travaux evoquent cette opposition souvent d’ailleurs en la considerant comme une alternance plutot que comme une reelle opposition. La question qui se pose au fond est celle de savoir si ces deux categories grammaticales, formellement apparentees , correspondent ou non a la meme signification. Les etudes que nous presentons ici ont ceci de particulier qu’elles sont realisees sur des corpus et plus precisement sur des corpus specialises ; elles ne se situent donc pas dans une visee de description d’un systeme linguistique sur la base d’une reflexion introspective mais prennent appui sur des donnees textuelles attestees
Ce numero de la Revue Francaise de Linguistique Appliquee concerne les rapports entre linguistiqu... more Ce numero de la Revue Francaise de Linguistique Appliquee concerne les rapports entre linguistique et recherche d'information. Au-dela de la recherche d'information au sens strict (recherche de documents pertinents par rapport a des mots-cles), nous souhaitons elargir la problematique a des domaines de recherche connexes : - L'extraction d'information, - Les systemes de question/reponse, - Le resume automatique, - La categorisation de textes. La dimension langagiere est presente dans toutes ces applications : la plupart exigent une analyse du contenu (on parle aujourd'hui de moteur de recherche « semantique ») et ne peuvent se contenter de voir le document comme un simple « sac de mots ». La linguistique devrait donc jouer un role important dans ces disciplines. Or, ce n'est pas toujours le cas. Cet introduction presente les raisons de cet etat de fait.
Les marqueurs de relation conceptuelle sont un moyen efficace de détecter automatiquement en corp... more Les marqueurs de relation conceptuelle sont un moyen efficace de détecter automatiquement en corpus des Contextes Riches en Connaissances. Dans le domaine de la terminologie ou de l’ingénierie des connaissances, les Contextes Riches en Connaissances peuvent être utiles pour l’élaboration de ressources termino-ontologiques. Bien que la littérature concernant ce sujet soit riche, il n’existe pas de recensement systématique ni d’évaluation à grande échelle des marqueurs de relation conceptuelle. Pour ces raisons notamment, nous avons constitué une base de marqueurs pour les relations d’hyperonymie, de méronymie, et de cause, en français. Pour chacun de ces marqueurs, son taux de précision est proposé pour des corpus qui varient en fonction du domaine et du genre textuel.
Le propos de cet article est base sur plusieurs etudes realisees depuis une dizaine d'annees ... more Le propos de cet article est base sur plusieurs etudes realisees depuis une dizaine d'annees a CLLE-ERSS, sur les langues controlees (CNLs). Le principal constat est que les CNLs ne sont pas toujours adaptees et utilisables. Par ailleurs, l'impact reel de leur mise en oeuvre sur l'amelioration de la « readability » a ete tres peu evalue. L'article dresse un panorama des problemes associes aux CNLs et propose de nouvelles pistes de constitution. Dans cet objectif, certaines methodes de TAL et de psycholinguistique pourraient etre mises en oeuvre pour ameliorer les CNLs existantes ou en proposer de nouvelles. ABSTRACT Toward the Definition of New Controlled Natural Languages in order to Prevent Risks Related to Language Use. The content of this paper is based on several studies carried out over the last decade in CLLE-ERSS lab, on controlled natural languages (CNLs). It finds that they are not always adapted and usable. Another point is that their impact on readability...
The aim of this paper is to focus on the necessity of a double marking-out when doing the semanti... more The aim of this paper is to focus on the necessity of a double marking-out when doing the semantic analysis of the data of a corpus. The first mark lies in the situation in which texts are produced and the second one lies in the interpretation of the texts. In both cases, the author suggests to use the notion of ‘genre’ (textual ‘genre’ and interpretative ‘genre’) in order to classify and categorize situations. The issue is exemplified by the problem of the building of terminologies according to a particular interpretative ‘genre’. The paper shows how textual ‘genre’ influences the functioning of conceptual relations patterns (e.g. the preposition avec is used to spot a meronymic relation). It demonstrates that this kind of analysis may help to refine the descriptions initially made by introspection.
Quels sont les elements nouveaux qui peuvent justifier un ouvrage intitule Semantique et Corpus. ... more Quels sont les elements nouveaux qui peuvent justifier un ouvrage intitule Semantique et Corpus. Ni la semantique, ni l'analyse de corpus ne sont des problematiques reellement nouvelles (voir par exemple Rastier, 2001). Meme si le terme de semantique est assez recent (on le doit a Breal, 1893), l'interrogation sur le sens traverse le questionnement des philosophes, des philologues et des linguistes depuis 2 500 ans. Quant aux corpus, en tout cas aux textes, ils constituent depuis deja longtemps l'objet d'etude de disciplines des sciences du langage aussi diverses que la sociolinguistique, l'ethnomethodologie, l'analyse conversationnelle, l'analyse de discours, l'analyse linguistique de textes litteraires, la linguistique historique et, depuis plus longtemps encore, de l'analyse comparative particulierement developpee au XIX e siecle par Bopp, Humboldt (Trabant,1995) ou Schleicher (Auroux et al., 2000). C'est l'association des termes de « s...
International Journal of Applied Linguistics, 2020
This article proposes to define a “new” discipline within applied linguistics: ergonomic linguist... more This article proposes to define a “new” discipline within applied linguistics: ergonomic linguistics. The article addresses issues concerning language use within organizations, focusing on human‐oriented controlled natural languages (CNLs) whose role is to limit the problems encountered with natural language, in professional contexts in particular. An ergonomic linguistics approach involves first taking into account real linguistic productions and analyzing them with corpus linguistics methods, and then evaluating the efficacy of linguists’ recommendations using cognitive evaluation or acceptance tests. Two projects concerning human‐oriented CNLs that adopt an ergonomic linguistics approach are presented, the first in the space domain and the second in aeronautics.
This paper studies how the notion of Knowledge Rich Contexts (KRCs), initially defined as passage... more This paper studies how the notion of Knowledge Rich Contexts (KRCs), initially defined as passages of text allowing access to elements that define terms, has evolved. It discusses related work in Natural Language Processing (NLP), which has led to disciplinary convergence. It mainly presents the way in which KRCs can manifest themselves within a corpus, in the form of explicit or implicit markers and lexico-syntactic or morphological markers. Extra-linguistic elements are examined through the study of the domain and the textual genre of the corpus studied, and by the adaptation of KRCs to a particular demand (evolution in time, interdisciplinarity…). All types of functioning are illustrated with real data from different corpus-based studies. The study of the notion of KRC allows us to address fundamental questions in the linguistic study of specialized texts, such as the link between form and meaning and between linguistic and extra-linguistic contexts.
Manifestations linguistiques de la constitution d'une nouvelle science : le cas de l'exob... more Manifestations linguistiques de la constitution d'une nouvelle science : le cas de l'exobiologie
L’un des aspects de l’opposition verbo-nominale qui a ete le plus etudie dans les travaux de ling... more L’un des aspects de l’opposition verbo-nominale qui a ete le plus etudie dans les travaux de linguistique est sans doute l’opposition nominalisation deverbale/verbe. Que ce soit en syntaxe, en semantique ou en morphologie, nombre de travaux evoquent cette opposition souvent d’ailleurs en la considerant comme une alternance plutot que comme une reelle opposition. La question qui se pose au fond est celle de savoir si ces deux categories grammaticales, formellement apparentees , correspondent ou non a la meme signification. Les etudes que nous presentons ici ont ceci de particulier qu’elles sont realisees sur des corpus et plus precisement sur des corpus specialises ; elles ne se situent donc pas dans une visee de description d’un systeme linguistique sur la base d’une reflexion introspective mais prennent appui sur des donnees textuelles attestees
Ce numero de la Revue Francaise de Linguistique Appliquee concerne les rapports entre linguistiqu... more Ce numero de la Revue Francaise de Linguistique Appliquee concerne les rapports entre linguistique et recherche d'information. Au-dela de la recherche d'information au sens strict (recherche de documents pertinents par rapport a des mots-cles), nous souhaitons elargir la problematique a des domaines de recherche connexes : - L'extraction d'information, - Les systemes de question/reponse, - Le resume automatique, - La categorisation de textes. La dimension langagiere est presente dans toutes ces applications : la plupart exigent une analyse du contenu (on parle aujourd'hui de moteur de recherche « semantique ») et ne peuvent se contenter de voir le document comme un simple « sac de mots ». La linguistique devrait donc jouer un role important dans ces disciplines. Or, ce n'est pas toujours le cas. Cet introduction presente les raisons de cet etat de fait.
Les marqueurs de relation conceptuelle sont un moyen efficace de détecter automatiquement en corp... more Les marqueurs de relation conceptuelle sont un moyen efficace de détecter automatiquement en corpus des Contextes Riches en Connaissances. Dans le domaine de la terminologie ou de l’ingénierie des connaissances, les Contextes Riches en Connaissances peuvent être utiles pour l’élaboration de ressources termino-ontologiques. Bien que la littérature concernant ce sujet soit riche, il n’existe pas de recensement systématique ni d’évaluation à grande échelle des marqueurs de relation conceptuelle. Pour ces raisons notamment, nous avons constitué une base de marqueurs pour les relations d’hyperonymie, de méronymie, et de cause, en français. Pour chacun de ces marqueurs, son taux de précision est proposé pour des corpus qui varient en fonction du domaine et du genre textuel.
Le propos de cet article est base sur plusieurs etudes realisees depuis une dizaine d'annees ... more Le propos de cet article est base sur plusieurs etudes realisees depuis une dizaine d'annees a CLLE-ERSS, sur les langues controlees (CNLs). Le principal constat est que les CNLs ne sont pas toujours adaptees et utilisables. Par ailleurs, l'impact reel de leur mise en oeuvre sur l'amelioration de la « readability » a ete tres peu evalue. L'article dresse un panorama des problemes associes aux CNLs et propose de nouvelles pistes de constitution. Dans cet objectif, certaines methodes de TAL et de psycholinguistique pourraient etre mises en oeuvre pour ameliorer les CNLs existantes ou en proposer de nouvelles. ABSTRACT Toward the Definition of New Controlled Natural Languages in order to Prevent Risks Related to Language Use. The content of this paper is based on several studies carried out over the last decade in CLLE-ERSS lab, on controlled natural languages (CNLs). It finds that they are not always adapted and usable. Another point is that their impact on readability...
The aim of this paper is to focus on the necessity of a double marking-out when doing the semanti... more The aim of this paper is to focus on the necessity of a double marking-out when doing the semantic analysis of the data of a corpus. The first mark lies in the situation in which texts are produced and the second one lies in the interpretation of the texts. In both cases, the author suggests to use the notion of ‘genre’ (textual ‘genre’ and interpretative ‘genre’) in order to classify and categorize situations. The issue is exemplified by the problem of the building of terminologies according to a particular interpretative ‘genre’. The paper shows how textual ‘genre’ influences the functioning of conceptual relations patterns (e.g. the preposition avec is used to spot a meronymic relation). It demonstrates that this kind of analysis may help to refine the descriptions initially made by introspection.
Quels sont les elements nouveaux qui peuvent justifier un ouvrage intitule Semantique et Corpus. ... more Quels sont les elements nouveaux qui peuvent justifier un ouvrage intitule Semantique et Corpus. Ni la semantique, ni l'analyse de corpus ne sont des problematiques reellement nouvelles (voir par exemple Rastier, 2001). Meme si le terme de semantique est assez recent (on le doit a Breal, 1893), l'interrogation sur le sens traverse le questionnement des philosophes, des philologues et des linguistes depuis 2 500 ans. Quant aux corpus, en tout cas aux textes, ils constituent depuis deja longtemps l'objet d'etude de disciplines des sciences du langage aussi diverses que la sociolinguistique, l'ethnomethodologie, l'analyse conversationnelle, l'analyse de discours, l'analyse linguistique de textes litteraires, la linguistique historique et, depuis plus longtemps encore, de l'analyse comparative particulierement developpee au XIX e siecle par Bopp, Humboldt (Trabant,1995) ou Schleicher (Auroux et al., 2000). C'est l'association des termes de « s...
Uploads
Papers by Anne Condamines