La Lexicologie
La Lexicologie
La Lexicologie
2e édition
La lexicologie
Aïno Niklas-Salminen
Lettres/Linguistique
Lettres/Linguistique
Internet : http://www.armand-colin.com
1I NOTIONS FONDAMENTALES I8
1. Le signe linguistique 8
2. Le mot et le morphème 16
3. Le lexique et la grammaire 25
4. Le lexique et ses usages 27
5. Le français fondamental et la statistique lexicale 34
6. Le lexique et l’univers 41
L a lexicologie, qui étudie les unités lexicales d’une langue, est une science
relativement récente. Ses méthodes sont l’objet de constantes discussions et les
résultats encore partiels. Dans un sens restreint, la lexicologie est considérée comme
une branche de la sémantique qui a pour objet l’étude du sens des unités lexicales. Selon
cette perspective, elle se confond, en grande partie, avec la sémantique structurale. Dans
un sens plus large et plus généralement accepté, la lexicologie s’intéresse également
à la forme des unités lexicales et même aux relations qui existent entre le lexique et la
syntaxe. Menée dans une perspective historique, la lexicologie étudie l’apparition de
nouvelles unités lexicales et l’évolution du sens des mots.
Le lexique est situé au carrefour des autres secteurs de la linguistique, la phono-
logie et la morphologie pour la forme des mots, la sémantique pour leur signification
et la syntaxe pour leurs propriétés combinatoires. Le lexique, au lieu de constituer un
système au sens strict, forme un ensemble ouvert et non autonome. C’est pour cela que
l’on ne peut pas en donner une description systématique ou simple, mais seulement des
descriptions complémentaires, selon le point de vue adopté.
Ce manuel, composé de six chapitres, s’adresse en priorité aux étudiants de lettres
du premier cycle et aux candidats aux concours de recrutement de l’enseignement.
Le premier chapitre met en lumière les notions fondamentales utilisées en lexicologie
et leur propose la terminologie la plus généralement acceptée. Le deuxième chapitre
est consacré à l’étude de la forme des différents types de mots qui caractérisent le
lexique de la langue française. Les relations lexicales que les mots entretiennent entre
eux, ainsi que le sens propre et le sens figuré des mots sont abordés dans le troisième
chapitre. L’analyse sémantique des mots et l’étude des rapports qui existent entre le
lexique et la syntaxe sont présentées dans le quatrième chapitre. Le cinquième chapitre
porte sur l’évolution du lexique et le sixième sur l’étude des dictionnaires.
À la fin du livre, un certain nombre d’exercices commentés permettent de pra-
tiquer la discipline de manière active et d’approfondir quelques points particuliers.
Bibliographie et références sont, dans cet ouvrage, très succinctes. En effet, si celles-ci
et des notes sont indispensables dans un ouvrage de recherche, elles se révéleraient
encombrantes dans ce manuel qui a pour but de donner aux débutants une présentation
accessible et précise de la lexicologie actuelle.
Je tiens à remercier Joëlle Gardes Tamine pour ses remarques et conseils constructifs.
Chapitre 1
Notions
fondamentales
1. Le signe linguistique
2. Le mot et le morphème
3. Le lexique et la grammaire
4. Le lexique et ses usages
5. Le français fondamental et la statistique lexicale
6. Le lexique et l’univers
1. LE SIGNE LINGUISTIQUE
1.1. L’UNIVERS DES SIGNES
Le signe linguistique appartient à l’univers des signes. Il est important de distin-
guer d’abord le signe linguistique des autres signes. Un signe, au sens le plus large,
désigne un élément X qui représente un autre élément Y ou lui sert de substitut. Dans
le vocabulaire technique de la sémiologie (= science qui étudie tous les procédés ou
9
La lexicologie
Notions fondamentales
Cependant, il convient de souligner que la plupart du temps il n’existe aucun lien naturel
entre la forme de l’objet représentant et celui de l’objet représenté. Il n’y a pas de rapport
d’analogie entre un drapeau rouge et une baignade dangereuse, ou entre une canne blanche
et la cécité, ou encore entre une croix verte et la pharmacie. Le drapeau rouge, la canne
blanche et la croix verte sont donc des signes. Il n’y a pas, non plus, de lien d’analogie entre
le signe linguistique cheval [ʃ(ə)val], par exemple, et l’animal désigné par ce signe. Les
indices relèvent des sciences d’observation, et les signes non linguistiques et les symboles, de
la sémiologie. Pour schématiser et clarifier ces notions, on peut présenter le tableau suivant :
(Source : in Christian Baylon et Paul Fabre, Initiation à la linguistique, Paris, Nathan, 1990, p. 5.)
Le signe linguistique est un signe particulier dans cet univers des signes, car le
langage humain est un langage incomparablement plus riche, plus souple et plus effi-
cace que n’importe quel autre langage. Comme tout système signifiant utilisé à des fins
communicatives, les langues sont organisées sur deux plans :
– celui des formes (ou signifiants)
– et celui des contenus (ou signifiés).
On vient de constater que parallèlement au langage des hommes, il existe de nom-
breux autres systèmes de communication non linguistiques. Les systèmes de symboles
ou les systèmes de signes arbitraires en font partie. La carte routière est un bon exemple
des systèmes de symboles : chaque élément a sa représentation symbolique, les petits
avions symbolisent des aérodromes, les petites touffes d’herbe des marais, les croix des
cimetières, etc. Le code de la route, dans lequel les panneaux circulaires signifient une
injonction, les panneaux rectangulaires une information, les panneaux triangulaires un
danger, et ainsi de suite, forme également un système de communication non linguis-
tique. En effet, la notion de système implique la présence de signes stables d’un message
à l’autre qui se définissent fonctionnellement par leur opposition les uns aux autres.
11
La lexicologie
Notions fondamentales
Les langues naturelles se différencient de la plupart des autres systèmes par la pro-
priété d’être doublement articulées. Chaque langue naturelle possède un petit nombre de
phonèmes (= une unité de la chaîne parlée qui a une fonction différentielle, mais qui
n’a pas de signification). Phonétiquement, le français possède 19 consonnes (auxquelles
viennent s’ajouter deux consonnes dues à des mots empruntés à l’anglais et à l’espagnol),
3 semi-consonnes et 16 voyelles. Avec ces 38 unités sonores (cf. alphabet phonétique inter-
national, p. 209), on peut construire une infinité d’unités lexicales et morphologiques.
Ce type de combinaison s’appelle donc la « double articulation du langage ». On
considère que les unités signifiantes constituent la première articulation, parce que
c’est la couche du langage que l’on appréhende en premier. C’est elle qui véhicule le
sens. Ainsi la suite phonique ou graphique : Un enfant joue dans le jardin se découpe
en six de ces unités : un, enfant, joue, dans, le et jardin. Ces unités de première articu-
lation sont généralement appelées morphèmes (= la plus petite unité ayant une signi-
fication dans la langue) pour les distinguer des mots, qui sont souvent constitués d’un
seul morphème (ex. : enfant, jardin, masque, juste), mais qui peuvent aussi être formés
de deux ou de plusieurs morphèmes (enfant-in, jardin-age, dé-masqu-er, in-juste-ment
et anti-constitution(n)-elle-ment).
À un second niveau, les morphèmes s’articulent en segments distinctifs mini-
maux appelés « phonèmes ». Dépourvues en elles-mêmes de signification, ces unités
de deuxième articulation ont pour unique fonction de distinguer entre elles les unités
signifiantes de première articulation. Le mot raison [ʀɛzɔ̃], par exemple, est une com-
binaison de quatre phonèmes qui, comme telle, distingue ce mot des autres mots fran-
çais : cette unité lexicale s’oppose en tous points à celle qui articule le mot jardin,
mais ne se distingue que par son premier élément, r [ʀ], de celle qui articule le mot
saison [sɛzɔ̃]. Toutes les langues naturelles sont orales avant d’être écrites, beaucoup
de langues ne possèdent pas de forme écrite. Les alphabets dans les écritures alphabé-
tiques font correspondre, bien que d’une manière souvent approximative, un nombre
à peu près équivalent de lettres. Tous les énoncés d’une langue ayant adopté ce type
d’écriture peuvent donc être retranscrits à l’aide d’un petit nombre de lettres. La langue
française possède vingt-six lettres, quelques accents et quelques signes de ponctuation.
La double articulation donne au langage humain la créativité qui lui est propre,
cette capacité d’exprimer par des combinaisons perpétuellement nouvelles des pensées
constamment nouvelles.
Les mots dérivés, contrairement à leurs bases totalement arbitraires, sont relativement
motivés. Pommier a été formé à partir de pomme à l’aide du suffixe -ier. Abricotier,
cerisier, citronnier, châtaignier, ainsi qu’un grand nombre d’autres noms d’arbres frui-
tiers ont été créés de la même façon. Un signe à motivation relative est donc nécessai-
rement complexe.
La motivation relative se rencontre aussi dans les mots composés combinant des
signes élémentaires immotivés. Contrairement à cent, la forme composée quatre-vingt-
dix-neuf s’interprète analytiquement comme le résultat de la multiplication de vingt par
quatre auquel s’additionne la somme de dix et de neuf.
La poésie exploite les rapports qui existent entre le niveau phonique et le niveau
sémantique du langage. Autrement dit, elle cherche à mettre les récurrences phoniques
non signifiantes en relation avec le sens et ainsi à rendre le lien qui existe entre le signifiant
et le signifié du signe linguistique moins arbitraire, plus naturel. Tout le monde sait que les
poètes favorisent les onomatopées, les créations lexicales, les changements de sens, etc.
– g) Qu’il s’agisse de leur structure interne ou de leurs combinaisons, les signes
linguistiques sont linéaires. Ce caractère linéaire du signe est dû à la nature orale
du langage. Il est tout à fait impossible de prononcer simultanément deux sons, deux
syllabes ou deux mots. La manifestation orale du langage se déroule donc dans le
temps. Cette linéarité se répercute sur la transcription alphabétique qui se déroule
dans l’espace : on ne peut pas écrire les unes sur les autres les différentes unités gra-
phiques de la langue. Les lettres et les mots se succèdent sur la dimension de la ligne.
Le langage exploite doublement cette dimension unique. D’une part, quand on
emploie les trois phonèmes /p/, /a/ et /l/, leur ordre dans /pal/ « pal », /alp/ « alpe »
et /pla/ « plat » est extrêmement important pour la signification du message. D’autre
part, quand on dit : Pierre bat Paul, cela ne veut pas dire la même chose que Paul bat
Pierre. Cette caractéristique différencie les langues naturelles humaines de tous les
systèmes de communication qui construisent leurs messages sur la trame de l’espace
et non sur celle du temps.
Signifié
Signifiant Référent
15
La lexicologie
Notions fondamentales
Les signes linguistiques ont la propriété de pouvoir renvoyer aux objets du monde,
extérieurs à la langue ; ces objets sont des référents qui peuvent être des entités maté-
rielles ou conceptuelles (objets, êtres, processus, lieux, événements, etc.). Ils relèvent de
l’univers extralinguistique réel ou fictif (par exemple, la licorne ou le dragon). Il est impor-
tant de souligner que le processus référentiel de mise en relation d’unités linguistiques
et d’unités extralinguistiques n’est pas unitaire. Selon Catherine Kerbrat-Orecchioni
(L’Énonciation de la subjectivité dans le langage, Paris, A. Colin, coll. « Linguistique »,
1997, p. 35), on peut faire la différence entre une référence absolue, une référence relative
au contexte linguistique et une référence relative à une situation d’énonciation.
Dans le cas de la référence absolue, l’opération de référenciation se caractérise
par son autonomie. Cela veut dire que le repérage du référent dépend uniquement des
informations contenues dans l’expression référentielle. Par exemple, la construction
référentielle de l’énoncé la rose est une fleur, ne dépend que de la connaissance des
mots et des savoirs extralinguistiques des interlocuteurs.
Dans le cas de la référence relative, les expressions référentielles ne disposent
pas d’un contenu descriptif suffisant pour permettre un acte de référenciation auto-
nome. La référence doit se réaliser grâce à des informations différentes de celles qui
sont disponibles dans les unités linguistiques. Si les données convoquées font partie
de l’environnement linguistque de l’unité référentielle, la référence est dite « rela-
tive au contexte linguistique » ou « anaphorique ». Par exemple, dans l’énoncé
Marine est une fille intelligente, mais elle ne travaille pas assez, l’interprétation
référentielle du pronom elle dépend de la prise en compte d’un élément du contexte
linguistique, le nom propre Marine. Cette procédure référentielle anaphorique est
indirecte dans la mesure où elle effectue un détour par le contexte linguistique pour
désigner le référent visé.
Si les données convoquées coïncident avec l’un des éléments constitutifs de la
situation d’énonciation, la référence est « relative à la situation d’énonciation » ou
« déictique ». Par exemple, si l’on dit Est-ce que tu aimes ça ?, l’objet désigné par le
pronom démonstratif ça est repérable dans la situation de communication. Cette procé-
dure référentielle est directe, elle n’est pas médiatisée par une autre forme linguistique
présente dans l’énoncé.
Ainsi dans la phrase : La petite fille joue avec son chat, l’adjectif petite est en rela-
tion syntagmatique avec l’article défini la qui le précède et avec le substantif fille qui
le suit. Ce groupe nominal est en relation syntagmatique avec le verbe joue, et ainsi de
suite. Les relations syntagmatiques affectent donc des éléments qui sont présents dans
l’énoncé. On leur donne souvent le nom de relations in praesentia (lat. : « en présence »).
Dans la même phrase, l’article défini la est en relation paradigmatique avec
d’autres déterminants : cette, ma, une, notre, etc. ; l’adjectif petite avec d’autres adjectifs
tels que grande, jolie, etc. ; le substantif fille avec des substantifs comme voisine, cousine,
dame, etc. ; le verbe joue avec d’autres verbes tels que court, danse, etc. Les éléments en
relation paradigmatique sont mutuellement substituables dans un environnement donné,
s’y excluent les uns les autres et forment ensemble un paradigme. Les déterminants la,
cette, ma, une, notre, etc. font partie du même paradigme, tout comme les adjectifs petite,
grande, jolie, etc. Le paradigme est défini comme un ensemble d’unités virtuellement
substituables dans un contexte donné. Les relations paradigmatiques existent entre des
termes qui ne sont pas présents dans l’énoncé. On les appelle souvent relations in absentia
(lat. : « en absence »). Elles s’opposent par là aux relations syntagmatiques.
2. LE MOT ET LE MORPHÈME
2.1. LE MOT
Le lexique désigne conventionnellement l’ensemble des mots au moyen desquels
les membres d’une communauté linguistique communiquent entre eux. Cette défini-
tion du lexique oblige à donner une définition précise de l’unité lexicale, du mot en
tant qu’élément de base de l’ensemble. La notion traditionnelle de mot est l’une de
celles qui ont tendance à solliciter le plus constamment l’attention des linguistes. Cette
notion, qui semble être familière et évidente pour le grand public, constitue pour le
linguiste une source de difficultés théoriques considérable. Dans une langue telle que le
français, on arrive à donner une définition simple et rigoureuse du mot uniquement au
niveau de la manifestation graphique, où le mot est un groupement de lettres, séparé, à
gauche et à droite, par un blanc des autres éléments du texte. Mais on constate très vite
que ces segments ne correspondent pas à une réalité linguistique bien déterminée. Les
blancs du texte ne s’harmonisent que rarement avec les limites du code oral. On peut
malgré tout chercher à mettre en lumière les critères phoniques qui aident à identifier
et à délimiter les unités lexicales dans la chaîne parlée.
nombre de langues, l’accent joue un rôle démarcatif important. C’est le cas des lan-
gues à accent lexical. Dans certaines langues (ex. : tchèque, finnois, hongrois), l’accent
tombe sur la première syllabe du mot ; dans d’autres, il peut occuper diverses places,
mais toujours la même pour un mot donné (ex. : anglais, italien, russe). Le français est
une langue à accent syntaxique. Si le mot est isolé, l’accent se place toujours sur la
dernière voyelle du mot à l’exception du e caduc. Mais le mot ne fonctionne que rare-
ment seul : la plupart du temps, il est inséré à l’intérieur d’un syntagme, d’un groupe et
dans ce cas, l’unité d’accentuation est beaucoup moins le mot que le syntagme.
maisón
une maison rouģe
En outre, en français, en dehors de cet accent dit « interne », non emphatique, qui
est purement linguistique, il existe un accent dit « externe » ou emphatique qui est lié
à des facteurs expressifs et intellectuels. En effet, l’accent peut être déplacé sous l’effet
d’une volonté d’expressivité : l’accent du mot formidable !, qui frappe normalement la
voyelle /a/ de la dernière syllabe peut très bien passer sur le /o/ initial. En français, le
rôle démarcatif de l’accent dans l’identification des mots est donc très faible.
Les contraintes phonologiques peuvent également aider l’auditeur à identifier et à
délimiter les unités lexicales dans la chaîne sonore. Il y a des phonèmes et des groupes
de phonèmes qui sont possibles à toutes les places du mot. Dans ce cas, leur valeur
démarcative est nulle. En revanche, certains phonèmes ou combinaisons de phonèmes
sont impossibles à telle ou telle place du mot et peuvent ainsi donner des indications sur
les limites initiales ou finales de l’unité lexicale. Alors que la présence d’un /ø/ , possible
à toutes les places (ex. heureux, heureusement : [øʀø], [øʀøzmɑ̃]) n’enseigne rien, celle
d’un /œ/, impossible à la finale absolue, signale qu’on n’est pas arrivé à la fin d’un mot
(cf. Jacqueline Picoche, Précis de lexicologie française, Paris, Nathan, 1992, p. 14).
Il est intéressant de noter que le mot français isolé peut commencer par n’importe
quelle consonne. Toutefois, les mots commençant par les semi-consonnes [j, w, ɥ],
ainsi que ceux qui ont pour initiale un h dit « aspiré » sont très rares :
ouaille, ouate, ouest, ouïe, ouistiti, etc.
hachis, haïr, haine, hardiesse, etc.
canne, khâgne [kam], [kan], [kaɲ]. Mais, à l’initiale, alors que les mots commençant
par [m] ou [n] sont très nombreux, les mots commençant par [ɲ], comme gnocchi
[ɲɔki], gnôle [ɲol] ou gnognote [ɲɔɲɔt], se comptent sur les doigts d’une main. En
revanche, le h aspiré ne s’entend jamais dans une autre position qu’au début du mot.
D’une façon générale, les consonnes (occlusives et constrictives) ont du mal à se main-
tenir à la finale du mot en français : par exemple, la consonne qui apparaît dans la
flexion [simɑ̃t+e] (cimenter) ou tombe quand le radical est nu [simɑ̃] (ciment).
Certaines langues (ex. l’allemand) connaissent le coup de glotte démarcatif qui a
pour but de signaler la frontière des mots composant un syntagme. Ce phénomène est
très rare en français (le un, le onze, le harnais, un haricot : [lə’œ̃], [lə’ɔ̃z], [lə’aʀnɛ],
[œ̃’aʀiko]) qui a tendance à favoriser toutes sortes de liaisons et d’élisions.
Si l’on essaie de trouver des critères phoniques de délimitation du mot, on risque
d’être déçu. Les blancs du texte écrit ne correspondent que rarement aux limites du
code oral. On vient de constater qu’en français le rôle démarcatif de l’accent dans
l’identification des mots est très faible par rapport aux accents des langues à accent
lexical. Les locuteurs peuvent souvent faire entendre des accents ou effectuer des
pauses en des points différents d’une même séquence sonore. On a également vu que
les contraintes phonologiques ne peuvent aider l’auditeur que partiellement et que les
liaisons et les élisions de toutes sortes ont tendance à contribuer à effacer les frontières
entre les différents mots composant un syntagme.
Les critères sonores ne permettent donc pas aux linguistes d’appréhender le
fonctionnement réel de l’élément mot. En effet, les traits démarcatifs phoniques ne
semblent jouer, dans le découpage en mots de la chaîne parlée, qu’un rôle secondaire,
les critères principaux étant d’ordre syntaxique et sémantique.