Syntaxe Générative
Syntaxe Générative
Syntaxe Générative
Yves Roberge
Université de Toronto
Ce cours s'adresse aux étudiants et étudiantes qui ont suivi un cours d'introduction générale à
la linguistique. Il a été conçu comme un support pédagogique et ne saurait remplacer le
contact essentiel avec un enseignant ou une enseignante.
Le cours est organisé en visites. Chaque visite commence par une protase. et se termine par
des exercices auto-corrigés. Au fur et à mesure de la lecture de la protase, se déroule en
parallèle une suite de liens. Il y a cinq types de liens codés en couleurs différentes :
lien externe ; Vous emmène vers un site de la toile contenant des renseignements
pertinents. Ce type de lien risque d'interrompre le fil de la visite et doit être utilisé avec
modération.
1
Introduction
La syntaxe est la partie de la linguistique qui s'intéresse à l'étude des règles qui servent à
expliquer d'une part, l'ordre des mots dans la phrase et, d'autre part, les relations qui existent
entre les éléments qui la composent. C'est à partir de cette définition vague que diverses
approches peuvent être élaborées selon l'aspect qu'on désire explorer.
Nous concevons ici la syntaxe du français comme un système de règles et de principes qui
peuvent générer, en interaction avec d'autres parties de la grammaire, les phrases qui sont
acceptables dans cette langue. Il s'agit donc d'une grammaire générative. Ce système est
représenté par un modèle dont nous développerons les composantes tout au long de ce cours.
Avant d'entreprendre une étude de la représentation des phrases, il est naturel de se demander
ce qu'est une phrase. A l'écrit, le découpage d'un texte en phrases est chose relativement
facile. Il s'agit de repérer les suites de mots qui commencent par une majuscule et se terminent
par un point. Ces suites de mots sont des phrases. Dans la langue parlée, celle qui nous
intéresse dans notre contexte, les choses ne sont pas aussi aisées. Les frontières graphiques de
la langue écrite n'existent pas.
Par contre, une chose est süre: les locuteurs ont des intuitions quant à ce qui constitue ou ne
constitue pas une phrase puisque le message qu'ils transmettent est basé sur le concept
de proposition, réalisé normalement sous forme de phrase. On ne peut donc que conclure que
la phrase constitue une unité. Dans la langue parlée, il se peut que l'intonation aide à la
segmentation d'un message en phrases mais il doit aussi y avoir autre chose puisque que les
locuteurs pourront facilement reconnaître une phrase agrammaticale même si celle-ci a une
intonation normale.
Ce qui nous intéresse donc ce sont les principes de constitution d'une phrase qui permettent
de reconnaître cette phrase dans un message. L'unité que represente la phrase a une
organisation qui ne peut pas être brisée. Certaines parties de la phrase peuvent être éliminées
et/ou déplacées sans affecter la grammaticalité de cette phrase.
Jean est allé à l'école.
et
Jean est allé.
sont deux phrases grammaticales du français. Par contre, d'autres sont nécessaires et ne
peuvent être éliminées sans affecter la grammaticalité de la phrase. Donc, une phrase comme:
Jean est allé à.
n'est pas une phrase grammaticale du français. Les phrases agrammaticales sont précédées
d'un atérisque (*)
* Jean est allé à.
Il semble donc que la phrase a une organisation interne qui ne peut se révéler que par une
étude systématique suivant une méthodologie précise.
2
Nous pouvons donc faire une étude préliminaire visant à découvrir les constituants qui se
retrouvent presque invariablement dans la constitution d'une phrase. Ce sont les constituants
immédiats de la phrase. Ces constituants, appelés syntagmes, sont des groupes de mots
organisés autour d'un élément central.
Il s'agira par la suite de suggérer un moyen de représenter les rapports hiérarchiques
qu'entretiennent les syntagmes dans une structure phrastique. Ceci sera l'objet de notre
troisième visite.
qui violent la constitution interne de Ph. La première n'a pas de SN sujet, la deuxième est sans
SV alors que notre modèle nous indique que Ph est composé de façon obligatoire des
constituants immédiats SN et SV.
Par contre, comme vous l'aurez sans doute deviné, notre modèle est sérieusement déficient
puisqu'il n'est même pas en mesure d'expliquer ce qui fait que les phrases suivantes sont
agrammaticales en français.
* Mange un os son chien.
* Livre ce est intéressant bien.
Les constituants utilisés dans ces phrases et dans les syntagmes qui les composent sont tous
valables mais l'ordre dans lequel ils apparaissent ne l'est pas. Il nous faudra donc un moyen de
rendre compte de la constitution interne des syntagmes tout en imposant des conditions sur la
position relative de ses
constituants. Cette tâche sera accomplie par des règles de réécriture qui nous donnerons les
constituants et l'ordre dans lequel ils apparaissent et qui permettront de construire un
ensemble infini de phrases. Chaque phrase représente donc une actualisation particulière de
ces règles de réécriture que nous représenterons sous forme d' arbres syntaxiques. Il est
essentiel pour la suite de ce cours de maîtriser parfaitement le concept de règle de réécriture et
sa représentation graphique en arbre puisque les rapports entre constituants seront définis
formellement, dans notre neuvième visite, suivant des corrélations basées sur la précédence et
la dominance.
Les phrases générées par ces règles de réécriture seront tout de même toujours des phrases
déclaratives simples et ce n'est qu'en permettant certaines manipulations de ces phrases
simples que nous pourront générer des phrases de types différents. Il sera question de ces
modifications ou transformations dans la quatrième visite.
3
Les transformations
Nous avons vu jusqu'à maintenant que le modèle sur lequel nous travaillons, c'est-à-dire notre
"grammaire", contient des règles d'un type particulier, les règles de réécriture. A l'aide de ces
quelques règles et des mots du français, nous pouvons déjà générer un ensemble infini de
phrases françaises en précisant toutefois qu'il s'agit toujours de phrases déclaratives simples.
Nous n'avons pas encore étudié le lien qui existe entre divers types de phrases. Autrement
dit, nous ne savons toujours pas comment, par exemple, une phrase déclarative se modifie
pour devenir une phrase passive. Pour ce faire nous devons avoir recours à un deuxième type
de règle, la transformation ou règle transformationnelle.
Comme c'est le cas pour les règles de réécriture, les transformations ont toutes la même forme
mais chaque règle diffère par son contenu, i.e. les éléments qu'elle manipule.
Pour écrire une transformation, il suffit de bien décrire les différences entre la phrase qu'on
obtient et la phrase de départ. Il suffit par la suite de formaliser ces modifications sous forme
de règle.
L'existence de transformation nous amène à revoir notre modèle de grammaire. Jusqu'à
maintenant, nous avons fonctionné avec un seul niveau de représentation, i.e. nous n'avions
qu'une seule structure pour chaque phrase. Par contre, maintenant, nous devons utiliser deux
niveaux de représentation: celui où on représente la phrase avant les transformations et celui
où on représente la phrase après les transformations. Nous appelons le premier, structure-D,
et le deuxième, structure-S. Notre modèle a maintenant la forme suivante:
Lexique
Règles de réécriture
|
Structure-D
|
Transformations
|
Structure-S
Deux autres niveaux de représentations existent dans le modèle utilisé dans la documentation
mais leur importance dans le contexte de ce cours n'est suffisante pour qu'une discussion
détaillée leur soit réservée.
La théorie X-barre
Lors des quatre premières visites de ce cours, nous avons exploré la structure interne de la
phrase française, les règles nécessaires pour la formation de ces phrases et des transformations
qui pouvaient s'appliquer à la phrase pour obtenir d'autres phrases de formes différentes mais
qui sont reliées aux autres par leur contenu.
Nous en sommes ainsi arrivés au modèle suivant qui cherche à représenter la composante
syntaxique d'une grammaire :
Lexique
Règles de réécriture
4
|
Structure-D
|
Transformations
|
Structure-S
L'objectif de la deuxième partie de ce cours est de raffiner ce modèle de façon à le rendre plus
explicatif. Il s'agit donc de faire un examen approfondi de chacune des parties du modèle de
façon à éliminer les problèmes qu'il soulève. Nous commencerons par les règles de réécriture.
Il y a en gros quatre problèmes majeurs associés aux règles de réécriture que nous avons
utilisées jusqu'à maintenant. Ils se résument au fait qu'une règle de type :
X --> Y Z
est en même temps trop générale et trop spécifique. Pour pallier ces problèmes, les chercheurs
ont adopté une formulation plus souple en même temps que plus contrainte. Il s'agit de
la théorie X-barre ou X' énoncée suivant le modèle abstrait suivant:
X'' Spéc X'
X' X' Compl
Adapté à la théorie X-barre, le SN la soeur de Sophie sera généré par les règles de réécriture,
N'' Dét N'
N' N' SP
et représenté graphiquement comme,
5
Nous devons maintenant nous concentrer sur le matériau et commencer à étudier ses
propriétés. Nous nous posons toujours les mêmes questions: Quelles sont les propriétés des
éléments qui constituent une phrase ? Pourquoi certaines phrases sont-elles agrammaticales ?
Peut-on formaliser ces propriétés de façon à expliquer ce qui est grammatical et ce qui ne l'est
pas ? Ces questions sont importantes à cause du but que nous nous sommes fixé, c'est-à-dire
de fabriquer un modèle de la grammaire du français qui puisse générer toutes et seulement les
phrases grammaticales du français.
Dans une langue comme le français, les relations qu'entretiennent les éléments dans une
phrase sont marquées en partie par l'ordre particulier des éléments. Par exemple, je sais que
dans la phrase suivante :
Sophie adore Amanda.
Sophie est le sujet et Amanda est l'objet direct. Ceci semble être donné par la position
qu'occupe chacun des N''. Comme preuve de ceci, si je modifie l'ordre, je modifie par le fait
même les relations qui existent entre les éléments. Donc, dans :
Amanda adore Sophie.
Sophie n'est plus le sujet et Amanda n'est plus l'objet direct; nous avons le contraire.
Par contre, dans beaucoup d'autres langues, ce n'est pas nécessairement la position qu'occupe
un élément qui indique sa fonction dans la phrase. En latin, par exemple, ceci est accompli à
l'aide d'un procédé morphologique de sorte qu'un N a une forme différente suivant la fonction
qu'il joue dans la phrase.
On dit en général que les langues qui fonctionnent suivant ce système sont des langues à cas.
Un N dans une phrase possède un cas particulier déterminé par la fonction qu'il occupe. On
comprend donc que dans les langues de ce type, le N'' peut être mis presque n'importe où dans
la phrase puisque, peu importe sa position, nous savons quelle fonction il joue. Si nous
travaillions à partir du latin, il faudrait inclure dans notre grammaire un mécanisme qui
permet aux N d'obtenir leur cas.
Pour le français, ceci ne semble pas nécessaire à première vue puisque les Noms ne sont pas
marqués morphologiquement pour le cas. En fait, on peut démontrer que cette constatation
n'est pas tout à fait juste et que le français possède certains éléments nominaux, comme
les pronoms personnels, qui sont marqués
morphologiquement pour le cas. De plus, on peut démontrer qu'un mécanisme d'assignation
de cas est nécessaire en français pour expliquer certains faits importants quant à la distribution
des N'' dans la phrase.
Il faudra donc conclure que la grammaire du français représentée par notre modèle,
comporte composante ayant pour charge de gérer le fonctionnement des cas; c'est la théorie
des cas. Elle se résume à la condition suivante.
Condition des cas : Un N'' doit avoir un cas.
Disons de plus, jusqu'à preuve du contraire, que cette condition fait partie de la grammaire du
français et des autres langues naturelles. Dans une langue comme le français les cas sont
assignés par le Temps, les verbes et les prépositions seulement. Donc, dans :
- Jean mange : Le sujet de I'' reçoit un cas du Temps.
- manger une pomme : L'objet direct reçoit un cas de V.
- dans la maison : Le complément de la préposition reçoit un cas de P.
6
Exercices