Apprentissage des langues
Valérie Hazan
Department of Phonetics and Linguistics UCL
Gower Street,
London WC1E 6BT, UK
Mél: v.hazan@phon.ucl.ac.uk
ABSTRACT
The goal of this paper is to briefly review the major
impact of speech technology in the area of second
language learning and to present recent developments in
the area of phonetic acquisition. Second language learners
are ‘deaf’ to many sound distinctions that do not occur in
their first language. Key issues are whether it is possible
to improve perception and production via training and
whether the use of speech technology is successful in
promoting acquisition. Results of recent studies on the
role of speech enhancement and of visual cues in
increasing the effectiveness of language training will also
be presented.
1. INTRODUCTION
L’apprentissage d’une deuxième langue à l’age adulte
intervient à plusieurs niveaux linguistiques (lexical,
syntaxique, phonétique), qui ont chacun des
caractéristiques bien distinctes. L’acquisition de la
syntaxe et du lexique de la langue étrangère sont
considérés comme étant les aspects les plus importants
pour établir la communication entre un locuteur et son
auditeur. La faculté de comprendre la langue parlée et de
la produire sans accent étranger trop marqué a pourtant
acquis une grande importance du fait de la plus grande
mobilité des personnes et de la croissance exponentielle
des télécommunications. Les technologies de la parole
(synthèse et reconnaissance automatique) ont un énorme
potentiel pour ce qui concerne l’apprentissage d’une
nouvelle langue au niveau de la production et de la
perception. Pourtant, les facteurs qui déterminent
l’acquisition de la langue au niveau phonétique ne sont
pas connus avec précision. Les recherches sur
l’acquisition d’une deuxième langue sont donc
essentielles pour développer des outils destinés à
améliorer l’apprentissage de la langue orale.
Dans cet article, j’aborde les questions suivantes :
(1) Quels facteurs déterminent l’acquisition d’une
nouvelle langue au niveau de la perception et de la
production ?
(2) Quelles sont les conséquences de déficits de
perception et de production dans une langue étrangère
L2 ?
(3) L’acquisition de nouveaux phonèmes de L2 peut-elle
être facilitée par des méthodes d’entraînement
intensif ?
(4) L’incidence de cet entraînement peut-il être augmenté
par l’addition d’informations visuelles ou par
l’enrichissement du signal ?
(5) Quel est le rôle des technologies vocales dans
l’apprentissage de la langue orale ?
2. FACTEURS DETERMINANT L’ACQUISITION
D’UNE NOUVELLE LANGUE AU NIVEAU DE LA
PERCEPTION ET DE LA PRODUCTION
Lors de l’acquisition des sons d’une nouvelle langue, le
locuteur est confronté à deux systèmes phonémiques :
celui de sa langue maternelle et celui de la deuxième
langue (L2). La relation entre ces deux systèmes
phonémiques détermine la difficulté d’acquisition de L2
au niveau phonétique, et détermine aussi l’ampleur et les
caractéristiques de l’accent étranger produit par le
locuteur. Le système phonémique de la langue maternelle
a en effet une influence forte sur la perception et la
production des sons de la nouvelle langue. Best [Bes95]
et Flege [Fle95] ont tous deux présenté des modèles
d’acquisition de L2 basés sur les relations entre les
systèmes phonémiques des deux langues. Ces deux
modèles prédisent qu’au premier stade de l’apprentissage,
les catégories phonémiques de L2 proches de celles de la
langue maternelle seront assimilées à ces catégories,
même si les sons ne sont pas identiques dans les deux
langues. Par exemple, les sons /t/ et /d/ en anglais
diffèrent des sons /t/ et /d/ en français au niveau
acoustique mais un français apprenant l’anglais les
assimilera aux phonèmes français. L’accent étranger
accompagnant la production de ces consonnes vient donc
du fait que le /t/ anglais est produit avec un VOT trop
court et que le /d/ anglais sera prononcé avec un
prévoisement. Selon Flege, les phonèmes de L2 qui ne
ressemblent pas aux phonèmes de L1 sont plus faciles à
acquérir compte tenu de l’absence d’interférence avec L1.
Ceci est le cas pour l’acquisition des clics en Zoulou par
exemple.
Les
problèmes
d'apprentissage
sont
particulièrement ardus dans le cas de deux sons qui sont
les allophones d’un même phonème pour L1 mais qui
forment deux catégories phonémiques distinctes pour L2.
En effet, dans ce cas, sous l'influence de la langue
maternelle, les locuteurs ont des difficultés à percevoir le
contraste entre les deux phonèmes de L2. Ceci est le cas
pour le contraste entre les sons /b/ et /v/ en français pour
les locuteurs espagnols, puisque que ces deux sons sont
XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002
XYZ
des allophones d’une seule catégorie phonémique dans
leur langue maternelle.
L2 PEUT-ELLE ETRE FACILITEE PAR DES
METHODES D’ENTRAINEMENT INTENSIF ?
Les apprenants de L2 éprouvent donc une sorte de
« surdité » phonétique puisqu’ils ne perçoivent pas
certains contrastes phonémiques de L2. Tout comme
dans l’acquisition de la langue maternelle, il semble
nécessaire de pouvoir entendre la différence entre deux
sons d’une langue étrangère avant de pouvoir les
prononcer correctement. L’accent étranger résulte donc
de ces processus d’assimilation mais ce sont les
difficultés perceptives qui en sont la cause.
De nombreuses études ont montré qu’un entraînement au
niveau phonétique permettait d’améliorer la perception de
contrastes phonémiques de L2 à l’age adulte. Le but de
cet entraînement est d’attirer l’attention de l’apprenant de
L2 sur les indices acoustiques qui marquent le contraste
entre les sons de L2 difficiles à acquérir. La majorité de
ces études a eu pour but d’améliorer la perception du
contraste entre les sons anglais /l/ et /r/ par les locuteurs
japonais. La méthode d’entraînement qui a eu le plus de
succès est la méthode nommée « high variability
perceptual training » développée à l’université d’Indiana
[Pis94]. Cette méthode d’entraînement consiste à se
concentrer sur un contraste spécifique entre deux
phonèmes de L2 qui sont difficiles à percevoir. Lors
d’une épreuve d’identification, les sons sont présentés
dans un grand nombre de mots différents, prononcés par
plusieurs locuteurs. À la suite de chaque mot, l’étudiant
doit décider quel son a été présenté et il est informé en
retour si sa réponse est correcte ou non. Le but de cet
entraînement est de construire une nouvelle catégorie
phonémique « robuste » en exposant le sujet à plusieurs
sources de variabilité. Dans ces études sur la perception
du contraste entre /r/ et /l/, l’incidence de l’entraînement
sur la perception de ces nouveaux phonèmes a été
significative [Liv93], et elle s’est généralisée à d’autres
locuteurs et d’autres mots de L2. Par ailleurs, l’effet a
persisté chez les sujets après plusieurs mois sans
entraînement [Liv94]. Ces études ont aussi montré un
transfert de la perception vers la production puisque les
sujets ont amélioré la production des sons pour lesquels
ils avaient été entraînés perceptivement. Il s’agit là d’un
aspect très intéressant de ces études puisqu’il est plus
facile de développer un système d’entraînement perceptif
automatique qu’un système d’entraînement automatique
pour la production. Le succès de cette méthode
d’entraînement démontre que la perception de la parole ne
reste pas « figée » à la fin de la période d’acquisition de
L1 et qu'un entraînement intensif et très spécifique est
nécessaire pour changer la perception de L2 au niveau
phonétique chez l’adulte.
Les problèmes de perception et de production que je viens
de décrire se remarquent non seulement chez les adultes
au premiers stades de l’apprentissage d’une langue
étrangère mais peuvent persister pendant de longues
années. Ainsi, Flege a testé un grand nombre d’italiens
qui vivaient au Canada depuis 30 ans ou plus. Il a montré
que, même après cette longue période d’immersion, ceux
qui étaient arrivés au Canada après l’age de 7 ans environ
avaient encore un accent étranger [Fle95] selon le
jugement des canadiens. Flege a aussi montré que les
italiens qui avaient appris l’anglais très tôt avaient
assimilé la production de certaines voyelles qui
n’appartiennent pas au système vocalique italien alors que
ceux qui étaient arrivés à un age plus avancé avaient
tendance à assimiler les voyelles anglaises aux catégories
vocaliques italiennes et avaient donc un accent plus
prononcé [Fle98]. Il semble donc que les problèmes de
perception et de production des sons d’une langue
étrangère ne se résolvent pas spontanément, même après
une longue période d'immersion.
2. CONSEQUENCES DE DEFICITS DE
PERCEPTION ET DE PRODUCTION DANS L2?
Quelle incidence ce « cocktail » phonétique peut-il avoir
sur la communication dans L2 ? De nombreuses études
ont montré que l’intelligibilité au niveau purement
phonétique (testée avec des syllabes sans signification,
par exemple) est plus faible pour les apprenants de L2 et
que les erreurs sont fortement influencées par la relation
entre les systèmes phonémiques de L1 et L2 [Haz00]. Les
sujets sont aussi beaucoup plus affectés par la dégradation
du signal de L2 (addition de bruit ou réverbération) que
les sujets dont L2 est la langue maternelle, et cela, même
si leur maîtrise de L2 est excellente [May97]. Compte
tenu des difficultés éprouvées par les locuteurs de L2 à
percevoir la langue au niveau acoustico-phonétique, il
semble que la compréhension de L2 requiert une charge
cognitive plus forte que pour la langue maternelle. Il
semble aussi que l'information sémantique acquiert une
plus grande importance [Tyl01]. Une amélioration de la
perception de
L2 résultant d’un programme
d’entraînement pourrait donc avoir un effet significatif
sur la communication et sur la charge cognitive ressentie
par les locuteurs pour L2.
L’ACQUISITION DE NOUVEAUX PHONEMES DE
XYZ
4. EST-CE-QUE L’INCIDENCE DE CET
ENTRAINEMENT PEUT ETRE AUGMENTEE VIA
L’ADDITION D’INFORMATION VISUELLE OU VIA
L’ENRICHISSEMENT DU SIGNAL ?
Ces programmes intensifs nécéssitent 15 heures ou plus
d’entrainement pour chaque contraste. Bien qu’on puisse
considérer que ce ne soit pas excessif si l’entrainement a
l’effet d’acquérir un nouveau contraste phonémique, c’est
un effort bien important pour un étudiant qui doit aussi
maîtriser les autres aspects de l’apprentissage du langage.
Certaines études se sont donc concentrées sur des facteurs
qui pourraient permettre d’accélérer l’effet de cet
apprentissage perceptif. Deux approches différentes on
été considérées. Tout d’abord, on peut clarifier le
XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002
contraste entre deux sons qui font l’objet d’un
entrainement par un processus de renforcement acoutique.
Une des methodes employées consiste à augmenter
l’intensité des régions du signal qui contiennent des
indices acoustiques importants (par exemple, les régions
de transitions formantiques). En utilisant cette methode,
Hazan et Simpson ont montré une augmentation
significative mais relativement faible de l’intelligibilité de
consonnes anglaises presentées à des locuteurs japonais et
espagnols [Haz00] dans du bruit de fond. Dans une étude
avec des locuteurs qui étudiaient le francais comme
langue étrangere, Colotte et al [submitted] ont montré une
amélioration significative de l'intelligibilité de phrases
dont les transitions formantiques avaient été ralenties et
certaines régions consonantiques amplifiées.
100
36 jeunes espagnols qui étudiaient l'anglais comme
language étrangère [Ort01]. Cette étude a testé la
perception de 16 consonnes produites par une locutrice
anglaise dans des mots sans sens avec des structures CV,
VC et VCV. La perception de neuf voyelles anglaises a
aussi été testée dans les mots suivants: ‘bad, bed, bid,
bead, bud, board, bared, bide, boughed’. Chaque sujet a
entendu 288 consonnes et 54 voyelles dans une condition
'audio' et une condition 'audiovisuelle'. La perception des
consonnes a augmentée de facon significative mais le
taux d'augmentation était faible (de 71,4% pour la
condition audio a 75,1% dans la condition audiovisuelle).
On doit aussi remarquer les différences individuelles
importantes: certain sujets ont bien profité de cette
information supplementaire alors que d'autres n’ont pas
été affectés (Figure 2). Le mode de présentation n’a eu
aucun effet sur la perception des voyelles.
% intelligibility
80
60
Figure 2:
Intelligibilité de consonnes anglaises
présentées à 36 étudiants espagnols dans un mode audio
et un mode audiovisuel.
40
condition
20
natural
0
enhanced
Controls
Japanese-L1
Spanish-L1
GROUP
Figure 1: Effet du renforcement acoustique sur la
perception de consonnes anglaises presentees dans un
bruit de fond par des sujets anglais, japonais et espagnols
[Haz00]
La lecture labiale est une autre source d'information
importante pour la perception de la parole, qui pourrait
être exploitée dans un programme d'entrainement. On sait
bien que, dans des conditions de communication
difficiles, l'intelligibilité augmente de facon significative
quand l'écouteur voit le visage du locuteur. Est-ce-que les
locuteurs bénéficient autant de cette information visuelle
dans une L2 que dans leur langue maternelle? Si c'etait le
cas, cette information pourrait être utilisée pour renforcer
l'effet de l'entrainement perceptif.
L'incidence de l'information visuelle sur la perception de
la parole dans une L2 a été évaluée dans une étude avec
100
Intelligibilite (%)
90
80
70
Dans cette étude, il est intéressant d'observer l'incidence
de l'information obtenue via la lecture labiale sur la
perception des contrastes phonémiques anglais qui sont
particulièrement difficiles pour les étudiants espagnols.
Par exemple, si l'on compare l'intelligibilité dans le mode
audio et le mode audiovisuel pour le contraste entre /b/ et
/v/, un contraste qui est difficile a percevoir dans la L2
mais qui est marqué par des gestes articulatoires visuels
très clairs, on remarque que l'information visuelle
n'améliore pas la perception chez les sujets espagnols. En
effet, les sons /v/ anglais ont été identifiés comme étant
des /b/ dans 20,8% des cas pour des syllabes CV dans le
mode audio et 18,1% des cas dans le mode audiovisuel.
Le taux d’erreurs pour les syllabes VCV était de 24,5%
dans le mode audio et de 25,5% dans le mode
audiovisuel. On a trouvé le même effet pour le contraste
entre /d/ et //. On pourrait donc en conclure que nous ne
sommes pas sensibles aux indices visuels dans une L2 qui
marquent des contrastes qui ne sont pas phonémiques
dans notre langue maternelle.
Cependant, une étude sur la perception du contraste entre
les sons /l/ et /r/ chez les sujets japonais apprenant
l'anglais (americain) a montré qu'ils arrivaient mieux à
identifier ces sons dans un mode audiovisuel que dans un
mode audio [Har99]. De plus, ils ont plus bénéficié d'un
programme d'entrainement intensif lorsque les mots
étaient présentés dans un mode audiovisuel [Har02]. Il
semble donc nécessaire de raffiner la conclusion faite à la
suite de l'étude d'Ortega et al et de conclure que l’'usage
des indices visuels dans une L2 pourrait dépendre de
plusieurs facteurs: la clarté de l'indice visuel, la relation
entre les indices visuels dans la L1 et la L2, et
l’expérience de la L2. Une étude est en cours pour
Mode
60
Audio
Audiovisuel
50
XXIVèmes Journées
Parole,
Nancy, 24-27 juin 2002
1 3 5 7 9 11d’Étude
13 15 17 19 21sur
23 25 la
27 29
31 33 35MOYENNE
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36
SUJET
XYZ
déterminer si l'entrainement peux permettre non
seulement d'augmenter l'usage des indices acoustiques
qui marquent les contrastes dans une L2 mais aussi les
indices visuels.
langue, et pour comparer les méthodes bien diverses qui
ont été utilisées.
QUEL EST LE ROLE DE LA TECHNOLOGIE DE LA
PAROLE DANS L’APPRENTISSAGE DE LA
PAROLE ?
Les avances technologiques presentent une opportunité de
révolutioner l’apprentissage d’une deuxieme langue au
niveau de la langue parlée aussi bien que la langue écrite.
Pourtant, pour pouvoir profiter de cette technologie, il
nous faut mieux comprendre les facteurs qui gouvernent
les difficultés d’apprentissage du système phonémique
d’une nouvelle langue, aussi bien au niveau de la
perception qu’au niveau de la production de la langue.
Les ordinateurs multimédias a bas prix sont des outils
indispensables pour le développement de programmes
d’apprentissage de la langue au niveau phonétique. Il
serait logique de se concentrer sur le développement de
systemes d'entrainement perceptifs pour deux raisons
importantes. Tout d'abord, les études de Logan, Hardison
et d'autres ont montré une amélioration spontanée de la
prononciation de sons difficiles dans une nouvelle langue
a la suite d'un programme d'entrainement perceptif. Tout
comme dans l'acquisition du langage chez les enfants, il
semble être nécéssaire, dans une nouvelle langue, de
pouvoir percevoir la différence entre deux sons avant de
pouvoir les prononcer. Les programmes d'entrainement
perceptifs assistés par ordinateur ont aussi l'avantage
d'être plus fiables que les programmes qui se concentrent
sur la prononciation, vu que le feedback donné pendant
les tests de perception est toujours correct. L'usage de
l'ordinateur est idéal pour les méthodes d'entrainement tel
que le HVPT qui éxige un grand nombre d'items
différents produits par plusieurs locuteurs avec feedback
immédiat à chaque stage de l'entrainement. Des logiciels
auteurs quels que le 'CSLU Toolkit' [Col99], qui incluent
des systemes de synthèse et de reconnaissance de la
parole et qui ont pour but de rendre la technologie de la
parole accéssible à des non-programmeurs, permettent
aux enseignants de développer des programmes
d'entrainement très sophistiqués, et de les adapter à leur
propre besoins. Ce logiciel a déja été employé pour
développer les programmes d'entrainement perceptifs
pour enfants mal-entendants [Con99] et est maintenant
employé dans notre laboratoire pour un nouveau
programme d’entrainement perceptif audiovisuel pour
ceux qui étudient l’anglais comme langue étrangère.
Malgré l'avantage certain que l'on a à se concentrer sur
l'entrainement perceptif, la plupart des logiciels
d'apprentissage de langue orale se concentrent sur la
prononciation de mots dans la L2. Ces logiciels
nécéssitent un stage de reconnaissance automatique de la
parole, et des critères bien définis pour juger si la
prononciation de l’étudiant est 'acceptable' [Esk99]. Ils
doivent aussi pouvoir informer l’étudiant de facon précise
de la raison pour laquelle sa prononciation d’un mot ou
d’une phrase a été jugée comme étant inacceptable. Ces
‘requirements’ présentent bien des challenges’ vu qu’il
est tout a fait necessaire d’éviter du feedback incorrect.
Un nombre de produits commerciaux pour l’entrainement
de la prononciation sont déja en vente (Auralog, SRI
international, Maxine) mais il nous manque toujours des
études d’évaluation pour pouvoir juger si ces logiciels
présentent de réels avantages pour l’apprentissage de la
XYZ
5. CONCLUSION
Remerciement : Remerciements a mes collègues Andrew
Faulkner, Andrew Simpson, Marta Ortega-Llebaria et
Anke Sennema qui ont collaboré sur les études décrites
dans cet article. Ces études ont bénéficié du soutien du
‘Engineering and Physical Sciences Research Council’ de
Grande-Bretagne.
6. BIBLIOGRAPHIE
[Best01] Best, C.T. et al. (2001). “Discrimination of
non-native consonant contrasts varying in
perceptual assimilation to the listener’s native
phonological system.” J. Acoust. Soc. Am
109, pp 775-794.
[Col99] Cole, R. (1999). “Tools for research and
education in speech science”. Proceedings of
the International Conference of Phonetic
Sciences, San Francisco, CA.
[Con99] Connors, P, Davis, A., Fortier, G., Gilley, K.,
Rundle, B., Soland, C.,Tarachow, A. (1999).
“Participatory Design: Classroom Applications
and Experiences”. Proceedings of the
International Conference of Phonetic Sciences,
San Francisco, CA, Aug 1999.
[Esk99]
Eskenazi, M. (1999) “Using automatic speech
processing for foreign language pronunciation
tutoring: some issues and a prototype”.
Language Learning and Technology 2, 62-76.
[Fle95]
Flege, J.E., Munro, M.J., and MacKay, I.
(1995). "Factors affecting degree of perceived
foreign accent in a second language". J.
Acoust. Soc. Amer. 97, pp 3125-3134.
[Fle98]
Flege, J.E. (1998) "Second-language learning:
the role of subject and phonetic variables".
Proceedings of StiLL ESCA workshop,
Stockholm, May 1998, pp 1-8
[Haz00] Hazan, V. and Simpson, A. (2000). “The effect
of
cue-enhancement
on
consonant
intelligibility in noise: speaker and listener
effects”. Lang. Speech. 43, pp 273-294.
[Har02]
Hardison, D. (submitted). Acquisition of
second-language speech: effects of visual cues,
context and talker variability.
XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002
[Liv93]
Lively, S. E., Logan, J. S., & Pisoni, D. B.
(1993). “Training Japanese listeners to identify
English /r/ and /l/. II: The role of phonetic
environment and talker variability in learning
new perceptual categories”. J. Acoust. Soc.
Am. 94, pp 1242-1255.
[Liv94]
Lively, S. E., Pisoni, D. B., Yamada, R. A.,
Tohkura, Y., & Yamada, T. (1994). “Training
Japanese listeners to identify English /r/ and /l/.
III: Long-term retention of new phonetic
categories”. J. Acoust. Soc.Am. 96, pp. 20762087.
[May97] Mayo, L.H., Florentine, M. and Buus, S.
(1997) “Age of second-language acquisition
and perception of speech in noise”. J. Speech,
Language and Hearing Research, 40: 686-693,
1997.
[Ort01]
Ortega-Llebaria, M, Faulkner, A., Hazan, V.
(2001). “Auditory-visual l2 speech perception:
effects of visual cues and acoustic-phonetic
context for Spanish learners of English”.
Speech, Hearing and Language: UCL Work in
Progress, 13, pp. 39-51.
[Pis94]
Pisoni, D. B., Lively, S. E., & Logan, J. S.
(1994). Perceptual learning of nonnative
speech contrasts: Implications for theories of
speech perception.
J. Goodman & H.
Nusbaum (Eds.), “The development of speech
perception: The transition from speech sounds
to spoken words”, pp. 121-166. Cambridge:
MIT Press.
[Tyl01]
Tyler, M.D. (2001) Resource consumption as a
function of topic knowledge in nonnative and
native comprehension. Language Learning
51:2, pp 257-280.
XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002
XYZ