Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Apprentissage des langues Valérie Hazan Department of Phonetics and Linguistics UCL Gower Street, London WC1E 6BT, UK Mél: v.hazan@phon.ucl.ac.uk ABSTRACT The goal of this paper is to briefly review the major impact of speech technology in the area of second language learning and to present recent developments in the area of phonetic acquisition. Second language learners are ‘deaf’ to many sound distinctions that do not occur in their first language. Key issues are whether it is possible to improve perception and production via training and whether the use of speech technology is successful in promoting acquisition. Results of recent studies on the role of speech enhancement and of visual cues in increasing the effectiveness of language training will also be presented. 1. INTRODUCTION L’apprentissage d’une deuxième langue à l’age adulte intervient à plusieurs niveaux linguistiques (lexical, syntaxique, phonétique), qui ont chacun des caractéristiques bien distinctes. L’acquisition de la syntaxe et du lexique de la langue étrangère sont considérés comme étant les aspects les plus importants pour établir la communication entre un locuteur et son auditeur. La faculté de comprendre la langue parlée et de la produire sans accent étranger trop marqué a pourtant acquis une grande importance du fait de la plus grande mobilité des personnes et de la croissance exponentielle des télécommunications. Les technologies de la parole (synthèse et reconnaissance automatique) ont un énorme potentiel pour ce qui concerne l’apprentissage d’une nouvelle langue au niveau de la production et de la perception. Pourtant, les facteurs qui déterminent l’acquisition de la langue au niveau phonétique ne sont pas connus avec précision. Les recherches sur l’acquisition d’une deuxième langue sont donc essentielles pour développer des outils destinés à améliorer l’apprentissage de la langue orale. Dans cet article, j’aborde les questions suivantes : (1) Quels facteurs déterminent l’acquisition d’une nouvelle langue au niveau de la perception et de la production ? (2) Quelles sont les conséquences de déficits de perception et de production dans une langue étrangère L2 ? (3) L’acquisition de nouveaux phonèmes de L2 peut-elle être facilitée par des méthodes d’entraînement intensif ? (4) L’incidence de cet entraînement peut-il être augmenté par l’addition d’informations visuelles ou par l’enrichissement du signal ? (5) Quel est le rôle des technologies vocales dans l’apprentissage de la langue orale ? 2. FACTEURS DETERMINANT L’ACQUISITION D’UNE NOUVELLE LANGUE AU NIVEAU DE LA PERCEPTION ET DE LA PRODUCTION Lors de l’acquisition des sons d’une nouvelle langue, le locuteur est confronté à deux systèmes phonémiques : celui de sa langue maternelle et celui de la deuxième langue (L2). La relation entre ces deux systèmes phonémiques détermine la difficulté d’acquisition de L2 au niveau phonétique, et détermine aussi l’ampleur et les caractéristiques de l’accent étranger produit par le locuteur. Le système phonémique de la langue maternelle a en effet une influence forte sur la perception et la production des sons de la nouvelle langue. Best [Bes95] et Flege [Fle95] ont tous deux présenté des modèles d’acquisition de L2 basés sur les relations entre les systèmes phonémiques des deux langues. Ces deux modèles prédisent qu’au premier stade de l’apprentissage, les catégories phonémiques de L2 proches de celles de la langue maternelle seront assimilées à ces catégories, même si les sons ne sont pas identiques dans les deux langues. Par exemple, les sons /t/ et /d/ en anglais diffèrent des sons /t/ et /d/ en français au niveau acoustique mais un français apprenant l’anglais les assimilera aux phonèmes français. L’accent étranger accompagnant la production de ces consonnes vient donc du fait que le /t/ anglais est produit avec un VOT trop court et que le /d/ anglais sera prononcé avec un prévoisement. Selon Flege, les phonèmes de L2 qui ne ressemblent pas aux phonèmes de L1 sont plus faciles à acquérir compte tenu de l’absence d’interférence avec L1. Ceci est le cas pour l’acquisition des clics en Zoulou par exemple. Les problèmes d'apprentissage sont particulièrement ardus dans le cas de deux sons qui sont les allophones d’un même phonème pour L1 mais qui forment deux catégories phonémiques distinctes pour L2. En effet, dans ce cas, sous l'influence de la langue maternelle, les locuteurs ont des difficultés à percevoir le contraste entre les deux phonèmes de L2. Ceci est le cas pour le contraste entre les sons /b/ et /v/ en français pour les locuteurs espagnols, puisque que ces deux sons sont XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002 XYZ des allophones d’une seule catégorie phonémique dans leur langue maternelle. L2 PEUT-ELLE ETRE FACILITEE PAR DES METHODES D’ENTRAINEMENT INTENSIF ? Les apprenants de L2 éprouvent donc une sorte de « surdité » phonétique puisqu’ils ne perçoivent pas certains contrastes phonémiques de L2. Tout comme dans l’acquisition de la langue maternelle, il semble nécessaire de pouvoir entendre la différence entre deux sons d’une langue étrangère avant de pouvoir les prononcer correctement. L’accent étranger résulte donc de ces processus d’assimilation mais ce sont les difficultés perceptives qui en sont la cause. De nombreuses études ont montré qu’un entraînement au niveau phonétique permettait d’améliorer la perception de contrastes phonémiques de L2 à l’age adulte. Le but de cet entraînement est d’attirer l’attention de l’apprenant de L2 sur les indices acoustiques qui marquent le contraste entre les sons de L2 difficiles à acquérir. La majorité de ces études a eu pour but d’améliorer la perception du contraste entre les sons anglais /l/ et /r/ par les locuteurs japonais. La méthode d’entraînement qui a eu le plus de succès est la méthode nommée « high variability perceptual training » développée à l’université d’Indiana [Pis94]. Cette méthode d’entraînement consiste à se concentrer sur un contraste spécifique entre deux phonèmes de L2 qui sont difficiles à percevoir. Lors d’une épreuve d’identification, les sons sont présentés dans un grand nombre de mots différents, prononcés par plusieurs locuteurs. À la suite de chaque mot, l’étudiant doit décider quel son a été présenté et il est informé en retour si sa réponse est correcte ou non. Le but de cet entraînement est de construire une nouvelle catégorie phonémique « robuste » en exposant le sujet à plusieurs sources de variabilité. Dans ces études sur la perception du contraste entre /r/ et /l/, l’incidence de l’entraînement sur la perception de ces nouveaux phonèmes a été significative [Liv93], et elle s’est généralisée à d’autres locuteurs et d’autres mots de L2. Par ailleurs, l’effet a persisté chez les sujets après plusieurs mois sans entraînement [Liv94]. Ces études ont aussi montré un transfert de la perception vers la production puisque les sujets ont amélioré la production des sons pour lesquels ils avaient été entraînés perceptivement. Il s’agit là d’un aspect très intéressant de ces études puisqu’il est plus facile de développer un système d’entraînement perceptif automatique qu’un système d’entraînement automatique pour la production. Le succès de cette méthode d’entraînement démontre que la perception de la parole ne reste pas « figée » à la fin de la période d’acquisition de L1 et qu'un entraînement intensif et très spécifique est nécessaire pour changer la perception de L2 au niveau phonétique chez l’adulte. Les problèmes de perception et de production que je viens de décrire se remarquent non seulement chez les adultes au premiers stades de l’apprentissage d’une langue étrangère mais peuvent persister pendant de longues années. Ainsi, Flege a testé un grand nombre d’italiens qui vivaient au Canada depuis 30 ans ou plus. Il a montré que, même après cette longue période d’immersion, ceux qui étaient arrivés au Canada après l’age de 7 ans environ avaient encore un accent étranger [Fle95] selon le jugement des canadiens. Flege a aussi montré que les italiens qui avaient appris l’anglais très tôt avaient assimilé la production de certaines voyelles qui n’appartiennent pas au système vocalique italien alors que ceux qui étaient arrivés à un age plus avancé avaient tendance à assimiler les voyelles anglaises aux catégories vocaliques italiennes et avaient donc un accent plus prononcé [Fle98]. Il semble donc que les problèmes de perception et de production des sons d’une langue étrangère ne se résolvent pas spontanément, même après une longue période d'immersion. 2. CONSEQUENCES DE DEFICITS DE PERCEPTION ET DE PRODUCTION DANS L2? Quelle incidence ce « cocktail » phonétique peut-il avoir sur la communication dans L2 ? De nombreuses études ont montré que l’intelligibilité au niveau purement phonétique (testée avec des syllabes sans signification, par exemple) est plus faible pour les apprenants de L2 et que les erreurs sont fortement influencées par la relation entre les systèmes phonémiques de L1 et L2 [Haz00]. Les sujets sont aussi beaucoup plus affectés par la dégradation du signal de L2 (addition de bruit ou réverbération) que les sujets dont L2 est la langue maternelle, et cela, même si leur maîtrise de L2 est excellente [May97]. Compte tenu des difficultés éprouvées par les locuteurs de L2 à percevoir la langue au niveau acoustico-phonétique, il semble que la compréhension de L2 requiert une charge cognitive plus forte que pour la langue maternelle. Il semble aussi que l'information sémantique acquiert une plus grande importance [Tyl01]. Une amélioration de la perception de L2 résultant d’un programme d’entraînement pourrait donc avoir un effet significatif sur la communication et sur la charge cognitive ressentie par les locuteurs pour L2. L’ACQUISITION DE NOUVEAUX PHONEMES DE XYZ 4. EST-CE-QUE L’INCIDENCE DE CET ENTRAINEMENT PEUT ETRE AUGMENTEE VIA L’ADDITION D’INFORMATION VISUELLE OU VIA L’ENRICHISSEMENT DU SIGNAL ? Ces programmes intensifs nécéssitent 15 heures ou plus d’entrainement pour chaque contraste. Bien qu’on puisse considérer que ce ne soit pas excessif si l’entrainement a l’effet d’acquérir un nouveau contraste phonémique, c’est un effort bien important pour un étudiant qui doit aussi maîtriser les autres aspects de l’apprentissage du langage. Certaines études se sont donc concentrées sur des facteurs qui pourraient permettre d’accélérer l’effet de cet apprentissage perceptif. Deux approches différentes on été considérées. Tout d’abord, on peut clarifier le XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002 contraste entre deux sons qui font l’objet d’un entrainement par un processus de renforcement acoutique. Une des methodes employées consiste à augmenter l’intensité des régions du signal qui contiennent des indices acoustiques importants (par exemple, les régions de transitions formantiques). En utilisant cette methode, Hazan et Simpson ont montré une augmentation significative mais relativement faible de l’intelligibilité de consonnes anglaises presentées à des locuteurs japonais et espagnols [Haz00] dans du bruit de fond. Dans une étude avec des locuteurs qui étudiaient le francais comme langue étrangere, Colotte et al [submitted] ont montré une amélioration significative de l'intelligibilité de phrases dont les transitions formantiques avaient été ralenties et certaines régions consonantiques amplifiées. 100 36 jeunes espagnols qui étudiaient l'anglais comme language étrangère [Ort01]. Cette étude a testé la perception de 16 consonnes produites par une locutrice anglaise dans des mots sans sens avec des structures CV, VC et VCV. La perception de neuf voyelles anglaises a aussi été testée dans les mots suivants: ‘bad, bed, bid, bead, bud, board, bared, bide, boughed’. Chaque sujet a entendu 288 consonnes et 54 voyelles dans une condition 'audio' et une condition 'audiovisuelle'. La perception des consonnes a augmentée de facon significative mais le taux d'augmentation était faible (de 71,4% pour la condition audio a 75,1% dans la condition audiovisuelle). On doit aussi remarquer les différences individuelles importantes: certain sujets ont bien profité de cette information supplementaire alors que d'autres n’ont pas été affectés (Figure 2). Le mode de présentation n’a eu aucun effet sur la perception des voyelles. % intelligibility 80 60 Figure 2: Intelligibilité de consonnes anglaises présentées à 36 étudiants espagnols dans un mode audio et un mode audiovisuel. 40 condition 20 natural 0 enhanced Controls Japanese-L1 Spanish-L1 GROUP Figure 1: Effet du renforcement acoustique sur la perception de consonnes anglaises presentees dans un bruit de fond par des sujets anglais, japonais et espagnols [Haz00] La lecture labiale est une autre source d'information importante pour la perception de la parole, qui pourrait être exploitée dans un programme d'entrainement. On sait bien que, dans des conditions de communication difficiles, l'intelligibilité augmente de facon significative quand l'écouteur voit le visage du locuteur. Est-ce-que les locuteurs bénéficient autant de cette information visuelle dans une L2 que dans leur langue maternelle? Si c'etait le cas, cette information pourrait être utilisée pour renforcer l'effet de l'entrainement perceptif. L'incidence de l'information visuelle sur la perception de la parole dans une L2 a été évaluée dans une étude avec 100 Intelligibilite (%) 90 80 70 Dans cette étude, il est intéressant d'observer l'incidence de l'information obtenue via la lecture labiale sur la perception des contrastes phonémiques anglais qui sont particulièrement difficiles pour les étudiants espagnols. Par exemple, si l'on compare l'intelligibilité dans le mode audio et le mode audiovisuel pour le contraste entre /b/ et /v/, un contraste qui est difficile a percevoir dans la L2 mais qui est marqué par des gestes articulatoires visuels très clairs, on remarque que l'information visuelle n'améliore pas la perception chez les sujets espagnols. En effet, les sons /v/ anglais ont été identifiés comme étant des /b/ dans 20,8% des cas pour des syllabes CV dans le mode audio et 18,1% des cas dans le mode audiovisuel. Le taux d’erreurs pour les syllabes VCV était de 24,5% dans le mode audio et de 25,5% dans le mode audiovisuel. On a trouvé le même effet pour le contraste entre /d/ et //. On pourrait donc en conclure que nous ne sommes pas sensibles aux indices visuels dans une L2 qui marquent des contrastes qui ne sont pas phonémiques dans notre langue maternelle. Cependant, une étude sur la perception du contraste entre les sons /l/ et /r/ chez les sujets japonais apprenant l'anglais (americain) a montré qu'ils arrivaient mieux à identifier ces sons dans un mode audiovisuel que dans un mode audio [Har99]. De plus, ils ont plus bénéficié d'un programme d'entrainement intensif lorsque les mots étaient présentés dans un mode audiovisuel [Har02]. Il semble donc nécessaire de raffiner la conclusion faite à la suite de l'étude d'Ortega et al et de conclure que l’'usage des indices visuels dans une L2 pourrait dépendre de plusieurs facteurs: la clarté de l'indice visuel, la relation entre les indices visuels dans la L1 et la L2, et l’expérience de la L2. Une étude est en cours pour Mode 60 Audio Audiovisuel 50 XXIVèmes Journées Parole, Nancy, 24-27 juin 2002 1 3 5 7 9 11d’Étude 13 15 17 19 21sur 23 25 la 27 29 31 33 35MOYENNE 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 SUJET XYZ déterminer si l'entrainement peux permettre non seulement d'augmenter l'usage des indices acoustiques qui marquent les contrastes dans une L2 mais aussi les indices visuels. langue, et pour comparer les méthodes bien diverses qui ont été utilisées. QUEL EST LE ROLE DE LA TECHNOLOGIE DE LA PAROLE DANS L’APPRENTISSAGE DE LA PAROLE ? Les avances technologiques presentent une opportunité de révolutioner l’apprentissage d’une deuxieme langue au niveau de la langue parlée aussi bien que la langue écrite. Pourtant, pour pouvoir profiter de cette technologie, il nous faut mieux comprendre les facteurs qui gouvernent les difficultés d’apprentissage du système phonémique d’une nouvelle langue, aussi bien au niveau de la perception qu’au niveau de la production de la langue. Les ordinateurs multimédias a bas prix sont des outils indispensables pour le développement de programmes d’apprentissage de la langue au niveau phonétique. Il serait logique de se concentrer sur le développement de systemes d'entrainement perceptifs pour deux raisons importantes. Tout d'abord, les études de Logan, Hardison et d'autres ont montré une amélioration spontanée de la prononciation de sons difficiles dans une nouvelle langue a la suite d'un programme d'entrainement perceptif. Tout comme dans l'acquisition du langage chez les enfants, il semble être nécéssaire, dans une nouvelle langue, de pouvoir percevoir la différence entre deux sons avant de pouvoir les prononcer. Les programmes d'entrainement perceptifs assistés par ordinateur ont aussi l'avantage d'être plus fiables que les programmes qui se concentrent sur la prononciation, vu que le feedback donné pendant les tests de perception est toujours correct. L'usage de l'ordinateur est idéal pour les méthodes d'entrainement tel que le HVPT qui éxige un grand nombre d'items différents produits par plusieurs locuteurs avec feedback immédiat à chaque stage de l'entrainement. Des logiciels auteurs quels que le 'CSLU Toolkit' [Col99], qui incluent des systemes de synthèse et de reconnaissance de la parole et qui ont pour but de rendre la technologie de la parole accéssible à des non-programmeurs, permettent aux enseignants de développer des programmes d'entrainement très sophistiqués, et de les adapter à leur propre besoins. Ce logiciel a déja été employé pour développer les programmes d'entrainement perceptifs pour enfants mal-entendants [Con99] et est maintenant employé dans notre laboratoire pour un nouveau programme d’entrainement perceptif audiovisuel pour ceux qui étudient l’anglais comme langue étrangère. Malgré l'avantage certain que l'on a à se concentrer sur l'entrainement perceptif, la plupart des logiciels d'apprentissage de langue orale se concentrent sur la prononciation de mots dans la L2. Ces logiciels nécéssitent un stage de reconnaissance automatique de la parole, et des critères bien définis pour juger si la prononciation de l’étudiant est 'acceptable' [Esk99]. Ils doivent aussi pouvoir informer l’étudiant de facon précise de la raison pour laquelle sa prononciation d’un mot ou d’une phrase a été jugée comme étant inacceptable. Ces ‘requirements’ présentent bien des challenges’ vu qu’il est tout a fait necessaire d’éviter du feedback incorrect. Un nombre de produits commerciaux pour l’entrainement de la prononciation sont déja en vente (Auralog, SRI international, Maxine) mais il nous manque toujours des études d’évaluation pour pouvoir juger si ces logiciels présentent de réels avantages pour l’apprentissage de la XYZ 5. CONCLUSION Remerciement : Remerciements a mes collègues Andrew Faulkner, Andrew Simpson, Marta Ortega-Llebaria et Anke Sennema qui ont collaboré sur les études décrites dans cet article. Ces études ont bénéficié du soutien du ‘Engineering and Physical Sciences Research Council’ de Grande-Bretagne. 6. BIBLIOGRAPHIE [Best01] Best, C.T. et al. (2001). “Discrimination of non-native consonant contrasts varying in perceptual assimilation to the listener’s native phonological system.” J. Acoust. Soc. Am 109, pp 775-794. [Col99] Cole, R. (1999). “Tools for research and education in speech science”. Proceedings of the International Conference of Phonetic Sciences, San Francisco, CA. [Con99] Connors, P, Davis, A., Fortier, G., Gilley, K., Rundle, B., Soland, C.,Tarachow, A. (1999). “Participatory Design: Classroom Applications and Experiences”. Proceedings of the International Conference of Phonetic Sciences, San Francisco, CA, Aug 1999. [Esk99] Eskenazi, M. (1999) “Using automatic speech processing for foreign language pronunciation tutoring: some issues and a prototype”. Language Learning and Technology 2, 62-76. [Fle95] Flege, J.E., Munro, M.J., and MacKay, I. (1995). "Factors affecting degree of perceived foreign accent in a second language". J. Acoust. Soc. Amer. 97, pp 3125-3134. [Fle98] Flege, J.E. (1998) "Second-language learning: the role of subject and phonetic variables". Proceedings of StiLL ESCA workshop, Stockholm, May 1998, pp 1-8 [Haz00] Hazan, V. and Simpson, A. (2000). “The effect of cue-enhancement on consonant intelligibility in noise: speaker and listener effects”. Lang. Speech. 43, pp 273-294. [Har02] Hardison, D. (submitted). Acquisition of second-language speech: effects of visual cues, context and talker variability. XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002 [Liv93] Lively, S. E., Logan, J. S., & Pisoni, D. B. (1993). “Training Japanese listeners to identify English /r/ and /l/. II: The role of phonetic environment and talker variability in learning new perceptual categories”. J. Acoust. Soc. Am. 94, pp 1242-1255. [Liv94] Lively, S. E., Pisoni, D. B., Yamada, R. A., Tohkura, Y., & Yamada, T. (1994). “Training Japanese listeners to identify English /r/ and /l/. III: Long-term retention of new phonetic categories”. J. Acoust. Soc.Am. 96, pp. 20762087. [May97] Mayo, L.H., Florentine, M. and Buus, S. (1997) “Age of second-language acquisition and perception of speech in noise”. J. Speech, Language and Hearing Research, 40: 686-693, 1997. [Ort01] Ortega-Llebaria, M, Faulkner, A., Hazan, V. (2001). “Auditory-visual l2 speech perception: effects of visual cues and acoustic-phonetic context for Spanish learners of English”. Speech, Hearing and Language: UCL Work in Progress, 13, pp. 39-51. [Pis94] Pisoni, D. B., Lively, S. E., & Logan, J. S. (1994). Perceptual learning of nonnative speech contrasts: Implications for theories of speech perception. J. Goodman & H. Nusbaum (Eds.), “The development of speech perception: The transition from speech sounds to spoken words”, pp. 121-166. Cambridge: MIT Press. [Tyl01] Tyler, M.D. (2001) Resource consumption as a function of topic knowledge in nonnative and native comprehension. Language Learning 51:2, pp 257-280. XXIVèmes Journées d’Étude sur la Parole, Nancy, 24-27 juin 2002 XYZ