Boula de Mareüil, Philippe; Sichel-Bazin, Rafèu; Quint, Nicolas & Adda, Gilles (to appear, 2017). “Norme et variation à l’âge des corpus informatisés pour les langues régionales de France”. In Actes du colloque international “Usage, norme...
moreBoula de Mareüil, Philippe; Sichel-Bazin, Rafèu; Quint, Nicolas & Adda, Gilles (to appear, 2017). “Norme et variation à l’âge des corpus informatisés pour les langues régionales de France”. In Actes du colloque international “Usage, norme et codification, de la diversité des situations à l’utilisation du numérique”, Paris, 25-27/11/2015.
Résumé de la communication:
On peut distinguer la diversité entre les langues et la variation à l’intérieur des langues, la variation soulevant assez vite la question de la norme. On peut distinguer au moins deux types de normes : une norme statistique, établie par des faits quantifiables, et une norme prescriptive, formation culturelle constituée de choix sociaux. En l’absence de norme prescriptive acceptée par tous, une grande variation règne dans les langues régionales minor(is)ées de France, notamment aux niveaux lexical, orthographique et phonétique.
Nous prendrons l’exemple du corse, de l’occitan et du catalan (roussillonnais), langues dans lesquelles nous avons mené de nombreuses enquêtes de terrain et enregistré une centaine d’informateurs — une centaine d’heures de parole. Standardiser les langues régionales de France : si la faisabilité de l’entreprise a longtemps posé question, elle s’avère aujourd’hui relativement bien avancée, mais la question de son acceptabilité par les acteurs mêmes demeure. Le caractère polynomique (tolérant vis-à-vis de la variation) de la langue est en principe bien admis pour le corse, langue pour laquelle le concept a été initialement élaboré. Dans la pratique, évidemment, ce n’est pas sans poser de problèmes. Dans le domaine d’oc, même la dénomination « occitan » n’est pas toujours bien perçue par certains, comme c’est par exemple le cas en Provence, où se manifeste fréquemment un attachement particulier à la graphie mistralienne, plus phonétique que la graphie alibertine (standardisée) de l’occitan, également dite « classique », héritière d’une longue tradition scripturale. Quoiqu’il en soit, la recherche d’une graphie intégralement phonétique, attestée par exemple dans les productions d’auteurs dits « patoisants », trouve vite ses limites, dès qu’on sort d’un cadre strictement local puisqu’elle se heurte à une importante variation, qui est immédiatement audible. Elle complique également les comparaisons avec d’autres parlers, même voisins. Cependant, certains locuteurs de langues minorisées rejettent une standardisation excessive, car ils ne retrouvent pas leur langue (celle de l’immédiateté, du quotidien, de la famille, de la connivence) dans des néo-standards ressentis comme des constructions savantes. Si elle ne bénéficie pas de l’adhésion de la majorité des locuteurs, la standardisation risque donc de tuer une deuxième fois (ou définitivement) des langues dont la chaîne de transmission est en grande partie interrompue ou menacée. Sans nécessairement prendre parti vis-à-vis de cette attitude symptomatique d’une nouvelle diglossie, il faut prendre garde à ne pas se couper des usages réels. N’est-ce pas seulement depuis un peu plus d’un siècle que l’orthographe française s’est figée, alors que le français peut se prévaloir d’une littérature bien plus ancienne ?
Les solutions proposées à ce problème, qui s’est posé à d’autres pour des langues comme le breton, divers créoles, l’alsacien ou le francique mosellan (luxembourgeois), en général moins normés que le français, sont diverses et relèvent souvent d’idéologies distinctes, parfois opposées, ce qui rend le sujet épineux. Il faut, selon nous, rester pragmatique, selon les finalités que l’on poursuit. Les questions d’aménagement linguistique et d’action glottopolitique sont passionnantes, mais dépassent sans doute le cadre de cette communication. Pour répondre à divers enjeux (patrimoniaux, pédagogiques…), toutefois, a fortiori pour envisager un traitement automatisé, un minimum de conventions orthographiques s’impose. Des recherches dans des textes, le calcul de statistiques lexicales, notamment, nécessitent des critères de transcription orthographique cohérents.
Nous considérerons différents cas d’école pour aborder les problèmes théoriques et pratiques que pose la transcription de l’oral, dans les trois langues régionales que nous avons étudiées. Nous proposerons quelques pistes concrètes à partir des enregistrements audio que nous avons réalisés, en particulier des traductions dans différentes variétés de langues d’un même texte : la fable « La bise et le soleil ». La comparaison des transcriptions effectuées par plusieurs linguistes spécialistes des langues romanes soulève d’importantes questions scientifiques. Ce travail est un prérequis pour doter les langues de France — trop souvent délaissées pour des raisons politico-économiques — de grands corpus oraux, informatisés.