Traitement des corpus en Langue des Signes en recherches sociolinguistiques

Sophie DALLE-NAZÉBI

- !" #$ %& '( )*#+ ,# ! " # $ " %% &%'$()*)((+,+-,./ $ (" 0'1 2 0, 0# - 3H! ( " " H4 5) 67877H9H:;<; = ;<> :;<? ;8> :;<7+$H@"@AA A<<?<HB0CDH@<;8;;;A <<?< E @, F "@AA "@AAGGG 0 @"@AA A<<?< % ,0# ! Cahiers de praxématique -, , - Sophie Dalle-Nazébi, Juliette Dalle, Patrice Dalle & François Lefebvre-Albaret Pôle Recherche-Développement-Évaluation, WebSourd. IRIT U.M.R. 5505 (université Toulouse 3 — C.N.R.S.) Équipe TCI, IRIT U.M.R. 5505 (université Toulouse 3 — C.N.R.S.) Pôle Recherche-Développement-Évaluation, WebSour Traitement des corpus en Langue des Signes en recherches sociolinguistiques Introduction Spécificités des Langues des Signes Les Langues des Signes  (L.S.) sont très différentes des langues vocales audio-phonatoires, du fait des canaux qu’elles utilisent, gestuel en émission et visuel en réception, ce qui induit une structuration spatio-temporelle particulière et des structures grammaticales très originales. En émission, toute la partie supérieure du corps est utilisée : les gestes manuels (les configurations des mains, leurs orientations, leurs emplacements et leurs mouvements), le buste (son orientation et ses mouvements), la tête (son orientation et ses mouvements), les expressions faciales et la direction du regard, tous ces éléments intervenant en même temps. Ce parallélisme et cette multimodalité sont des originalités des L.S. Un énoncé est structuré dans le temps, comme pour les langues vocales, mais aussi dans l’espace situé devant le signeur : les entités du discours y sont localisées et le locuteur ou son interlocuteur peuvent y faire des références anaphoriques par pointage. . Il n’existe pas une mais des langues des signes (L.S.). Elles se distinguent principalement par leur lexique. Par contre les L.S. de différents pays ont des formes grammaticales communes, notamment les structures faisant appel à l’iconicité, dont le caractère est universel. Nous parlerons donc de L.S. quand cela s’appliquera à toutes les L.S. et de L.S.F. pour ce qui sera spécifique seulement validé au cas français.  Cahiers de praxématique -,  Enfin, selon le modèle linguistique de Cuxac (), le signeur peut, à tout moment, choisir de s’exprimer selon une approche dite « non-illustrative », où il utilise les signes standard du lexique, et une approche « illustrative », où il va exploiter les ressorts de l’iconicité pour donner à voir le sens de l’énoncé. Plusieurs types de structures de transfert peuvent alors être utilisées, transferts de taille et de forme pour décrire des objets ou des personnages, transferts situationnels pour les situer dans une représentation analogique de l’espace réel ou métaphorique et ainsi exprimer directement des notions de proximité, et enfin transferts personnels, où le signeur prend le rôle et les expressions d’un actant de l’énoncé. Les L.S. n’ont pas d’écriture à usage généralisé. Il existe plusieurs systèmes de transcription des L.S., destinés aux linguistes ou aux informaticiens, et une forme pouvant prétendre au rôle d’écriture, Signwriting. Mais son usage reste faiblement répandu . Cela va avoir évidemment un impact fort sur les recherches sociolinguistiques basées sur les L.S., la vidéo jouant alors partiellement le rôle d’une écriture et en premier lieu, un rôle de trace ou de mémorisation. On sera donc amené à traiter des corpus de L.S. d’une façon beaucoup plus large que pour les langues vocales. Enjeux de recherches sociologiques en L.S. Dans ce contexte, l’enregistrement d’un entretien en L.S. implique le recours à la vidéo. Or, c’est là une pratique extrêmement rare dans ce domaine de recherche, autour de laquelle se jouent des enjeux de connaissances comme des questions éthiques. Peu de chercheurs maîtrisent cette langue. Certains d’entre eux demandent alors à des personnes s’exprimant de manière privilégiée en L.S.  de faire l’entretien en français. Cette relation, problématique en soi au regard des difficultés d’expression et du rapport social ainsi établi, n’évacue . Cette situation a entraîné une forte activité de recherche sur les formes graphiques des L.S. et sur les signeurs virtuels, ces avatars pouvant être utilisés à terme pour la génération d’énoncés en L.S. . Ce détail a son importance. Les personnes qui sont devenues sourdes, par exemple, s’expriment de manière privilégiée en français. L’instauration d’une relation de confort et de respect par le chercheur concerne alors plutôt les conditions de lecture sur les lèvres, le recours ponctuel à des notes, ou la sollicitation de professionnels de l’écrit (vélotypistes). Traitement des corpus en Langue des Signes...  pas l’épineuse question épistémologique et éthique des modalités de retranscription d’un français potentiellement mal articulé et empreint de tournures propres à la L.S., retranscription pouvant conduire à des cas de violence symbolique lorsqu’une version en bon français est parallèlement proposée aux lecteurs dans les publications (Decourchelle, ). Dans une démarche moins stigmatisante, d’autres chercheurs livrent uniquement la version corrigée des propos ou impliquent des interprètes professionnels lors des entretiens. Dans ce dernier cas, la vidéo est délaissée au profit de la version française, empêchant tout retour sur les termes, nuances et hésitations de la version originale. Or, la prise en compte de ces aspects et la possibilité de revenir sur ces dimensions font précisément la richesse des données issues d’entretiens au regard d’autres méthodes comme les investigations de terrain ou les enquêtes par questionnaire. On pourrait cependant considérer que l’enjeu principal des recherches sociologiques en L.S. est d’accéder enfin à la prise de parole des sourds et de comprendre leurs expériences scolaires, professionnelles et sociales. La sollicitation d’un interprète répondrait à cet objectif. Il n’y a cependant pas de raisons pour que les réflexions épistémologiques développées en sociologie sur l’importance de la relation d’entretien d’une part et des manières de dire propre à la personne interrogée d’autre part ne soient plus valables dans le cas des sourds. Si l’on se contente de la version traduite, sans aller plus loin dans un questionnement à trois entre chercheur, interprète et corpus (pour pointer par exemple que le locuteur a signé « prison » pour parler de son « école spécialisée »), les données ainsi recueillies sont nécessairement appauvries et avec elle la compréhension des phénomènes sociaux étudiés. Ces aspects, autant que l’exigence de confidentialité, sont décisifs dans des recherches sur les revendications de sourds (Dalle-Nazébi et Lachance, ), leur rapport à la santé (Dalle-Nazébi et Lachance, ), la violence ordinaire au travail (Dalle-Nazébi, ), ou la gestion des appels d’urgences (Dalle-Nazébi et Hénault-Tessier, ). Se tourner vers des pratiques de terrain en L.S. n’épuise pas cette réflexion et invite au contraire à mobiliser davantage la vidéo ou la photo pour une meilleure réflexivité et présentation des données (Hugounenq, ). Il est par exemple courant de présenter la notion de « communauté sourde » comme un terme indigène. S’ils se pensent bien comme tels, et s’il existe un signe spécifique (peu usité) pour  Cahiers de praxématique -,  « communauté », leur mode de désignation (littérale) privilégié est « nous les sourds » (Delaporte, ). Ce qui peut sembler n’être qu’un détail de traduction est en réalité décisif pour comprendre leur représentation identitaire, comme le malentendu culturel récurrent dans les débats concernant cette population. La notion de communauté a de fortes connotations en France qui échappent à la plupart des sourds. Inversement l’idée que pour ceux-ci « les sourds » ne désigne pas l’ensemble des personnes ayant une difficulté d’audition échappe au plus grand nombre des non-sourds. Lors d’une recherche récente par questionnaire (traduit en L.S.F.) sur les conditions d’accès aux urgences , l’écrasante majorité des personnes sourdes locutrices de L.S.F. n’ont pas coché la case « difficultés d’audition », tandis que quelques uns ont précisé dans la case « autres situations » qu’ils étaient « sourds ». Entrer dans le détail des manières de dire est bien entrer dans un monde spécifique de représentation et dans le chemin de la compréhension de rapports sociaux. L’enjeu des recherches sociologiques concernant les sourds est de pouvoir mener, en L.S.F., un travail ordinaire de réalisation et d’analyse d’entretiens, ainsi que l’exploitation d’archives audiovisuelles en L.S.F., permettant de construire une diversité de problématiques. . Inscriptions graphiques d’entretiens en sociologie et besoins Les recherches en analyse conversationnelle et les travaux sociologiques et ethnologiques mobilisant la vidéo comme matériau, forme de publication ou moyen de connaissance se sont largement développés pour étudier des paroles en situation de travail, des rituels en acte, des interactions en cours, ou encore pour analyser nos médias (Eyraud et al., ). Il en ressort une grande richesse de pratiques d’annotations fouillées d’extraits vidéo (Mondada, ), annotations qui restent cependant articulées à une transcription écrite des propos tenus, donc dans notre cas, à une traduction. C’est une pratique de transcription fastidieuse, évitée par les chercheurs sourds eux-mêmes ; elle ne prend pas en compte les besoins d’annotations et de commentaires en L.S.F., et elle décrit plus que nécessaire en sociologie les manières de dire des personnes interrogées. Ce n’est sans doute pas un hasard si les . Web : www.websourd-entreprise.fr/spip.php?article96. Traitement des corpus en Langue des Signes...  sociologues travaillant sur des données vidéo cherchent à communiquer dans ce même registre visuel ce qui a été vu, dit et compris au travers de ces recherches. Derrière la communauté d’enjeux associés aux transcriptions, sociologues et linguistes n’ont pas tout à fait les mêmes pratiques ou priorités sur ce sujet, qu’il nous faut donc préciser. Les manuels de sociologie insistent, comme en linguistique, sur l’importance d’une transcription fidèle à l’enregistrement reprenant les erreurs de style ou de syntaxe, les pauses, hésitations ou lapsus, et tenant compte du ton, des changements de débit, des marques de gêne ou d’emportement, de la mimique, de la posture corporelle etc. Pourtant les sociologues mentionnent bien plus qu’ils ne décrivent ces indices, qu’ils mobilisent comme des repères, des pistes de compréhension de ce qui se dit, ne se dit pas, et de ce qui est en jeu pour l’interlocuteur. Ils partagent une liste d’indicateurs mais pas véritablement de système d’annotation. Leurs transcriptions de travail sont rarement exposées ; les extraits mobilisés sous forme de citations, généralement exemptes de ces indices, s’insèrent dans un texte qui apporte ces éléments de compréhension et d’interprétation. Leur transcription de travail est par ailleurs elle-même insérée dans un ensemble de notes (sur le contexte de l’entretien, sur les pistes d’analyse) ; mais elle est plus fondamentalement un support d’annotations en marge, d’inscription de différents codes graphiques ou de couleurs pour signaler les thèmes abordés et les liens entre ceux-ci, de surlignage de vocabulaire spécifique et de mots clés, de sélection d’extraits d’entretiens typiques. Ce texte annoté est ensuite un matériau à découper et réorganiser ; la structure d’un parcours de vie est reconstituée sur la base d’extraits d’entretiens et de notes ; l’articulation de thèmes ou d’événements est schématisée ; et des sous-corpus thématiques sont constitués de manière transversale à plusieurs entretiens. L’analyse sociologique d’entretiens ou de corpus de données relève bien plus de pratiques de manipulations, d’étiquetage, de découpage, d’indexation de manières de dire ou de faire, et de mise en relation de sélection d’événements ou de traits typiques, que d’une démarche de représentation. Il est alors intéressant dans ce cadre de faire ces annotations analytiques directement sur la matière première de l’entretien, et de ne transcrire que des portions précises. C’est ce que permettent les logiciels Sonal (Alber, ), sur des fichiers sons d’entretien, et iMovie, sur des fichiers vidéos. Ces deux logiciels, dont seul le premier a été spécifiquement  Cahiers de praxématique -,  développé pour des sociologues, ont aussi en commun de permettre une vue globale de l’entretien et des portions traitées et de faciliter considérablement les navigations et aller-retour dans le document multimédia. Par contre les possibilités de codage, de visibilité des notes, et d’ajouts de commentaires y restent limitées. Ce travail d’annotation doit pouvoir se faire directement sur la vidéo et dans un registre visuel (couleur, code, commentaires en L.S.F.). Ceci éviterait de mener une analyse thématique sur la base de données appauvries. Par ailleurs, parce qu’il ne serait plus systématique, le travail de traduction pourrait alors être réalisé de manière minutieuse, au mot et à la nuance près, avec des descriptions concernant l’utilisation de l’espace ou la mimique du visage, pour préciser la compréhension des nuances exprimées ou pour citation. Enfin, les conditions de navigation à l’intérieur d’un corpus de vidéo sont décisives. Elles doivent permettent des aller-retour fluides, une lecture en diagonale comme au ralenti, et bénéficier éventuellement de repérage informatique des pauses dans l’expression en L.S. ou des changements d’interlocuteurs. . Présentation d’outils développés pour l’analyse de corpus de L.S. Les outils répondant le plus à ces besoins ne sont pas tant les logiciels d’annotation de vidéos, que ceux actuellement développés pour des professionnels travaillant en L.S.F. (enseignants, interprètes). Ces derniers utilisaient déjà des logiciels d’acquisition ou de montage vidéo, de capture d’écran, de dessins... pour fabriquer des supports de cours ou pour enseigner la L.S.F., mais sans aucun confort de travail. Ils étaient par ailleurs confrontés à un manque d’outils communs leur permettant de comparer et échanger leurs travaux. Dans le cadre du pôle PRESTO , l’IRIT a été amené à développer des outils logiciels, résultant de ses travaux en traitement d’image par ordinateur (Lefebvre-Albaret et Dalle, ). . PRESTO : Pole REcherche Signes TOlosan : www.irit.fr/presto/. Convention de partenariat entre des laboratoires toulousains, l’IRIT (informatique) et le CETIM (traduction), et les organismes spécialisés en L.S.F., Websourd (accessibilité), INTERPRETIS (interprétation) et IRIS (formation). Traitement des corpus en Langue des Signes...  AVV, Annotation de Vidéo en Vidéo Ce logiciel a été créé pour permettre aux professeurs de L.S.F. de corriger les productions de leurs élèves. Le support des exercices et des évaluations étant le document vidéo, il est essentiel de pouvoir fournir une trace des corrections en L.S.F. dans les vidéos. Jusqu’ici, ces corrections étaient faites en français écrit complété par des dessins ou en L.S.F. sur des vidéos séparées, ce qui rendait difficile leur lecture. AVV permet à l’enseignant d’inclure très facilement des vignettes vidéo directement dans la vidéo de l’élève et donc de faire en quelque sorte un sous-titrage en L.S.F. Très rapidement, d’autres usages possibles d’AVV sont apparus, à l’initiative des usagers eux-mêmes : réalisation de supports de cours, commentaires de présentations, fonction « répondre » des e-mails vidéos, exercices de L.S.F... Actuellement le logiciel AVV est très demandé par les enseignants et les formateurs de L.S.F. et il commence à se répandre dans d’autres domaines que la L.S.F., auprès des professionnels, sourds ou intervenant auprès de sourds. PhotoSigne Ce logiciel permet, à partir de la vidéo d’un signe, de sélectionner quelques images correspondant à des configurations caractéristiques, de les superposer en une seule image avec des opérations de transparence et d’affichages sélectifs de certains composants corporels, et de visualiser le mouvement à l’aide de flèches calculées à partir du suivi de ces composants. Ce logiciel est tout à fait innovant : il permet de construire rapidement des photoSignes, sans posséder de compétences graphiques particulières. On peut ainsi recenser les signes d’un  Cahiers de praxématique -,  domaine, y compris le jargon spécifique, et constituer un glossaire, en liant chaque photoSignes à la vidéo de sa définition en L.S.F. Ce logiciel est également utilisé comme traces de travail dans l’enseignement (signes rencontrés dans un cours, signes à coller sur le cahier des élèves...), pour la formation à la L.S.F. ou pour illustrer des documents pédagogiques. À titre de comparaison, la réalisation d’une imageSigne comme celle de la figure de droite, par une personne compétente en dessin et maîtrisant bien un outil tel que Gimp ou Photoshop, dure une dizaine de minutes. VIES, Visualisation Interactive de l’Espace de Signation Ce logiciel permet d’annoter l’utilisation de l’espace de signation dans un énoncé en L.S.F., en étiquetant également le type de chaque entité (actant, lieu...). Cette représentation spatiale est utilisée en analyse linguistique des corpus, mais aussi par les enseignants ; elle leur permet d’illustrer des erreurs de syntaxe et de montrer comment la L.S.F. se construit dans cet espace D. En situation de dialogue, les deux personnages sont représentés ce qui permet d’annoter les interactions et de montrer le rôle de l’espace de signation comme support de l’espace conceptuel partagé. Au « cinéma 1 », ils passent « film 1 » et au « cinéma 2 », « film 2 ». Tu les as vu ? J’ai vu « film 1 » (ou J’ai vu celui-là) Traitement des corpus en Langue des Signes...  SLAnnotation C’est un logiciel d’annotation en partition, analogue, en plus simple, à Elan ou Anvil, mais avec la possibilité supplémentaire d’annoter chaque segment non seulement en français mais aussi en L.S.F. Il permet donc d’étudier ou d’expliquer le fonctionnement de la L.S.F. directement dans cette langue, mais il a aussi d’autres usages : – analyser un entretien en L.S.F., chaque piste portant sur un aspect particulier de la langue ou sur un des thèmes du discours ; – fabriquer des exercices en L.S.F. ou des corrections de devoirs sur la L.S.F., les premières pistes correspondant aux questions, aux remarques ou au corrigé de l’enseignant, les autres pistes à celles des élèves. . Les pratiques sociologiques permises par ces outils et les besoins suscités Un logiciel d’annotation de corpus vidéos de L.S. permettant à la fois un travail synchronisé d’étiquetage (pour une analyse thématique) et des commentaires aussi bien texte que vidéo (en L.S.) transforme considérablement les possibilités d’analyse. Il est ainsi possible pour le sociologue d’importer une autre vidéo, montrant, lorsque c’est important, l’interlocuteur de celui qui est filmé, (dans le cas où deux caméras ont été utilisées). Mais il est également intéressant de mettre ainsi en regard deux extraits différents d’un même entretien, soit parce que l’un complète ou nuance l’autre, soit parce qu’ils témoignent de deux  Cahiers de praxématique -,  expériences que l’on aurait pensé contradictoires. Ce dispositif permet également de mettre en saillance l’évolution d’une pratique en articulant au témoignage d’une personne sourde ce qu’elle en disait ou en espérait un an plus tôt, en important des extraits dans cette fenêtre de commentaire vidéo. Le chercheur crée ainsi, de manière encore artisanale certes, une forme d’intertextualité vidéo. Autre détournement d’usage, l’espace de commentaire a plutôt été utilisé pour proposer les traductions fines des passages vidéos sélectionnés sur la base d’une première analyse, qui fut elle menée dans l’espace des pistes de codage. La fenêtre de commentaire vidéo de SLAnnotation peut aussi servir à importer une image représentant l’utilisation de l’espace produite via le logiciel VIES. Si cet outil a été produit à des fins linguistiques ou pédagogiques, il peut intéresser les sociologues dans leur analyse des précisions apportées par l’utilisation de l’espace et du regard. Par exemple, lors d’un entretien portant sur les modalités de collaboration entre linguistes et professeur sourd de L.S.F., la personne sourde interrogée en disait beaucoup plus sur cette relation via la mise en scène spatiale de ces deux collaborateurs et son jeu de regard que dans les propos explicitement tenus. Chacun était en effet positionné dans un espace clairement distinct mais dans un rapport d’égalité. Certains moments étaient dédiés à des échanges et observations en tant qu’invité à l’activité de l’autre, d’autres où ils se « tournaient le dos ». Dans la mesure où ceci n’était pas explicitement dit, il était important de vérifier et de pouvoir montrer que cela avait pourtant bien été, d’une autre manière, exprimé. L’expérimentation d’un travail sur la vidéo d’une part et en L.S. d’autre part, suscite d’autres besoins de travail dans cette langue et ce media. Ceci est particulièrement mis en évidence par l’utilisation du logiciel AVV, permettant d’insérer dans la vidéo elle-même un commentaire en L.S., et donc, de pouvoir envoyer cette vidéo, intégrée à quelqu’un, qui pourra faire de même. Cette pratique est décisive non pas dans la manipulation du corpus lui-même, mais dans le développement de tout le travail d’échanges « autour ». Ainsi, cet outil a été utilisé pour demander des précisions, à distance mais de manière contextualisée, à la personne filmée dans l’entretien. Celle-ci a pu répondre de même en L.S. Ce logiciel permet également un travail à distance ou en différé avec un collègue locuteur de L.S., en permettant de faire des commentaires en L.S. sur un schéma de travail issu de l’analyse Traitement des corpus en Langue des Signes...  d’un ensemble d’entretiens. Il soulève alors de nouvelles questions sur les savoir-faire associés à un travail à distance sur des objets aussi « lourds » que de la vidéo. Développer de bonnes conditions de travail sur des données en L.S. semble indissociable de réflexions sur les conditions de travail à distance et en différé en L.S. Ces pratiques suscitent par ailleurs des réflexions sur les modalités de communication ou de publication vidéo en L.S., plaçant les questions de navigation mais aussi d’hyperliens vidéo au cœur de ces développements techniques comme de ces défis épistémologiques. L’utilisation de ces outils a donc aussi un impact sur la communication entre chercheurs. La possibilité de faire des commentaires en L.S. permet à un chercheur sourd de consigner ses remarques dans sa langue. Cela facilite également les échanges entre chercheur entendant et professionnel de la L.S., le premier pouvant expliquer en L.S. ses difficultés ou hésitations de traduction, en permettant au second d’avoir sous les yeux, en même temps que ce commentaire, l’extrait concerné et la traduction proposée. Enfin, le chercheur peut aussi luimême reproduire les signes qu’il observe dans l’entretien et qu’il ne connaît pas (régionalisme), pouvant ensuite montrer ou utiliser cette seule trace (ce qui permet de préserver l’identité et les propos du locuteur filmé) ou en combinaison avec un photoSigne, pour en discuter avec d’autres professionnels experts en L.S.F. PhotoSigne est aussi un moyen pratique de conserver les anthroponymes, donc les signes de nomination des personnes sourdes. Ces pratiques utiles de représentation posent néanmoins la question des conditions de préservation de l’anonymat (Dalle-Nazébi, ). Elles renvoient en parallèle à la question des modalités possibles d’insertion de citations dans leur version d’origine dans des publications scientifiques. Différentes pistes sont actuellement imaginées comme le recours au dessin sur la base de photoSigne, le remplacement des traits du visage ou le recours à des avatars signants. . Besoins et défis Si ces nouveaux outils apportent une première réponse au traitement des corpus en L.S. par les sociologues et induisent de nouvelles pratiques, ils font aussi naître de nouveaux besoins dont la satisfaction se heurte à des défis de développement technologique et de recherche  Cahiers de praxématique -,  scientifique (Dalle, Braffort et Collet, ). Par exemple, concernant les modalités d’annotations de corpus, au-delà du sous-titrage en L.S.F. que permet AVV, il est demandé de pouvoir insérer des symboles ou des graphismes dans l’image elle-même. Quant à VIES qui permet d’indiquer ce qui a été placé dans l’espace de signation, il lui est demandé d’indiquer comment cela a été signé, c’est à dire de proposer une représentation visuelle des formes dessinées dans l’espace. D’autre part, l’automatisation de la création de l’espace de signation suppose résolu le problème de la segmentation temporelle (en signe) d’un énoncé, ce qui est encore un problème de recherche. On a vu que la démarche du chercheur l’amène à vouloir rassembler un ensemble de données (d’autres vidéos, d’autres entretiens, d’autres points de vue etc.) mais aussi leurs traitements par ces différents outils. À ce jour, ceux-ci ne sont pas tous intégrés dans un même environnement, ce qui pose des problèmes d’interface mais aussi de cohérence des différentes représentations informatiques. Enfin, la navigation rapide dans un ensemble de corpus vidéo, une des principales fonctions demandée par les chercheurs, ainsi que la localisation d’une information à partir d’une requête en L.S., font appel aux techniques d’indexation qui elles-mêmes s’appuient sur les méthodes de reconnaissance et de comparaison de signes. Ces méthodes doivent surmonter des problèmes liés à la grande variabilité des signes, à l’absence de normalisation et à une forte production de néologismes (Lefebvre-Albaret et Dalle, ). Un des obstacles qui s’oppose encore à l’usage de ces outils provient de leur manque de robustesse. En effet, les opérateurs, de base (détection et suivi des composants) ou plus élaborés (segmentation, indexation, reconnaissance), devraient être capables de s’adapter au contexte et fonctionner automatiquement. Or, il existe encore un fort décalage entre les hypothèses utilisées pour le traitement automatique des L.S. et les vidéos analysées dans le cadre de la sociolinguistique. Les chercheurs en traitement d’image imposent souvent des hypothèses restrictives sur l’apparence du signeur (contraintes vestimentaires), sur son cadrage qui ne doit contenir souvent qu’un signeur et sur l’arrière-plan de la vidéo. Si de plus on garantit une définition spatiale et temporelle de qualité, il est alors possible de suivre les différentes parties du corps des signeurs et d’interpréter des énoncés si leur structure et le vocabulaire utilisé sont eux-mêmes limités. Rares sont les corpus de sociolinguistique qui satisfont l’ensemble de ces conditions. Cela tient à la Traitement des corpus en Langue des Signes...  forme des entretiens qui sont menés dans des conditions les plus naturelles possibles et donc n’imposent qu’un minimum de contraintes au signeur dans sa tenue vestimentaire et sa posture. La caméra est souvent située de manière à filmer à la fois la personne menant l’entretien et la personne interrogée ; cela permet de pouvoir analyser simultanément les questions et les réponses mais apporte une difficulté supplémentaire pour le traitement automatique, due à la fois à la présence de plusieurs locuteurs sur une même vidéo et à un angle de prise de vue de trois quart. La résolution spatiale et temporelle des vidéos peut également être dégradée dans le cas où l’entretien se déroule à distance via des logiciels de visioconférence qui imposent en outre une manière spécifique de signer avec un espace de signation plus réduit. Enfin la problématique de l’anonymisation des sujets devra être résolue par des techniques originales, car, en L.S., le visage, vecteur principal de l’identité, est également le support d’expressions qui font partie intégrante de la langue et qu’il faut donc préserver. Les recherches actuelles consistent à analyser séparément ces déformations faciales et à les appliquer à un autre visage réel ou de synthèse. On rejoint alors les techniques utilisées en animation d’avatar, un autre thème de recherche très actif dans le domaine des L.S. Conclusion Du fait de la spécificité spatio-temporelle des L.S., les recherches sociologiques sur des sujets s’exprimant en L.S. font un usage privilégié du support vidéo. Un des enjeux majeur concerne alors l’exploitation de corpus vidéo de grande taille ce qui fait apparaître des besoins importants de dispositifs d’indexation et de navigation au sein de ces corpus. Les besoins de ces chercheurs rencontrent ceux des enseignants en / de L.S. et de tous les professionnels amenés à parler, en L.S., de contenus et manières de dire en L.S. Des outils commencent à être réalisés pour annoter et représenter ces productions en L.S., sans passer par des mots d’une langue à écriture. Leur usage induit des pratiques inédites d’inscription et d’annotation graphique. Une recherche soutenue doit cependant être encore menée pour produire les formalismes, les méthodes d’analyses et les outils d’exploitation permettant de traiter ces corpus dans le respect de la langue utilisée et de leurs locuteurs.  Cahiers de praxématique -,  Références bibliographiques A A., , « Voir le son : réflexions sur le traitement des entretiens enregistrés dans le logiciel Sonal », Socio-logos, Revue de l’association française de sociologie , http:// socio-logos.revues.org/2482. C C., , La langue des signes française — Les voies de l’iconicité, Paris, Ophrys. D P., B A. & C C., , « Accessibilité et langue des signes : modélisations, méthodes, application », Conférence ASSISTH, Toulouse, Cépaduès, -. D-N S., , « Exposer l’image de locuteurs. Enjeux scientifiques et politiques d’une mise en scène publique », in H P. & P-C M. (éd.), Sciences et frontières ; Délimitations du savoir, objets et passages, Belgique, EME Interéditions, -. D-N S., , « Récits d’une violence ordinaire. Les sourds au travail », Développement humain, handicap et changement social, , , -. D-N S. & H-T M., (à paraître), « TIC et relation administrative. Repenser l’activité, co-construire l’accessibilité », Actes de EUTIC, nov. , Bruxelles. D-N S. & L N., , « France et Québec devant la diversité culturelle. Les politiques à l’épreuve de la surdité », Lien social et politiques , -. D-N S. & L N., , « Sourds et médecine : impacts des représentations sur les conditions d’accès aux soins. Regards croisés FranceQuébec », Interrogations ?, , -. D D., , « Ethnologie et surdité ou ce que l’on entend par langage », Journal des anthropologues, vol. -, -. D Y., , Les sourds, c’est comme ça, Paris, M.S.H. E C. & L G., , « Filmer le travail, films et travail », Cinéma et sciences sociales, université de Provence. Traitement des corpus en Langue des Signes...  H H., , « Les sourds aux prises avec l’intégration », Ethnologie française, t. XXXIX, -. L-A F. & D P., , « Analyse de vidéo en langue des signes : méthodes et stratégies », ORASIS, Trégastel, AFRIF, (support électronique). L-A F. & D P., , « Video Query in Sign Language Videos : How to Model and Compare Signs ? », Language Resources and Evaluation Conference (LREC ), Malte, European Language Resources Association (ELRA), (support électronique). M L. (coord.), , CORPORactions Réincorporer le langage en interaction, rapport scientifique du projet ACI TTT.

RELATED PAPERS

RELATED TOPICS

Log In

Traitement des corpus en Langue des Signes en recherches sociolinguistiques

Traitement des corpus en Langue des Signes en recherches sociolinguistiques

Related Papers

RELATED PAPERS

RELATED TOPICS