-
!" #$ %& '( )*#+
,#
! "
#
$ " %%
&%'$()*)((+,+-,./
$
(" 0'1 2 0, 0# - 3H!
( " " H4 5) 67877H9H:;<; =
;<> :;<? ;8> :;<7+$H@"@AA A<<?<HB0CDH@<;8;;;A
<<?<
E @, F
"@AA
"@AAGGG
0
@"@AA A<<?<
% ,0#
!
Cahiers de praxématique -, , -
Sophie Dalle-Nazébi, Juliette Dalle, Patrice Dalle & François Lefebvre-Albaret
Pôle Recherche-Développement-Évaluation, WebSourd.
IRIT U.M.R. 5505 (université Toulouse 3 — C.N.R.S.)
Équipe TCI, IRIT U.M.R. 5505 (université Toulouse 3 — C.N.R.S.)
Pôle Recherche-Développement-Évaluation, WebSour
Traitement des corpus en Langue des Signes en
recherches sociolinguistiques
Introduction
Spécificités des Langues des Signes
Les Langues des Signes (L.S.) sont très différentes des langues
vocales audio-phonatoires, du fait des canaux qu’elles utilisent, gestuel en émission et visuel en réception, ce qui induit une structuration spatio-temporelle particulière et des structures grammaticales très
originales.
En émission, toute la partie supérieure du corps est utilisée : les
gestes manuels (les configurations des mains, leurs orientations, leurs
emplacements et leurs mouvements), le buste (son orientation et ses
mouvements), la tête (son orientation et ses mouvements), les expressions faciales et la direction du regard, tous ces éléments intervenant en même temps. Ce parallélisme et cette multimodalité sont des
originalités des L.S.
Un énoncé est structuré dans le temps, comme pour les langues
vocales, mais aussi dans l’espace situé devant le signeur : les entités du
discours y sont localisées et le locuteur ou son interlocuteur peuvent y
faire des références anaphoriques par pointage.
. Il n’existe pas une mais des langues des signes (L.S.). Elles se distinguent principalement par leur lexique. Par contre les L.S. de différents pays ont des formes grammaticales communes, notamment les structures faisant appel à l’iconicité, dont le
caractère est universel. Nous parlerons donc de L.S. quand cela s’appliquera à toutes
les L.S. et de L.S.F. pour ce qui sera spécifique seulement validé au cas français.
Cahiers de praxématique -,
Enfin, selon le modèle linguistique de Cuxac (), le signeur
peut, à tout moment, choisir de s’exprimer selon une approche dite
« non-illustrative », où il utilise les signes standard du lexique, et une
approche « illustrative », où il va exploiter les ressorts de l’iconicité
pour donner à voir le sens de l’énoncé. Plusieurs types de structures
de transfert peuvent alors être utilisées, transferts de taille et de forme
pour décrire des objets ou des personnages, transferts situationnels
pour les situer dans une représentation analogique de l’espace réel
ou métaphorique et ainsi exprimer directement des notions de proximité, et enfin transferts personnels, où le signeur prend le rôle et les
expressions d’un actant de l’énoncé.
Les L.S. n’ont pas d’écriture à usage généralisé. Il existe plusieurs
systèmes de transcription des L.S., destinés aux linguistes ou aux informaticiens, et une forme pouvant prétendre au rôle d’écriture, Signwriting. Mais son usage reste faiblement répandu . Cela va avoir évidemment un impact fort sur les recherches sociolinguistiques basées sur les
L.S., la vidéo jouant alors partiellement le rôle d’une écriture et en premier lieu, un rôle de trace ou de mémorisation. On sera donc amené
à traiter des corpus de L.S. d’une façon beaucoup plus large que pour
les langues vocales.
Enjeux de recherches sociologiques en L.S.
Dans ce contexte, l’enregistrement d’un entretien en L.S. implique
le recours à la vidéo. Or, c’est là une pratique extrêmement rare dans
ce domaine de recherche, autour de laquelle se jouent des enjeux
de connaissances comme des questions éthiques. Peu de chercheurs
maîtrisent cette langue. Certains d’entre eux demandent alors à des
personnes s’exprimant de manière privilégiée en L.S. de faire l’entretien en français. Cette relation, problématique en soi au regard
des difficultés d’expression et du rapport social ainsi établi, n’évacue
. Cette situation a entraîné une forte activité de recherche sur les formes graphiques des L.S. et sur les signeurs virtuels, ces avatars pouvant être utilisés à terme
pour la génération d’énoncés en L.S.
. Ce détail a son importance. Les personnes qui sont devenues sourdes, par
exemple, s’expriment de manière privilégiée en français. L’instauration d’une relation
de confort et de respect par le chercheur concerne alors plutôt les conditions de lecture sur les lèvres, le recours ponctuel à des notes, ou la sollicitation de professionnels
de l’écrit (vélotypistes).
Traitement des corpus en Langue des Signes...
pas l’épineuse question épistémologique et éthique des modalités de
retranscription d’un français potentiellement mal articulé et empreint
de tournures propres à la L.S., retranscription pouvant conduire à
des cas de violence symbolique lorsqu’une version en bon français
est parallèlement proposée aux lecteurs dans les publications (Decourchelle, ). Dans une démarche moins stigmatisante, d’autres chercheurs livrent uniquement la version corrigée des propos ou impliquent
des interprètes professionnels lors des entretiens. Dans ce dernier cas,
la vidéo est délaissée au profit de la version française, empêchant tout
retour sur les termes, nuances et hésitations de la version originale.
Or, la prise en compte de ces aspects et la possibilité de revenir sur
ces dimensions font précisément la richesse des données issues d’entretiens au regard d’autres méthodes comme les investigations de terrain
ou les enquêtes par questionnaire.
On pourrait cependant considérer que l’enjeu principal des
recherches sociologiques en L.S. est d’accéder enfin à la prise de parole
des sourds et de comprendre leurs expériences scolaires, professionnelles et sociales. La sollicitation d’un interprète répondrait à cet objectif. Il n’y a cependant pas de raisons pour que les réflexions épistémologiques développées en sociologie sur l’importance de la relation d’entretien d’une part et des manières de dire propre à la personne interrogée d’autre part ne soient plus valables dans le cas des sourds. Si l’on
se contente de la version traduite, sans aller plus loin dans un questionnement à trois entre chercheur, interprète et corpus (pour pointer par exemple que le locuteur a signé « prison » pour parler de son
« école spécialisée »), les données ainsi recueillies sont nécessairement
appauvries et avec elle la compréhension des phénomènes sociaux étudiés. Ces aspects, autant que l’exigence de confidentialité, sont décisifs
dans des recherches sur les revendications de sourds (Dalle-Nazébi et
Lachance, ), leur rapport à la santé (Dalle-Nazébi et Lachance,
), la violence ordinaire au travail (Dalle-Nazébi, ), ou la
gestion des appels d’urgences (Dalle-Nazébi et Hénault-Tessier, ).
Se tourner vers des pratiques de terrain en L.S. n’épuise pas cette
réflexion et invite au contraire à mobiliser davantage la vidéo ou
la photo pour une meilleure réflexivité et présentation des données
(Hugounenq, ). Il est par exemple courant de présenter la notion
de « communauté sourde » comme un terme indigène. S’ils se pensent
bien comme tels, et s’il existe un signe spécifique (peu usité) pour
Cahiers de praxématique -,
« communauté », leur mode de désignation (littérale) privilégié est
« nous les sourds » (Delaporte, ). Ce qui peut sembler n’être qu’un
détail de traduction est en réalité décisif pour comprendre leur représentation identitaire, comme le malentendu culturel récurrent dans les
débats concernant cette population. La notion de communauté a de
fortes connotations en France qui échappent à la plupart des sourds.
Inversement l’idée que pour ceux-ci « les sourds » ne désigne pas l’ensemble des personnes ayant une difficulté d’audition échappe au plus
grand nombre des non-sourds. Lors d’une recherche récente par questionnaire (traduit en L.S.F.) sur les conditions d’accès aux urgences ,
l’écrasante majorité des personnes sourdes locutrices de L.S.F. n’ont
pas coché la case « difficultés d’audition », tandis que quelques uns
ont précisé dans la case « autres situations » qu’ils étaient « sourds ».
Entrer dans le détail des manières de dire est bien entrer dans un
monde spécifique de représentation et dans le chemin de la compréhension de rapports sociaux. L’enjeu des recherches sociologiques concernant les sourds est de pouvoir mener, en L.S.F., un travail ordinaire
de réalisation et d’analyse d’entretiens, ainsi que l’exploitation d’archives audiovisuelles en L.S.F., permettant de construire une diversité
de problématiques.
.
Inscriptions graphiques d’entretiens en sociologie et besoins
Les recherches en analyse conversationnelle et les travaux sociologiques et ethnologiques mobilisant la vidéo comme matériau, forme
de publication ou moyen de connaissance se sont largement développés pour étudier des paroles en situation de travail, des rituels en acte,
des interactions en cours, ou encore pour analyser nos médias (Eyraud
et al., ). Il en ressort une grande richesse de pratiques d’annotations fouillées d’extraits vidéo (Mondada, ), annotations qui restent cependant articulées à une transcription écrite des propos tenus,
donc dans notre cas, à une traduction. C’est une pratique de transcription fastidieuse, évitée par les chercheurs sourds eux-mêmes ; elle ne
prend pas en compte les besoins d’annotations et de commentaires en
L.S.F., et elle décrit plus que nécessaire en sociologie les manières de
dire des personnes interrogées. Ce n’est sans doute pas un hasard si les
. Web : www.websourd-entreprise.fr/spip.php?article96.
Traitement des corpus en Langue des Signes...
sociologues travaillant sur des données vidéo cherchent à communiquer dans ce même registre visuel ce qui a été vu, dit et compris au travers de ces recherches. Derrière la communauté d’enjeux associés aux
transcriptions, sociologues et linguistes n’ont pas tout à fait les mêmes
pratiques ou priorités sur ce sujet, qu’il nous faut donc préciser.
Les manuels de sociologie insistent, comme en linguistique, sur
l’importance d’une transcription fidèle à l’enregistrement reprenant
les erreurs de style ou de syntaxe, les pauses, hésitations ou lapsus,
et tenant compte du ton, des changements de débit, des marques de
gêne ou d’emportement, de la mimique, de la posture corporelle etc.
Pourtant les sociologues mentionnent bien plus qu’ils ne décrivent ces
indices, qu’ils mobilisent comme des repères, des pistes de compréhension de ce qui se dit, ne se dit pas, et de ce qui est en jeu pour
l’interlocuteur. Ils partagent une liste d’indicateurs mais pas véritablement de système d’annotation. Leurs transcriptions de travail sont
rarement exposées ; les extraits mobilisés sous forme de citations, généralement exemptes de ces indices, s’insèrent dans un texte qui apporte
ces éléments de compréhension et d’interprétation. Leur transcription de travail est par ailleurs elle-même insérée dans un ensemble de
notes (sur le contexte de l’entretien, sur les pistes d’analyse) ; mais elle
est plus fondamentalement un support d’annotations en marge, d’inscription de différents codes graphiques ou de couleurs pour signaler
les thèmes abordés et les liens entre ceux-ci, de surlignage de vocabulaire spécifique et de mots clés, de sélection d’extraits d’entretiens
typiques. Ce texte annoté est ensuite un matériau à découper et réorganiser ; la structure d’un parcours de vie est reconstituée sur la base
d’extraits d’entretiens et de notes ; l’articulation de thèmes ou d’événements est schématisée ; et des sous-corpus thématiques sont constitués
de manière transversale à plusieurs entretiens. L’analyse sociologique
d’entretiens ou de corpus de données relève bien plus de pratiques de
manipulations, d’étiquetage, de découpage, d’indexation de manières
de dire ou de faire, et de mise en relation de sélection d’événements ou
de traits typiques, que d’une démarche de représentation. Il est alors
intéressant dans ce cadre de faire ces annotations analytiques directement sur la matière première de l’entretien, et de ne transcrire que des
portions précises. C’est ce que permettent les logiciels Sonal (Alber,
), sur des fichiers sons d’entretien, et iMovie, sur des fichiers
vidéos. Ces deux logiciels, dont seul le premier a été spécifiquement
Cahiers de praxématique -,
développé pour des sociologues, ont aussi en commun de permettre
une vue globale de l’entretien et des portions traitées et de faciliter
considérablement les navigations et aller-retour dans le document multimédia. Par contre les possibilités de codage, de visibilité des notes, et
d’ajouts de commentaires y restent limitées.
Ce travail d’annotation doit pouvoir se faire directement sur la vidéo
et dans un registre visuel (couleur, code, commentaires en L.S.F.). Ceci
éviterait de mener une analyse thématique sur la base de données
appauvries. Par ailleurs, parce qu’il ne serait plus systématique, le travail de traduction pourrait alors être réalisé de manière minutieuse, au
mot et à la nuance près, avec des descriptions concernant l’utilisation
de l’espace ou la mimique du visage, pour préciser la compréhension
des nuances exprimées ou pour citation. Enfin, les conditions de navigation à l’intérieur d’un corpus de vidéo sont décisives. Elles doivent
permettent des aller-retour fluides, une lecture en diagonale comme
au ralenti, et bénéficier éventuellement de repérage informatique des
pauses dans l’expression en L.S. ou des changements d’interlocuteurs.
.
Présentation d’outils développés pour l’analyse de corpus
de L.S.
Les outils répondant le plus à ces besoins ne sont pas tant les
logiciels d’annotation de vidéos, que ceux actuellement développés
pour des professionnels travaillant en L.S.F. (enseignants, interprètes).
Ces derniers utilisaient déjà des logiciels d’acquisition ou de montage
vidéo, de capture d’écran, de dessins... pour fabriquer des supports
de cours ou pour enseigner la L.S.F., mais sans aucun confort de travail. Ils étaient par ailleurs confrontés à un manque d’outils communs
leur permettant de comparer et échanger leurs travaux. Dans le cadre
du pôle PRESTO , l’IRIT a été amené à développer des outils logiciels, résultant de ses travaux en traitement d’image par ordinateur
(Lefebvre-Albaret et Dalle, ).
. PRESTO : Pole REcherche Signes TOlosan : www.irit.fr/presto/. Convention de partenariat entre des laboratoires toulousains, l’IRIT (informatique) et le
CETIM (traduction), et les organismes spécialisés en L.S.F., Websourd (accessibilité),
INTERPRETIS (interprétation) et IRIS (formation).
Traitement des corpus en Langue des Signes...
AVV, Annotation de Vidéo en Vidéo
Ce logiciel a été créé pour permettre aux professeurs de L.S.F. de
corriger les productions de leurs élèves. Le support des exercices et
des évaluations étant le document vidéo, il est essentiel de pouvoir
fournir une trace des corrections en L.S.F. dans les vidéos. Jusqu’ici,
ces corrections étaient faites en français écrit complété par des dessins
ou en L.S.F. sur des vidéos séparées, ce qui rendait difficile leur lecture. AVV permet à l’enseignant d’inclure très facilement des vignettes
vidéo directement dans la vidéo de l’élève et donc de faire en quelque
sorte un sous-titrage en L.S.F. Très rapidement, d’autres usages possibles d’AVV sont apparus, à l’initiative des usagers eux-mêmes : réalisation de supports de cours, commentaires de présentations, fonction
« répondre » des e-mails vidéos, exercices de L.S.F... Actuellement le
logiciel AVV est très demandé par les enseignants et les formateurs
de L.S.F. et il commence à se répandre dans d’autres domaines que
la L.S.F., auprès des professionnels, sourds ou intervenant auprès
de sourds.
PhotoSigne
Ce logiciel permet, à partir de la vidéo d’un signe, de sélectionner
quelques images correspondant à des configurations caractéristiques,
de les superposer en une seule image avec des opérations de transparence et d’affichages sélectifs de certains composants corporels, et
de visualiser le mouvement à l’aide de flèches calculées à partir du
suivi de ces composants. Ce logiciel est tout à fait innovant : il permet
de construire rapidement des photoSignes, sans posséder de compétences graphiques particulières. On peut ainsi recenser les signes d’un
Cahiers de praxématique -,
domaine, y compris le jargon spécifique, et constituer un glossaire,
en liant chaque photoSignes à la vidéo de sa définition en L.S.F. Ce
logiciel est également utilisé comme traces de travail dans l’enseignement (signes rencontrés dans un cours, signes à coller sur le cahier des
élèves...), pour la formation à la L.S.F. ou pour illustrer des documents
pédagogiques. À titre de comparaison, la réalisation d’une imageSigne
comme celle de la figure de droite, par une personne compétente en
dessin et maîtrisant bien un outil tel que Gimp ou Photoshop, dure
une dizaine de minutes.
VIES, Visualisation Interactive de l’Espace de Signation
Ce logiciel permet d’annoter l’utilisation de l’espace de signation
dans un énoncé en L.S.F., en étiquetant également le type de chaque
entité (actant, lieu...). Cette représentation spatiale est utilisée en analyse linguistique des corpus, mais aussi par les enseignants ; elle leur
permet d’illustrer des erreurs de syntaxe et de montrer comment la
L.S.F. se construit dans cet espace D. En situation de dialogue, les
deux personnages sont représentés ce qui permet d’annoter les interactions et de montrer le rôle de l’espace de signation comme support de
l’espace conceptuel partagé.
Au « cinéma 1 », ils passent « film 1 » et au
« cinéma 2 », « film 2 ». Tu les as vu ?
J’ai vu « film 1 »
(ou J’ai vu celui-là)
Traitement des corpus en Langue des Signes...
SLAnnotation
C’est un logiciel d’annotation en partition, analogue, en plus simple,
à Elan ou Anvil, mais avec la possibilité supplémentaire d’annoter
chaque segment non seulement en français mais aussi en L.S.F.
Il permet donc d’étudier ou d’expliquer le fonctionnement de la
L.S.F. directement dans cette langue, mais il a aussi d’autres usages :
– analyser un entretien en L.S.F., chaque piste portant sur un aspect
particulier de la langue ou sur un des thèmes du discours ;
– fabriquer des exercices en L.S.F. ou des corrections de devoirs sur
la L.S.F., les premières pistes correspondant aux questions, aux
remarques ou au corrigé de l’enseignant, les autres pistes à celles
des élèves.
.
Les pratiques sociologiques permises par ces outils et les
besoins suscités
Un logiciel d’annotation de corpus vidéos de L.S. permettant à la
fois un travail synchronisé d’étiquetage (pour une analyse thématique)
et des commentaires aussi bien texte que vidéo (en L.S.) transforme
considérablement les possibilités d’analyse. Il est ainsi possible pour le
sociologue d’importer une autre vidéo, montrant, lorsque c’est important, l’interlocuteur de celui qui est filmé, (dans le cas où deux caméras ont été utilisées). Mais il est également intéressant de mettre ainsi
en regard deux extraits différents d’un même entretien, soit parce que
l’un complète ou nuance l’autre, soit parce qu’ils témoignent de deux
Cahiers de praxématique -,
expériences que l’on aurait pensé contradictoires. Ce dispositif permet également de mettre en saillance l’évolution d’une pratique en
articulant au témoignage d’une personne sourde ce qu’elle en disait ou
en espérait un an plus tôt, en important des extraits dans cette fenêtre
de commentaire vidéo. Le chercheur crée ainsi, de manière encore artisanale certes, une forme d’intertextualité vidéo. Autre détournement
d’usage, l’espace de commentaire a plutôt été utilisé pour proposer
les traductions fines des passages vidéos sélectionnés sur la base d’une
première analyse, qui fut elle menée dans l’espace des pistes de codage.
La fenêtre de commentaire vidéo de SLAnnotation peut aussi servir
à importer une image représentant l’utilisation de l’espace produite
via le logiciel VIES. Si cet outil a été produit à des fins linguistiques
ou pédagogiques, il peut intéresser les sociologues dans leur analyse
des précisions apportées par l’utilisation de l’espace et du regard. Par
exemple, lors d’un entretien portant sur les modalités de collaboration entre linguistes et professeur sourd de L.S.F., la personne sourde
interrogée en disait beaucoup plus sur cette relation via la mise en
scène spatiale de ces deux collaborateurs et son jeu de regard que
dans les propos explicitement tenus. Chacun était en effet positionné
dans un espace clairement distinct mais dans un rapport d’égalité. Certains moments étaient dédiés à des échanges et observations en tant
qu’invité à l’activité de l’autre, d’autres où ils se « tournaient le dos ».
Dans la mesure où ceci n’était pas explicitement dit, il était important de vérifier et de pouvoir montrer que cela avait pourtant bien été,
d’une autre manière, exprimé.
L’expérimentation d’un travail sur la vidéo d’une part et en L.S.
d’autre part, suscite d’autres besoins de travail dans cette langue et
ce media. Ceci est particulièrement mis en évidence par l’utilisation
du logiciel AVV, permettant d’insérer dans la vidéo elle-même un commentaire en L.S., et donc, de pouvoir envoyer cette vidéo, intégrée à
quelqu’un, qui pourra faire de même. Cette pratique est décisive non
pas dans la manipulation du corpus lui-même, mais dans le développement de tout le travail d’échanges « autour ». Ainsi, cet outil a été utilisé pour demander des précisions, à distance mais de manière contextualisée, à la personne filmée dans l’entretien. Celle-ci a pu répondre
de même en L.S. Ce logiciel permet également un travail à distance
ou en différé avec un collègue locuteur de L.S., en permettant de faire
des commentaires en L.S. sur un schéma de travail issu de l’analyse
Traitement des corpus en Langue des Signes...
d’un ensemble d’entretiens. Il soulève alors de nouvelles questions sur
les savoir-faire associés à un travail à distance sur des objets aussi
« lourds » que de la vidéo. Développer de bonnes conditions de travail
sur des données en L.S. semble indissociable de réflexions sur les conditions de travail à distance et en différé en L.S. Ces pratiques suscitent
par ailleurs des réflexions sur les modalités de communication ou de
publication vidéo en L.S., plaçant les questions de navigation mais
aussi d’hyperliens vidéo au cœur de ces développements techniques
comme de ces défis épistémologiques.
L’utilisation de ces outils a donc aussi un impact sur la communication entre chercheurs. La possibilité de faire des commentaires en
L.S. permet à un chercheur sourd de consigner ses remarques dans
sa langue. Cela facilite également les échanges entre chercheur entendant et professionnel de la L.S., le premier pouvant expliquer en L.S.
ses difficultés ou hésitations de traduction, en permettant au second
d’avoir sous les yeux, en même temps que ce commentaire, l’extrait
concerné et la traduction proposée. Enfin, le chercheur peut aussi luimême reproduire les signes qu’il observe dans l’entretien et qu’il ne
connaît pas (régionalisme), pouvant ensuite montrer ou utiliser cette
seule trace (ce qui permet de préserver l’identité et les propos du locuteur filmé) ou en combinaison avec un photoSigne, pour en discuter
avec d’autres professionnels experts en L.S.F. PhotoSigne est aussi un
moyen pratique de conserver les anthroponymes, donc les signes de
nomination des personnes sourdes. Ces pratiques utiles de représentation posent néanmoins la question des conditions de préservation
de l’anonymat (Dalle-Nazébi, ). Elles renvoient en parallèle à la
question des modalités possibles d’insertion de citations dans leur version d’origine dans des publications scientifiques. Différentes pistes
sont actuellement imaginées comme le recours au dessin sur la base
de photoSigne, le remplacement des traits du visage ou le recours à
des avatars signants.
.
Besoins et défis
Si ces nouveaux outils apportent une première réponse au traitement des corpus en L.S. par les sociologues et induisent de nouvelles
pratiques, ils font aussi naître de nouveaux besoins dont la satisfaction
se heurte à des défis de développement technologique et de recherche
Cahiers de praxématique -,
scientifique (Dalle, Braffort et Collet, ). Par exemple, concernant
les modalités d’annotations de corpus, au-delà du sous-titrage en
L.S.F. que permet AVV, il est demandé de pouvoir insérer des symboles ou des graphismes dans l’image elle-même. Quant à VIES qui
permet d’indiquer ce qui a été placé dans l’espace de signation, il lui
est demandé d’indiquer comment cela a été signé, c’est à dire de proposer une représentation visuelle des formes dessinées dans l’espace.
D’autre part, l’automatisation de la création de l’espace de signation
suppose résolu le problème de la segmentation temporelle (en signe)
d’un énoncé, ce qui est encore un problème de recherche.
On a vu que la démarche du chercheur l’amène à vouloir rassembler
un ensemble de données (d’autres vidéos, d’autres entretiens, d’autres
points de vue etc.) mais aussi leurs traitements par ces différents outils.
À ce jour, ceux-ci ne sont pas tous intégrés dans un même environnement, ce qui pose des problèmes d’interface mais aussi de cohérence
des différentes représentations informatiques.
Enfin, la navigation rapide dans un ensemble de corpus vidéo, une
des principales fonctions demandée par les chercheurs, ainsi que la
localisation d’une information à partir d’une requête en L.S., font
appel aux techniques d’indexation qui elles-mêmes s’appuient sur
les méthodes de reconnaissance et de comparaison de signes. Ces
méthodes doivent surmonter des problèmes liés à la grande variabilité des signes, à l’absence de normalisation et à une forte production
de néologismes (Lefebvre-Albaret et Dalle, ).
Un des obstacles qui s’oppose encore à l’usage de ces outils provient
de leur manque de robustesse. En effet, les opérateurs, de base (détection et suivi des composants) ou plus élaborés (segmentation, indexation, reconnaissance), devraient être capables de s’adapter au contexte
et fonctionner automatiquement. Or, il existe encore un fort décalage
entre les hypothèses utilisées pour le traitement automatique des L.S.
et les vidéos analysées dans le cadre de la sociolinguistique. Les chercheurs en traitement d’image imposent souvent des hypothèses restrictives sur l’apparence du signeur (contraintes vestimentaires), sur son
cadrage qui ne doit contenir souvent qu’un signeur et sur l’arrière-plan
de la vidéo. Si de plus on garantit une définition spatiale et temporelle
de qualité, il est alors possible de suivre les différentes parties du corps
des signeurs et d’interpréter des énoncés si leur structure et le vocabulaire utilisé sont eux-mêmes limités. Rares sont les corpus de sociolinguistique qui satisfont l’ensemble de ces conditions. Cela tient à la
Traitement des corpus en Langue des Signes...
forme des entretiens qui sont menés dans des conditions les plus naturelles possibles et donc n’imposent qu’un minimum de contraintes au
signeur dans sa tenue vestimentaire et sa posture. La caméra est souvent située de manière à filmer à la fois la personne menant l’entretien
et la personne interrogée ; cela permet de pouvoir analyser simultanément les questions et les réponses mais apporte une difficulté supplémentaire pour le traitement automatique, due à la fois à la présence
de plusieurs locuteurs sur une même vidéo et à un angle de prise de
vue de trois quart. La résolution spatiale et temporelle des vidéos peut
également être dégradée dans le cas où l’entretien se déroule à distance
via des logiciels de visioconférence qui imposent en outre une manière
spécifique de signer avec un espace de signation plus réduit.
Enfin la problématique de l’anonymisation des sujets devra être résolue par des techniques originales, car, en L.S., le visage, vecteur principal de l’identité, est également le support d’expressions qui font partie
intégrante de la langue et qu’il faut donc préserver. Les recherches
actuelles consistent à analyser séparément ces déformations faciales
et à les appliquer à un autre visage réel ou de synthèse. On rejoint
alors les techniques utilisées en animation d’avatar, un autre thème de
recherche très actif dans le domaine des L.S.
Conclusion
Du fait de la spécificité spatio-temporelle des L.S., les recherches
sociologiques sur des sujets s’exprimant en L.S. font un usage privilégié du support vidéo. Un des enjeux majeur concerne alors
l’exploitation de corpus vidéo de grande taille ce qui fait apparaître
des besoins importants de dispositifs d’indexation et de navigation au
sein de ces corpus. Les besoins de ces chercheurs rencontrent ceux des
enseignants en / de L.S. et de tous les professionnels amenés à parler,
en L.S., de contenus et manières de dire en L.S. Des outils commencent
à être réalisés pour annoter et représenter ces productions en L.S., sans
passer par des mots d’une langue à écriture. Leur usage induit des pratiques inédites d’inscription et d’annotation graphique. Une recherche
soutenue doit cependant être encore menée pour produire les formalismes, les méthodes d’analyses et les outils d’exploitation permettant
de traiter ces corpus dans le respect de la langue utilisée et de leurs
locuteurs.
Cahiers de praxématique -,
Références bibliographiques
A A.,
, « Voir le son : réflexions sur le traitement des
entretiens enregistrés dans le logiciel Sonal », Socio-logos,
Revue de l’association française de sociologie , http://
socio-logos.revues.org/2482.
C C.,
, La langue des signes française — Les voies de l’iconicité, Paris, Ophrys.
D P., B A. & C C.,
, « Accessibilité et langue des signes : modélisations,
méthodes, application », Conférence ASSISTH, Toulouse,
Cépaduès, -.
D-N S.,
, « Exposer l’image de locuteurs. Enjeux scientifiques
et politiques d’une mise en scène publique », in H P. &
P-C M. (éd.), Sciences et frontières ; Délimitations du savoir, objets et passages, Belgique, EME Interéditions, -.
D-N S.,
, « Récits d’une violence ordinaire. Les sourds au
travail », Développement humain, handicap et changement
social, , , -.
D-N S. & H-T M.,
(à paraître), « TIC et relation administrative. Repenser
l’activité, co-construire l’accessibilité », Actes de EUTIC,
nov. , Bruxelles.
D-N S. & L N.,
, « France et Québec devant la diversité culturelle. Les
politiques à l’épreuve de la surdité », Lien social et politiques , -.
D-N S. & L N.,
, « Sourds et médecine : impacts des représentations
sur les conditions d’accès aux soins. Regards croisés FranceQuébec », Interrogations ?, , -.
D D.,
, « Ethnologie et surdité ou ce que l’on entend par langage », Journal des anthropologues, vol. -, -.
D Y., , Les sourds, c’est comme ça, Paris, M.S.H.
E C. & L G.,
, « Filmer le travail, films et travail », Cinéma et
sciences sociales, université de Provence.
Traitement des corpus en Langue des Signes...
H H.,
, « Les sourds aux prises avec l’intégration », Ethnologie française, t. XXXIX, -.
L-A F. & D P.,
, « Analyse de vidéo en langue des signes : méthodes
et stratégies », ORASIS, Trégastel, AFRIF, (support électronique).
L-A F. & D P.,
, « Video Query in Sign Language Videos : How
to Model and Compare Signs ? », Language Resources
and Evaluation Conference (LREC ), Malte, European Language Resources Association (ELRA), (support
électronique).
M L. (coord.),
, CORPORactions Réincorporer le langage en interaction, rapport scientifique du projet ACI TTT.