Exploitation: Des Données
Exploitation: Des Données
Exploitation: Des Données
des données
textuelles
souvent par des comptages, des analyses statistiques, ou encore des analyses plus
qualitatives du contexte dans lequel les mots apparaissent.
Comme le souligne Weber (1990), il existe différentes méthodes pour mener une
analyse de contenu et le chercheur doit déterminer lui-méme quelle est la méthode
la plus appropriée 4 son probléme.
{compari
552
Exploitation des données textuelles = Chapitre a7
tion r|
ANALYSE DE CONTENU
Les analyses de contenu ont été développées dans les années vingt aux Etats-Unis
pour étudierdes articles de presse et des discours politiques. Elles ont pour objectif
Panalyse du contenu manifeste d'une communication.
Sousla classification « analyse de contenu », sont regroupéesdifférentes méthodes
qui, si elles suivent toutes les mémes étapes présentées dansla figure 17.1, different
en fonction des unités de codage choisies et des méthodes d’analyse des résultats
utilisées.
a
analyses statistiques
oO™~S
(comparaisonsde fréquences, analysesfactorielles, analyses qualitatives
analyses de correspondances...)
Ne
interprétation
D'aprésBardin (2013)
553
Partie 3 © Analyser
donnéespouruneanalysedecontenu
Les analyses de contenu s’effectuent sur des données collectées selon des
methodes non structurées ou semi-structurées telles que les entretiens (libres on
semi-directifs) ou les méthodes documentaires. Certaines réponses 4 des Westions
insérées dans des enquétes par questionnaire peuvent étre également traitées ar
Vanalyse du contenu. Plus généralement, tout type de communication verbale oy
tout matériel écrit peut faire |’ objet d’une analyse de contenu. Cette étape est Parfois
appelée pré-analyse (Bardin, 2013).
Lobjectif des méthodes nonstructurées est de générer des données qui soient leg
plus naturelles possibles. Ces méthodes dissocient les phases de collecte de celles de
codage et d’analyse des données.
a wo
étre ensuite codés (cf. ci-aprés pour plus de détails sur cette étape).
Le principal avantage de ces méthodesest la validité des données produites, Les
données ayant été générées spontanément par le répondant ou en réponse a des
questions ouvertes, elles sont plus susceptibles de refléter ce qu’il pense (Cossette,
1994). Par ailleurs, ces méthodes générent des données qui sont beaucoup plus
riches que les méthodesstructurées.
Cependant, ces méthodeslimitentla fiabilité des données produites. Enfin, en ce
qu’elles nécessitent un travail important de la part du chercheur en aval de la
collecte, elles ne sont pas envisageables 4 grande échelle. De fait, on les utilise
554
Exploitation des données textuelles = Chapitre 17
construit que les données recueillies sont censées représenter (la cognition
organisationnelle, la pensée de groupe, par exemple) : peut-on considérer un
document rédigé par un membre d’un groupe commereflétant la pensée de ce
groupe, voire de I’ organisation dans son ensemble ? Unetelleutilisation des données
documentaires peut étre ainsi sujette 4 des critiques d’anthropomorphisme et de
éification (Schneider et Angelmar, 1993). Tl est donc nécessaire de définir trés
clairementle construit que la méthode est supposée appréhenderet, plus largement,
Ja relation que le chercheur établit entre le discours analysé et la réalité 4 laquelle il
renvoie (Alvesson et Karreman, 2000). Dans une moindre mesure, les méthodes
documentaires sont aussi utilisées pour étudier la dynamique et le contenu
dinteractions (retranscription de réunions, données de courrier électronique, par
exemple). Dans ce cas, les données feront l’objet d’une analyse de contenu.
Les données de discours ou documentaires ainsi recueillies font ensuite l'objet
d'un codage.
Coderlesdonnées
555
Partie 3 = Analyser
556
Exploitation des données textuelles Chapitre 17
nients |. panscertainscas, les catégories peuventétre assimilées 4 un seul mot. On aura ainsi
effet © autant de catégories que de mots différents que le chercheura choisid’étudier. Dans
érera. | ce cas, les mots « concurrents » et « rivaux » constitueront deux catégories
: distinctes.
= Enfin, les catégories peuvent étre des caractéristiques de formes de discourstelles
queles silences,les intonations,les formes grammaticales ou syntaxiques.
wu en | Les catégories renvoient finalement différents niveaux d’inférence, allant de la
description a l’interprétation.
tala | La définition des catégories peut se faire a priori ou a posteriori.
chent |. _ Dans la méthodea priori, les catégories sont définies avant le codage 4 partir de
stitue. | l'expérience ou derésultats de recherches antérieures. On utilise cette méthode
notammentlorsqu’on cherche & vérifier des hypothéses issues d’ autres travaux. Le
ase,«| systemede catégorisation du comportementverbal organisationnelutilisé par Gioia
e. Ce , et Sims (1986) constitue un bon exemple de catégorisation a priori. De méme,
(voir : Boland et Pondy (1986) ont eu recours a une catégorisation a priori pour coder des
retranscriptions de réunions budgétaires: les catégories ont été définies en fonction
du modéle de décision utilisé (fiscal, clinique, politique ou stratégique) et du mode
d’analyse de la situation (instrumental ou symbolique) par les participants.
_Dans la méthode a posteriori, la définition des catégories s’effectue durant le
e les processus de codage. En général, les différentes unités repérées sont comparées, puis
lyse. | regroupées en catégories en fonction de leur similarité. Simultanément, les unités
SOILS sont classées et les catégories définies. Cette méthode s’apparente a la méthode de
ines. comparaison systématique de codage des données proposée par Glaser et Strauss
ent : (1967).
ches |
puis-
rma- | Exsee.e ~ Un codage a posteriori de réponses aux questions ouvertes
qui | d’un questionnaire
sum |= Apres collecte des données d’un questionnaire administré & plusieurs personnes dans le
eg0- 4 cadre d’une catégorisation des données a posteriori, il sera nécessaire d’effectuer un
rents 3° dépouillement commeil suit :
; &° —caractérisation des réponses: il s’agit de résumerle sens de la réponse qui peut étre for-
pie) 5 : mulée en des phrases multiples et complexes, afin de le ramener & un ou plusieurs
| des a concepts ou thémes univoques. Par exemple, si la réponse 4 Ja question « que vous a
liffi- Z apporté la formation que vous avez suiviesurle plan professionnel ? » est « une meilleure
iple, z capacité & communiquer avec mes collégues qui aura, je V’espére, une répercussion dans
gies 3 mesobligations professionnelles jusque-la pénibles, tels les réunionset les travaux de
doit Pr groupe », on peut réduire cette réponse 4 deux concepts : « capacité personnelle 4 com-
plus 3 muniquer » et « tolérance du travail en groupe 3 - .
“des & — inventaire de tous les concepts que l’on va ensuite regrouper dans différentes catégories
a. 2 en fonction des objectifs de la recherche et du degré de différenciation (ou du nombre de
qua a catégories) que I’on souhaite obtenir. L’importance de chaque catégorie pourra étre fone-
® tion du nombre de concepts qui s’y regroupent.
557
Partie 3 « Analyser
Plusles définitions des unités d’analyse et des catégories sont claires et Précises
meilleure sera la fiabilité du codage. Dans cette perspective, il est Conseil]é
d’élaborer un protocole de codageprécisantles régles et définitions de ces éléments
Ana
messal
Le processus d’évaluation de la fiabilité intercodeurs © Danod — Toute reproduction non autorisée est un délit.
étre at
(Weber, 1990) spécifi
Codage d’un échantillon de données estimations des taux d’accord (Guetzkow, ce, pol
Aprés. avoir défini.l’unité d’analyse et les 1950). métho}
catégories, le méme texte ou échantillon
de texte est codé:indépendamment par
Evaluation dela fiabilité intercodeurs
deux codéurs au moins. Le calcul de [a . . . wu 4
A partir des échantill ons’ ainsi: codés sont tA
fiabilité“devra impérativernent: “tre établis les taux d’accord entre les codeurs
effectué avant résolution des divergences, SUF = Les
On: conseille ‘pour fe calcul des taux’ de «d'une: part la. définition’ des unités anal
fiabilité. que. les’: échantillons \codés codées; surtout si leurs définitions sont logici
comportent 100 a 150 unités,; nombre’ a ambigués et ne se rapportent pas a un de ceg
partir’ duquel fe codage ‘d’unités supplé- élément. clairement® identifiable (du reposd
mentaires aun: impact: limité™ sur- les type mot,” phrase, ou" paragraphe). La discoy
=
558
Exploitation des données textuelles w Chapitre 17
=
fiabilité intercodeurs est alors le taux et le processus de double codage réitéré a
d’accord sur le nombre d’unités d’ana- l’étape (1). Lorsque les taux apparaissent
lyse identifiées comme codables par les relativement bons (de l’ordre de 80 %‘eri
deux codeurs dans une méme général) et stabilisés, les deux codeéurs
observation ; codentde fagon indépendante l’ensemble
dautre part la catégorisation effectuée des données.
(Robinson, 1957). Il s’agit du taux d’ac-
Evaluation globale dela fiabilité
cord entre les codeurs quanta la classi-
intercodeurs
fication des unités identifigées comme
codablespar les deux codeurs. Les taux ll s'agit enfin de ne pas postuler que
d’accord classiques proposés dans la l'ensemble des données a été codé- de
littérature sont tous plus ou moins facon fiable. La fatigue, mais aussi la
dérivés du taux d’accord K de Kruskal modification de la compréhension’ des
(Scott, 1955 ; Cohen, 1960). Ce taux est régles de codage au cours du temps,
la proportion d’accord entre les deux peuvent venir altérer la fiabilité interco-
codeurs sur le nombre total de décision deurs. Le processus d’évaluation ‘de: la
de codage aprés que l’on a enlevé fiabilité intercodeurs étant particuliére:
l'accord di au seul hasard 1 (Cohen, ment long et fastidieux, on peut envisager.
1960.) de ne |’établir que sur des échantillons, de
données (codées au début, au milieu eta
Précision des régles de codage la fin, par exemple). Unefois les taux de
Aprés établissement de ces taux d’accord fiabilité intercodeurs établis, il faut
sur un premier échantillon, les régles de résoudre les points de désaccord qui sont
codage peuventétre révisées ou précisées apparus.
559
Partie 3 Analyser
ac &
contenu des comportements verbaux. Cette analyse s’est notamment appuyéesur un
56
ie Analyse qualitative
‘ond
On peut également mener une analyse plus qualitative, dont l’objectif sera alors
d’apprécier importance des themes dans le discours plutét que de la mesurer. La
différence entre analyse quantitative et qualitative réside dans la fagon dont elles
congoivent la notion d’importance d’une catégorie : « nombre de fois » pout
Vanalyse quantitative ; « valeur d’un théme » pour I’analyse qualitative. L’ analyse
560
Exploitation des donnéestextuelles = Chapitra 17
561
Partie 3 & Analyser
Définir le discours
ae
no}
°
oc
562