Analyses Statistiques Validation Questionnaires - Beaudart
Analyses Statistiques Validation Questionnaires - Beaudart
Analyses Statistiques Validation Questionnaires - Beaudart
Introduction
Guide d’aide à la réalisation des statistiques visant à vérifier les propriétés psychométriques d’un
questionnaire/d’une échelle/d’un outil.
Les questionnaires de santé sont de plus en plus employés en recherche médicale et en pratique clinique. Il
est indispensable d’adopter une méthodologie scientifique pour développer ce type de questionnaire ou pour
traduire des questionnaires de santé préexistants dans la littérature scientifique. Mais le
développement/traduction d’un questionnaire ne suffit pas, une étape recherche supplémentaire reste
fondamentale une fois le questionnaire développé ou traduit : l’étape de validation du questionnaire de santé.
Il est en effet nécessaire de s’assurer que notre questionnaire développé ou traduit possède un niveau de
qualité suffisant : il doit être démontré, par une analyse qualitative et quantitative, que notre questionnaire
mesure bien ce qu’il est censé mesurer, que les mesures établies par le questionnaire sont reproductibles et
que ce questionnaire permet de mettre en évidence des changements de l’état de santé.
Une méthodologie rigoureuse, issue des principes de l’épidémiologie, est proposée depuis 2007 par Terwee
et al.1 pour garantir un processus de validation du questionnaire robuste et scientifique. Il s’agit de la
méthode de référence, publiée dans le « Journal of Clinical Epidemiology », qui a été citée à plus de 5000
reprises.
Base de données et import dans SPSS
Une fois l’ensemble de vos données recueillies, la base de données doit préalablement être construite dans
Excel. Chaque ligne représente un individu et chaque colonne représente une variable. Il est indispensable
de donner un identifiant à chaque participant ! Une seule base de données doit être développée et doit
comprendre l’ensemble des données récoltées pour les analyses ; données socio-démographiques et
cliniques des participants, encodage du questionnaire (chaque item séparément + total), encodage des autres
questionnaires/outils utilisés lors de la validation de l’outil, encodage du questionnaire (chaque item
séparément + total) lors du re-test, etc. Il est important de correctement nommer les variables pour éviter
toute confusion. Parallèlement, il est recommandé de développer un codebook visant à définir
exhaustivement chaque nom de variable. Il est également important de nommer les variables sans espaces
(astuce : utilisez _ pour indiquer un espace. Exemple : « PASI_ITEM1 »). Une fois votre base de données
encodée dans le logiciel Excel, enregistrez-la en format Excel 97-2003 (format reconnu par SPSS).
Exemple d’une BD construite dans Excel pour vérification de propriétés psychométriques d’un questionnaire (PASI). Dans cet
exemple, le MCS et PCS du SF-36 a été utilisé pour mesurer la validité de construit. Les résultats de ce questionnaire sont donc
également encodés dans la BD Excel.
Analyses psychométriques
1/ Cohérence interne
Deux éléments à mesurer
1. Alpha de Cronbach
L’alpha de Cronbach est une mesure de l’homogénéité de l’échelle et des différents items/domaines
de l’échelle entre eux. Idéalement, on calculera une valeur d’alpha de Cronbach pour l’échelle
complète et une mesure de l’alpha de Cronbach en supprimant, individuellement, un a un les items.
L’idée de cette deuxième analyse est d’identifier un item qui aurait éventuellement un impact
important sur l’homogénéité de l’échelle.
L’alpha de Cronbach varie entre 0 et 1. Un Alpha de Cronbach se situant entre 0.7 et 0.95 indiquera
une bonne cohérence interne de l’échelle2. En effet, une valeur supérieure à 0.95 pourrait indiquer
une homogénéité trop importante des items ce qui pourrait correspondre à une redondance des
items entre eux.
Sur SPSS : Analyse, Echelle, fiabilité, sélection de l’ensemble des items (mais pas le score total !) + cocher
« alpha de Cronbach ». Dans statistiques, cocher « éléments », « échelle », « échelle sans l’élément » et
« corrélation ».
On obtient alors l’alpha de Cronbach « total » ainsi qu’une table comme celle-ci-dessous reprenant
plusieurs éléments.
La dernière colonne renseigne l’alpha de Cronbach en excluant individuellement chacun des items.
La troisième colonne renseigne la corrélation de chaque item avec le score total de l’ensemble des 9 autres
items. Attention toutefois que cette méthode de corrélation de chaque item avec le score total de l’échelle
ne fonctionne que dans le cas où le score global de votre questionnaire correspond à une addition des
différents items de l’échelle. Dans le cadre ou le score total de l’échelle nécessite une statistique plus
complexe (pondération plus importante pour certains items, par exemple), il conviendra d’utiliser une autre
méthode de calcul de corrélation.
Pour ce faire, il sera nécessaire de calculer x nouveaux scores totaux, auxquels on retirera à chaque fois un
item séparément. On mesurera ensuite une corrélation entre l’item 1 et le (score total – item 1) ; entre l’item
2 et le (score total – item 2), etc.
Sur SPSS :
1. Transformer, Calculer la variable, score_moins_item1 = (calcul du score total selon la pondération
utilisée en supprimant l’item 1)
2. Analyse, corrélation, bivariée, sélection de chaque item séparément et (score total de l’échelle – ces
items), cocher « Spearman » (en cas de distribution non normale des variables -préalablement
testée) ou « Pearson » (en cas de distribution normale des variables)
2/ Fiabilité test-retest
En cas de variable continue (exemple : score total d’un questionnaire sur une échelle quantitative
continue) : mesure d’un Coefficient de Correlation Intraclasse (ICC) et de son intervalle de confiance à
95% entre le test (T1) et le retest (T2) sur le score total de l’échelle mais aussi sur les items/domaines
individuels. Un ICC supérieur à 0.7 est considéré comme acceptable1.
Sur SPSS : Analyse, Echelle, Sélectionner total questionnaire T1 et total questionnaire T2 (ou chaque item
du questionnaire T1 avec chaque item du questionnaire T2 séparément), Statistiques, ICC two-way mixed,
absolute agreement + interprétation de l’ICC obtenu en mesures uniques.
En cas de variable binaire (exemple : score total de l’échelle donne une donnée binaire - outil de diagnostic
par exemple) : mesure d’un Kappa de Cohen et de sa p-valeur. Un Kappa de Cohen supérieur à 0.41 est
considéré comme acceptable4.
Sur SPSS : Analyse, Fréquence, Tableau croisé, Sélectionner total questionnaire T1 et total questionnaire
T2 (ou chaque item du questionnaire T1 avec chaque item du questionnaire T2 séparément), Kappa
Cohen.
Exemple de table de résultat obtenue sur SPSS pour la mesure d’un Kappa de Cohen et de sa p-valeur.
Ensuite, il sera nécessaire de calculer l’écart type de cette différence (SDdifference) et de diviser la
valeur obtenue par la racine de 2.
𝑆𝐷 𝑑𝑖𝑓𝑓𝑒𝑟𝑒𝑛𝑐𝑒
SEM= √2
2. Dans la seconde méthode on utilise l’ICC mesuré à l’étape précédente. Il faudra mesurer l’écart
type des valeurs du test (SDT1) et des valeurs du retest (SDT2). Grâce à ces deux SDs, il sera
𝑆𝐷12+ 𝑆𝐷22
possible de calculer un écart type poolé (SD pooled) via la formule qui suit : SDpooled= √ 2
SEM= 𝑆𝐷𝑝𝑜𝑜𝑙𝑒𝑑 𝑥 √(1 − 𝐼𝐶𝐶)
Sur SPSS, double cliquer sur le Scatter Plot pour ouvrir l’Editeur de Graphiques. Vous pouvez désormais
insérer une ligne d̄ en cliquant sur ce symbole , ajouter une ligne de référence à l’axe Y. Il sera possible
d’ajouter la valeur d̄ que vous avez préalablement calculé.
Vous pourrez ajouter les LoA de la même manière en utilisant les formules suivantes
Une corrélation supérieure à 0.6 et significative est considérée comme une corrélation importante3.
Sur SPSS : Analyse, corrélation, sélection du score total du questionnaire A et soit le Gold standard ou le
questionnaire B (ou de certains items/domaines du questionnaire, selon les hypothèses définies dans le
protocole), Corrélation entre les deux mesures (Pearson ou Spearman selon la distribution des variables).
7/ Effets plancher/Plafond
Si >15% des répondants ont le score min / max au questionnaire.
8/ Responsiveness/Sensitivity to change
Ils existent plusieurs méthodes pour évaluer la sensibilité au changement d’un outil8. Deux approches sont
présentées ci-dessous :
• Vérification d’hypothèses sur la corrélation entre les changements mesurées par l’outil/le
questionnaire étudié (A) et les changements mesurés par un ou plusieurs autres outils de référence (B).
La démarche est identique à celle pour mesurer la validité de construit, mais la mesure s’effectue sur
les changements entre deux temps (T1 & T2).
Sur SPSS :
1) Créer une variable qui est la différence entre la valeur à T2 et T1 pour le questionnaire A:
Transformer, calculer la variable, variable cible= Diff_A, expression numérique= A_T2 –
A_T1. Identique pour outil B.
2) Analyse, corrélation, sélection Diff_A et Diff_B (ou autres paires, selon les hypothèses
définies dans le protocole), Corrélation entre les variables (Pearson ou Spearman selon la
distribution des variables).
• Evaluation d’une taille d’effet (« effect size ») qui permet de savoir si les participants ont eu un réel
changement sur la variable d’intérêt. L’idée sera de diviser l’échantillon de patients en trois catégories :
1) ceux qui ont amélioré leur résultat, 2) ceux qui ne l’ont pas changé/qui sont restés stables, et 3)
ceux qui ont détérioré leur résultat. Dans cette méthode, l’idéal serait de demander aux participants
s’ils ressentent une amélioration importante vs statut quo, vs détérioration de la variable d’intérêt
(exemple : de leur qualité de vie « générale »). Il est donc nécessaire d’ajouter une question
« d’ancrage » en plus du questionnaire.
Pour les trois catégories, on va ensuite calculer des « standardized response mean » (SRM) en utilisant
𝑀𝑜𝑦𝑒𝑛𝑛𝑒 (𝐷𝑖𝑓𝑓_𝐴)
la formule suivante : . Pour permettre d’utiliser les cut-offs de Cohen et al, on
é𝑐𝑎𝑟𝑡−𝑡𝑦𝑝𝑒 (𝐷𝑖𝑓𝑓_𝐴)
𝑆𝑅𝑀⁄
√2
transforme le SRM obtenu précédemment en utilisant la formule √(1−𝑟)
dans laquelle « r » est la
corrélation entre les scores à T1 et à T2. Vous interprétez les SRM transformé comme suit : SRM
<0.20 est un effet négligeable, 0.20≤SRM<0.49 est un petit effet, 0.50≤SRM<0.79 est un effet
modéré et SRM≥0.80 est un effet important9. Idéalement, on trouvera un effet important pour le
groupe de personnes dont les résultats se sont soit améliorés ou détériorés et un effet négligeable dans
le groupe de personne dont les résultats sont restés stables.
Sur SPSS :