Corrigé Nouveau TD3
Corrigé Nouveau TD3
Corrigé Nouveau TD3
- Identifier les groupes des marques de voitures ayant les mêmes caractéristiques et décrire
ces groupes.
> Descriptives : Matrice des corrélations (Coefficients + Indice KMO et test de Bartlett).
D'abord, nous devons nous assurer que les variables sont corrélées entre elles.
Matrice des corrélations : Nous pouvons observer que toutes les variables semblent
fortement corrélées (>0.4), nous suggérant déjà quelques associations.
1
Indice de KMO et test de Bartlett : L’indice KMO de 0,705 peut être qualifié d’excellent ou
de méritoire. Il nous indique que les corrélations entre les variables sont de bonne qualité.
Ensuite, le résultat du test de sphéricité de Bartlett est significatif (p < 0,01). Nous pouvons
donc rejeter l'hypothèse nulle pour lequel la matrice de corrélation est une matrice d’identité.
Les corrélations ne sont donc pas toutes égales à zéro. Nous pouvons donc poursuivre
l'analyse.
Analyse > Échelle > Analyse de la fiabilité > statistiques > échelle sans élement.
Le premier tableau contient la valeur de l’indice alpha de Cronbach. Nous remarquons ici que
la valeur du coefficient est de 0,623, ce qui est excellent, puisqu’il dépasse le seuil minimum
requis de 0,60. Par conséquent, on peut dire qu’on obtient, pour cette échelle composée de six
éléments, une cohérence interne satisfaisante.
La dernière colonne du deuxième tableau est tout de même celle qui retient le plus notre
attention. On rappelle que la valeur alpha est de 0,623 pour notre échelle lorsqu'elle contient
les six éléments. On constate que la consistance est maximisée en conservant tous ces
éléments, puisque si nous en retirons un, la consistance va diminuer (sauf pour les éléments
vitesse et largeur, mais dans ce cas la fiabilité n’augmente pas remarquablement). Donc on
n’a pas intérêt à éliminer aucun élément de l’ACP.
2
En conclusion, on peut dire que l’ACP est pertinente et qu’on a intérêt à garder tous les
élements.
Critère de kaiser : On ne retienne que les facteurs ayant des valeurs propres supérieures à 1.
En regardant la deuxième colonne du tableau ci-dessus, nous constatons qu’un seul facteur
(ou composante) possède une valeur propre plus élevée que 1. Nous le conservons donc pour
l'analyse (Cependant, cette méthode n’est pas satisfaisante lorsque le nombre de variables est
inférieur à 20).
Critère du coude. On observe le graphique des valeurs propres et on ne retient que les
valeurs qui se trouvent à gauche du point d’inflexion. Nous voyons un changement après le
deuxième facteur. Nous retenons donc deux facteurs pour l'analyse, puisque ce critère est plus
rigoureux que celui de Kaiser.
3
4. Interpréter les axes retenus et la qualité de représentation des variables.
Qualité de représentation : La qualité de représentation des variables par les facteurs est
évaluée par les communautés (Extraction). Les variables qui présentent des communautés
faibles (moins de 0,5) sont supprimées de l’analyse. On voit que les différentes variables sont
bien représentées par les facteurs (plus de 0.5).
1
Il est nécessaire à ce stade de fixer le nombre d’axes factoriels (2) que l’on souhaite retenir.
4
Interprétation de la matrice des composantes : La matrice des composantes représente les
corrélations existantes entre les facteurs et les variables. Un coefficient élevé (en valeur
absolue) indique que le facteur et la variable sont étroitement corrélés, ou encore que la
variable apporte beaucoup de sens au facteur.
Dans notre exemple, toutes les variables sont fortement corrélées (positivement) avec le
premier facteur. On pourra donc parler d’un effet taille dans le premier axe.2
Or, cette matrice factorielle (sans rotation) permet rarement d’aboutir à des facteurs pouvant
être interprétés. En effet, il ressort que toutes les variables saturent fortement sur le facteur 1
et aucune variable n’est associée avec le facteur 2. Il serait très difficile avec une telle matrice
d’interpréter les résultats.
2
Effet taille : les variables sont toutes du même coté de l’axe. (i.e. elles contribuent toutes dans le même sens à
la formation de l’axe).
5
5. Justifier l'intérêt de faire une rotation à l'issu de cette ACP puis donner une
interprétation des axes retenus.
> Rotation > Méthode (Varimax) – Afficher (Structure après rotation + Carte factorielle).
Comme le montre les résultats avant et après rotation, nous remarquons que les variables sont
beaucoup mieux réparties sur les deux facteurs. Seule la variable cylindrée a vu ses
coordonnées s’améliorer sur la 2ème composante et diminuer sur la 1ère (0.728 et 0.625
6
respectivement). De l’autre part, les corrélations des variables « puissance » et « vitesse » ont
chuté remarquablement sur la 1ère composante et ce sont améliorées sur la 2 ère composante
(0.874 et 0.959). Ces variables deviennent associées avec la deuxième composante, après la
rotation. Pour les variables « poids » et « longueur », les coordonnées ont diminué faiblement
sur la 1ère composante ; et augmenté sur la 2ème composante. Malgré ça ces deux variables sont
encore associés avec la 1ère composante (0.977 et 0.901). La corrélation de la variable
« largeur » a augmenté sur la 1ère composante et diminué sur la deuxième. Cette variable est
encore associée avec la 1ère composante (0.922).
Interprétation des axes : L’axe 1 est représenté par les variables : poids, longueur et
largeur : ce sont les caractéristiques de « dimension » de la voiture. L’axe 2 est représenté par
les variables : puissance et vitesse : ce sont les caractéristiques de « force du moteur ». Ainsi,
le facteur 1 permettait de différencier les petites voitures des grosses voitures alors que le
deuxième différencie les voitures familiales ayant un moteur moyen aux voitures sportives
ayant un moteur très puissant. Nous remarquons aussi que la variable cylindrée sature de
façon importante sur les deux facteurs (Ceci signifie qu’il faudrait probablement retirer cette
variable qui ne se positionne pas de façon adéquate sur un seul facteur et recommencer
l’analyse).
Cette interprétation, qui est déjà assez claire, peut être précisée avec la carte des variables
après rotation :
On peut voir que les variables : vitesse et puissance sont associées avec la composante 2 (axe
des ordonnées) et que les variables : poids, largeur et longueur sont associées avec la
composante 1 (axe des abscisses).
7
6. Déterminer les coordonnées des individus sur les axes retenus : on multipliera les
coordonnées standardisées sur chaque axe, fournies par SPSS dans le tableau initial (i.e.
fact1_1, fact2_1 ...), par la racine carrée de la valeur propre associée à cet axe :
Puis, on multiplie la première colonne FAC1_1 par √ 3 .192 et la deuxième colonne FAC1_2
par √ 2 .379 pour avoir les coordonnées des individus (C1 et C2) : Transformer > Calculer la
variable > variable cible (C1) – expression numérique (FAC1_1 * SQRT (3.192)). Les
résultats sont affichés sur le tableau suivant, extrait de « l’affichage des données » de la base
voitures.sav :
3
Pour enregistrer les deux nouveaux facteurs (i.e. fact1_1, fact2_1) obtenus après l’extraction avec rotation. On
peut également utiliser les facteurs avant rotation sans avoir aucun changement dans l’interprétation de la carte
des individus.
8
On trouve 3 nuages de points : Le premier comprend les modèles qui réunissent entre la
grande dimension et la force du moteur (bmw530i, bmw325ix, rover 827i, Renault 25, Audi
90quatro) ; le deuxième est caractérisé par la force du moteur et les petites dimensions et
comprend les modèles de Rallye (Peugeot 205rallye, Citroën AXsport, Honda civic) ; le
troisième nuage comprend des voitures ayant une force et forme moyenne et il est difficile
d’interpréter ce nuage car il est situé au point d’intersection des deux axes.
Force du moteur
Dimension
9
La qualité de représentation d'un individu « Rover » est mesurée par la formule suivante4 :
C2Rover C 1 1,14 ²
QLTC1 (Rover) = 2 2
= = 0,19 ; Ainsi, 19 % des propriétés de la
C Rover C 1+ C Rover C 2 1,14 ²+2,35 ²
voiture « Rover » se retrouvent sur l'axe 1.
C2Rover C 2 2,35 ²
QLTC2 (Rover) = 2 2
= = 0, 81
C Rover C 1+ C Rover C 2 1,14 ²+2,35 ²
QLTC1 (Rover) + QLTC2 (Rover) = 0,19 + 0,81 = 1
Le modèle Rover est très bien représenté par le deuxième axe. Le modèle Rover est
caractérisé par un moteur puissant en termes de vitesse et de puissance.
4
1.14 et 2.35 représentent les coordonnées du Rover sur l’axe C1 et l’axe C2, respectivement. Voir le tableau de
la page 8. La qualité de représentation de l’individu i sur l’axe j est mesurée par :
c ²ij
QLT j ( i ) = j
∑ c ² ij
1
10