Colle TP
Colle TP
Colle TP
L’objectif est de rendre les variables comparables. Généralement, les variables sont
normalisées de manière à ce qu’elles aient au final un écart type égal à un et une moyenne
égale à zéro.
Techniquement, l’approche consiste à transformer les données en soustrayant à chaque
valeur une valeur de référence (la moyenne de la variable) et en la divisant par l’écart type. A
l’issue de cette transformation les données obtenues sont dites données centrées-réduites.
L’ACP appliquée à ces données transformées est appelée ACP normée.
La standardisation des données est une approche beaucoup utilisée dans le contexte de
l’analyse des données d’expression de gènes avant les analyses de type PCA et de clustering.
On réalise l’ACP pour les 10 premières colonnes du jeu de données qui correspondent
aux performances des athlètes pour les dix épreuves du décathlon.
On représente graphiquement les individus dans le plan des axes factoriels 1 et 3 :
On utilise le package factoextra pour rendre les sorties de FactoMineR plus agréable et
adaptables.
Interprétation :
Déterminer quelle est la contribution de chaque variable sur chaque composante ou leur
corrélation. Quelle est la part d’inertie associée aux deux premiers axes factoriels.
Conclusion :
L'ACP nous a permis de :