Analyse Canonique
Analyse Canonique
Analyse Canonique
ANALYSE CANONIQUE
Plan
1. Les données
2. Le principe de l'analyse canonique
3. Les représentations graphiques
4. Une application de l'AC
5. Les cas particuliers de l'AC
6. La critique de l'AC
1. Les données
• 2 tableaux de données :
le tableau X1 à n lignes et m1 colonnes
le tableau X2 à n lignes et m2 colonnes
Pour chacun des 2 tableaux, la ligne i représente l'individu i.
• Les colonnes de X1 et de X2 sont constituées soient
par des variables quantitatives centrées
par les modalités de variables qualitatives
Var[z11 ] = Var[z21 ] = 1.
Remarques :
1. • z11 est donc le premier vecteur propre de P1 P2
• z21 est donc le premier vecteur propre de P2 P1 ,
où
P1 désigne le projecteur orthogonal sur l'espace engendré par les
colonnes de X1 et
P2 désigne le projecteur orthogonal sur l'espace engendré par les
colonnes de X2 .
2. • z11 est une combinaison linéaire des variables du tableau X1
• z21 est une combinaison linéaire des variables du tableau X2
P = X(X 0 X)−1 X 0 .
Remarques :
3. Ces deux vecteurs propres z11 et z21 sont associés à la même valeur
propre qui est égale au coecient de détermination
R2 (z11 , z21 ).
2 Cov(z1k , z2k )
R (z1k z2k ) =
Var[z1k ]Var[z2k ]
ait une valeur maximale sous la contrainte
Var[z1k ] = Var[z2k ] = 1.
et pour r < k
R(z1r , z1k ) = 0 et R(z2r , z2k ) = 0
Remarques :
1. • z1k est donc le k -ième vecteur propre de P1 P2
• z21 est donc le k -ième vecteur propre de P2 P1 ,
où
P1 désigne le projecteur orthogonal sur l'espace engendré par les
colonnes de X1 et
P2 désigne le projecteur orthogonal sur l'espace engendré par les
colonnes de X2 .
2. • z1k est une combinaison linéaire des variables du tableau X1
• z2k est une combinaison linéaire des variables du tableau X2
Remarques :
3. Ces deux vecteurs propres z1k et z2k sont associés à la même valeur
propre qui est égale au coecient de détermination
R2 (z1k , z2k ).
et
−1
V22 V21 ak1 = R(z1k , z2k )ak2
soit le plus petit possible, sous les mêmes contraintes que dans l'espace
des variables.
• On calcule alors les facteurs a11 et a12 (qui sont en fait les vecteurs
−1 −1
propores associés aux valeurs propres de la matrice V11 V12 V22 V21 ) en
−1 −1
diagonalisant la matrice V11 V12 V22 V21
• Enn on calcule les premières composantes canoniques z11 et z21 .
5. La critique de l'AC
• L'AC décrit les relations linéaires existant entre 2 ensembles de
variables : les premières étapes mettent en évidence les directions de
l'espace des variables selon lesquelles les deux ensembles sont le plus
proches.
• Mais il est possible que les variables canoniques soient faiblement
corrélées aux variables des tableaux X1 et X2 . Donc elles sont
dicilement interprétables.
• En eet, les variables d'origine n'interviennent pas dans les calculs de
détermination des composantes canoniques, seuls interviennent les
projecteurs sur les espaces engendrés par ces variables.