Bivariée
Bivariée
Bivariée
(Analyse bivariée )
2008/2009
FSTG Marrakech
Plan du chapitre
I. Introduction
II. Formulation de la méthode
Analyse Bivariée
Variable X explicative
Quantitatif Qualitatif
Pr. AIT BABRAM Mohamed
Formulation de la méthode
1. Tableau de contingence
2. Distribution marginale.
Analyse Bivariée
3. Distribution conditionnelle.
4. Indépendance de deux
caractères.
5. Exemples
Pr. AIT BABRAM Mohamed
FSTG Marrakech Tableau de contingence
Nous prélevons d’une population un échantillon aléatoire de taille n et nous
observons sur chaque unité statistique de l’échantillon deux caractères X et Y
qui peuvent êtres quantitatifs, qualitatifs ou encore l’un est qualitatif et
l’autre est quantitatif.
¾ X présente k modalités x1, x2, …….., xk.
¾ Y présente m modalités y1, y2, …….., yk.
Analyse Bivariée
k m
n• j = ∑n ij ni • = ∑n
i =1
ij
i =1
FSTG Marrakech
Tableau de contingence
Remarque : Un tableau de contingence peut être aussi formulé avec des
fréquences relatives ou bien des pourcentages.
Analyse Bivariée
Pr. AIT BABRAM Mohamed
m m
fi• = ∑ f ij pi • = ∑ pij
j =1 j =1
k
n ij k
f ij = f • j = ∑ f ij pij = f ij ×100 p• j = ∑ pij
n i =1 i =1
k m k m
∑f i• = ∑ f• j = 1 ∑p
i =1
i• = ∑ p• j = 100
j =1
i =1 j =1
FSTG Marrakech Tableau de contingence
Exemple 1 : les caractères X et Y (Qualitatifs)
A fin d’étudier le comportement des clients d’un magasin vis-à-vis des produits
Haut Gamme et le e-commerce, on leurs a posé les questions suivantes :
¾ Est-ce que vous achetez les produits Haut Gamme ? Vrai □ Faux □
¾ Est-ce que vous achetez vos produits via Internet ? Vrai □ Faux □
Les réponses collectées auprès des clients nous ont donné le tableau suivant :
Analyse Bivariée
000 dhs et moins; plus de 2 000 dhs mais moins de 3 000 dhs; 3 000 dhs
et plus. A partir des résultats de cette enquête, on a construit le tableau de
contingence suivant :
Catégorie salariale (Y)
Total des lignes
Y < 2000 2000≤Y<3000 3 000≤Y
Élevé 13 19 25 57
Niveau de
Pr. AIT BABRAM Mohamed
satisfaction Moyen 28 29 28 85
(X)
Faible 24 18 16 58
Total des colonnes 65 66 69 200
FSTG Marrakech
Tableau de contingence
Exemple 3 : Les caractères X et Y (Quantitatifs)
La distribution des ouvriers des usines d’un groupe financier selon l’âge et la
rémunération mensuelle est donnée par le tableau de contingence suivant :
Age (Y)
Totaux
Analyse Bivariée
X≥20 0 0 0 1 14 6 7 5 33
Totaux 527 1 220 1 578 1 186 1 388 1 201 465 130 7 695
FSTG Marrakech Distributions marginales
Définition : On appelle distribution marginale de X (resp. de Y) la distribution
effectif fréquence du caractère X (resp. Y) sur l’échantillon étudié
indépendamment de Y (resp. X).
Remarque : On note que la lecture de la distribution marginale de X (resp. de
Y) se fait au niveau de la dernière ligne (resp. la dernière colonne) du tableau
de contingence associé à la distribution du couple (X,Y) :
Analyse Bivariée
Pr. AIT BABRAM Mohamed
Distribution conditionnelle de Y
sachant que Y=yj
X
presque jamais vérifiées. Il faut alors vérifier que les lignes ou bien les
colonnes du tableau de contingence sont presque proportionnelles.
=
(n )(n )
i• •j
pour i ∈{1,....,k} et j ∈{1,....,m}
Pr. AIT BABRAM Mohamed
nij
n
n32 =
(n )(n ) 72×60
3•
=
•2
= 36
n 120
FSTG Marrakech
Cas où X et Y (qualitatifs)
1. Exemple
Analyse Bivariée
2. Distribution marginale
3. Distribution conditionnelle
Pr. AIT BABRAM Mohamed
FSTG Marrakech Cas de deux caractères qualitatifs
Exemple 1 : On considère l’étude effectuée auprès des clients d’un magasin
pour voir leur comportement vis-à-vis des produits Haut Gamme X et le e-
commerce Y.
Distribution marginale de X
Analyse Bivariée
Distribution [X/Y=Vrai]
Distribution [Y/X=Vrai]
Pr. AIT BABRAM Mohamed
Distribution [Y/X=Faux]
Distribution [X/Y=Faux]
Distribution marginale de Y
FSTG Marrakech
V (Y ) = ∑n• j ( y j − y ) = ∑n• j ( y j ) − ( y )
1 m 2 1 m 2 2
n j =1 n j =1
Remarque : Les formules de la moyenne et la variance marginale du caractère
Y peuvent avoir plusieurs formes :
m
1 m
y = ∑ f• j y j y= ∑ p• j y j
Pr. AIT BABRAM Mohamed
j =1 100 j =1
V (Y ) = ∑ f • j ( y j − y ) = ∑ n• j ( y j ) − ( y )
m m
2 2 2
j =1 j =1
V (Y ) =
1 m
∑ •j jp ( y − y )2
=
1 m
∑ •j jp ( y )2
− ( y )2
100 j =1 100 j =1
FSTG Marrakech Moyenne et Variance conditionnelle de Y
Définition : Soit i =1,…..,k. On définit la moyenne conditionnelle de Y sachant
que X=xi par :
m(Y X = xi ) = yi = ∑nij y j
1 m
ni • j=1
Définition : Soit i =1,…..,k. On définit la variance conditionnelle de Y sachant
que X=xi par :
Analyse Bivariée
y = ∑ ni • m (Y X = xi ) = ∑ ni • yi
1 k 1 k
n i =1 n i =1
Définition : On appelle variance Intra-Classe la moyenne pondérée des
variances conditionnelles :
Analyse Bivariée
VIntra(Y ) = ∑ni• V (Y X = xi )
1 k
n i=1
Définition : On appelle variance Inter-Classe la variance pondérée des
moyennes conditionnelles :
2 2
1 k 1 k
VInter(Y ) = ∑ni • ( yi − y) = ∑ni • ( yi ) − y 2
Pr. AIT BABRAM Mohamed
n i=1 n i=1
Remarque : La variance de la variable Y se décompose sous la forme :
k k 2
V (Y ) = ( ) ni• ( yi − y)
1 1
∑
n i=1
ni• V Yi + ∑
n i=1
V (Y ) = VIntra (Y ) + VInter (Y )
FSTG Marrakech
Analyse de la variance
Principe de l’analyse : C’est une technique qui a été développée au début du
siècle par l’agronome Fischer. L’objectif est toujours de mesurer l’effet d’un
facteur qualitatif sur un caractère d’intérêt souvent quantitatif. Nous citons à
titre d’exemples les cas où :
1. On épand des niveaux d’engrais {faible, moyen, fort} (caractère X) sur des
parcelles de blé et on relève le rendement à l’hectare (caractère Y).
Analyse Bivariée
2. On nourrit des rats avec trois sources de protéines {bœuf, porc, soja}
(caractère X) et on relève la prise de poids au bout d’un mois (caractère
Y).
3. On soumet à un groupe de patients un principe actif (caractère X) et on
étudie l’évolution de leur maladie (caractère Y).
Un critère pour mesurer l’effet de ce facteur est de calculer la variance Intra-
Classe et de faire le rapport :
V Inter (Y )
Pr. AIT BABRAM Mohamed
e2 =
V (Y )
m(Y1)=2482,5 dhs
V(Y1)=2482,5 dhs
Pr. AIT BABRAM Mohamed
FSTG Marrakech
Cas où X et Y (quantitatifs)
1. Exemple
2. Caractéristiques marginales
Analyse Bivariée
3. Caractéristiques conditionnelles
4. Covariance
5. Relation entre caractéristiques marginales et
conditionnelles
6. Rapport de corrélation
Pr. AIT BABRAM Mohamed
7. Courbes de régression
8. Analyse de la variance
FSTG Marrakech
Exemple
Exemple 3 : Les caractères X et Y (Quantitatifs)
La distribution des ouvriers des usines d’un groupe financier selon l’âge et la
rémunération mensuelle est donnée par le tableau de contingence suivant :
Age (A)
Totaux
Analyse Bivariée
X≥20 0 0 0 1 14 6 7 5 33
Totaux 527 1 220 1 578 1 186 1 388 1 201 465 130 7 695
FSTG Marrakech Caractéristiques marginales
Dans ce qui suit, nous nous limiterons à l’exemple précédent pour le calcul
des différentes caractéristiques soit marginale ou conditionnelles.
Les distributions marginales selon la rémunération mensuelle R ou l’âge des
ouvriers A sont fournies par les tableaux suivants
Analyse Bivariée
Pr. AIT BABRAM Mohamed
1 m 1 k
a = ∑ n• j a j = 37 ,4 ans r = ∑ ni •ri = 1008,6 dh
n j =1 n i =1
n j=1 n i =1
Remarque : On remarque que les écart-types sont plus faibles pour les
jeunes ouvriers que pour ceux qui sont plus âgés : la population jeune est,
comme il est naturel, plus homogène du point de vue rémunération.
FSTG Marrakech Caractéristiques conditionnelles
Les distributions conditionnelles des ouvriers selon le caractère âge A
conditionné par le caractère rémunération mensuelle R sont constituées par
les lignes du tableau de contingence. Leurs caractéristiques numériques sont
résumées dans le tableau suivant :
Analyse Bivariée
Pr. AIT BABRAM Mohamed
FSTG Marrakech Covariance
Définition : Par analogie avec le cas univarié, on définit la covariance de deux
variance de caractères X et Y par :
Cov ( X , Y ) = ∑∑ nij ( xi − x )( y j − y )
1 k m
n i =1 j =1
Remarque : On remarque que si les deux caractères sont égaux (Y=X), alors
Analyse Bivariée
1 k m
Cov ( X , Y ) = ∑ ∑ nij xi y j − x y
n i =1 j =1
FSTG Marrakech Covariance
Remarque : Un changement de variables judicieux appliqué aux caractères X
et Y permet souvent une simplification supplémentaire des calculs. Pour cela,
si on considère x0, y0, α et β des constantes telles que :
X − x0 Y − y0
X′ = et Y ′ =
α β
Analyse Bivariée
Cov( X ′, Y ′) = αβ Cov( X , Y )
Pr. AIT BABRAM Mohamed
FSTG Marrakech Relation entre caractéristiques
marginales et conditionnelles
Remarque : La moyenne marginale est égale à la moyenne pondérée des
moyennes conditionnelles :
1 k 1 m
y = ∑ ni • yi x = ∑ n• j x j
n i =1 n j =1
Analyse Bivariée
Courbe de régression
de X en Y
Nuage de points
yj
yi Courbe de régression
Pr. AIT BABRAM Mohamed
de Y en X
xi xj
FSTG Marrakech Courbe de régression
Remarque : Dans le cas où les deux caractères X et Y sont indépendants, les
distributions conditionnelles de chacun des deux caractères sont identiques à
la distribution marginale correspondante. Il en résulte que, pour chacun des
deux caractères, les moyennes conditionnelles sont égales entre elles et
égales à la moyenne marginale :
Courbe de régression
de X en Y
Pr. AIT BABRAM Mohamed
y
Courbe de régression
de Y en X
x
FSTG Marrakech Courbe de régression
Remarque : Si l’indépendance de deux caractères entraîne l’existence de
droites de régression parallèles aux axes de coordonnées, la réciproque n’est
pas toujours vraie. Dans ce cas, on parlera d’absence réciproque de
corrélation, et non d’indépendance. Pour illustrer ce phénomène, nous
proposons la distribution suivante :
Analyse Bivariée
Courbe de régression
de X en Y
y
Pr. AIT BABRAM Mohamed
Courbe de régression
de Y en X
x
FSTG Marrakech Courbe de régression
Remarque : Dans le cas où il y a une liaison fonctionnelle réciproque entre
les modalité de Y et celles de X : à chaque valeur xi de X correspond une valeur
yj de Y, et réciproquement. La moyenne conditionnelle yi est égale à yi et la
moyenne conditionnelle xi est égale à xi. Pour illustrer ce phénomène, nous
proposons la distribution suivante :
Analyse Bivariée
Courbe de régression
de X en Y
Pr. AIT BABRAM Mohamed
Courbe de régression
de Y en X
FSTG Marrakech Courbe de régression
Remarque : A la différence de la propriété d’indépendance, la corrélation n’est
pas une propriété réciproque : Y peut être corrélé avec X sans que, pour
autant, X soit corrélé avec Y. Pour illustrer ce phénomène, nous proposons la
distribution suivante :
Courbe de régression
de Y en X
Analyse Bivariée
Courbe de régression
de X en Y
Pr. AIT BABRAM Mohamed
x
Conclusion : La courbe de régression permet de résumer de façon commode la
liaison existant entre deux caractères. Ce résumé a d’autant plus d’intérêt
lorsque cette courbe est représentative (le nuage de la distribution est concentré
autour de la courbe). Cette intensité de liaison est mesurée par le rapport de
corrélation.
FSTG Marrakech Rapport de corrélation
Remarque : D’après les formules précédentes, on note que la variance
marginale du caractère Y est égale à la somme de deux termes :
V (Y ) = VIntra(Y ) + VInter (Y )
Analyse Bivariée
1 k 2
VIntra (Y ) = ∑ ni • V (Yi ) 1 k
VInter(Y ) = ∑ni • ( yi − y )
n i =1 n i=1
La part de la variance La part de la variance
marginale qui mesure la marginale qui la dispersion
dispersion moyenne du des moyennes conditionnelles
caractère Y à l’intérieur des du caractère Y relatives à
sous populations. chaque sous population.
Pr. AIT BABRAM Mohamed
n• j (x j − x) n• j V (X j )
m
1 1m
∑
VInter( X ) n j=1
∑
n j=1
ηX2 /Y = = =1−
V( X ) V(X ) V( X )
Remarque : En cas d’indépendance de Y et X, toutes les moyennes
Pr. AIT BABRAM Mohamed
0 ≤ ηY / X ≤ 1
Pr. AIT BABRAM Mohamed
k 2 k 2
n i=1 n i=1
Analyse Bivariée