Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

CHAPITRE 2 Départ

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 73

CHAPITRE 2

PARAMÈTRES STATISTIQUES

Statistiques Descriptives 2019-2020 1


Paramètres Statistiques

Statistiques Descriptives 2019-2020 2


Paramètres Statistiques

Les paramètres statistiques ont pour but


de résumer, à partir de quelques nombres
clés, l'essentiel de l'information relative à
l'observation d'une variable.

Statistiques Descriptives 2019-2020 3


Mesures de tendance centrale

Mesures de position

Mesures de dispersion

Statistiques Descriptives 2019-2020 4


I- Paramètres de tendance centrale :

Statistiques Descriptives 2019-2020 5


I- Paramètres de tendance centrale :
1-1-le Mode
• Le mode est la valeur distincte correspondant à l’effectif le
plus élevé
• Exemple1: Cas d’un caractère qualitatif nominal

 Le mode est la modalité: Marié


6
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-1-le Mode
• Exemple2: Cas d’un caractère qualitatif Ordinal

Mention Effectifs Fréquences


ni fi
Passable 20 0,2
Assez Bien 30 0,3
Bien 15 0,15
Très Bien 20 0,2
Excellent 15 0,15
Total 100 1
 Le mode est la modalité: « La mention Assez Bien »
Statistiques Descriptives 2019-2020 7
I- Paramètres de tendance centrale :
1-1-le Mode
• Exemple3: Cas d’une variable quantitative discrète

Nombre d’enfant Effectifs (nᵢ) Fréquences (fi)


par famille (Xᵢ)
0 10 0,1
1 15 0,15
2 40 0,4
3 20 0,2
4 15 0,15
Total 100 1
 Le mode est la modalité: 2 enfants

Statistiques Descriptives 2019-2020 8


I- Paramètres de tendance centrale :
1-1-le Mode
Exemple 4 : Cas d’une variable quantitative continue
a- Les amplitudes sont égales
Classes de valeurs Effectifs (nᵢ) Ci
[0 ; 10[ 2 5
[10 ; 20[ 7 15
[20 ; 30[ 5 25
[30 ; 40[ 8 35
[40 ; 50[ 3 45
On peut définir une classe modale dont l’effectif est le
plus élevé  [30 ; 40)
NB : il serait possible de trouver plus d’un mode à l’intérieur d’une
distribution
Statistiques Descriptives 2019-2020 9
I- Paramètres de tendance centrale :
1-1-le Mode
Exemple 4 : Cas d’une variable quantitative continue
b- Les amplitudes sont inégales
Classes Effectifs (nᵢ) Ai Effectifs
Corrigés
[0 ; 10[ 2 10 2
[10 ; 20[ 6 10 6
[20 ; 40[ 8 20 4
[40 ; 60[ 1O 20 5
[60 ; 70[ 4 10 4
Total 30
La classe modale dont l’effectif corrigé le plus élevé est donc
la classe [10 ; 20[
Le mode doit être déterminer algébriquement.
Statistiques Descriptives 2019-2020 10
I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Descriptives 2019-2020 11


I- Paramètres de tendance centrale :
1-1-le Mode
Exemple

Classes Effectifs

0-5 3
5-10 10
10-50 20
50-100 1

Statistiques Descriptives 2019-2020 12


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Descriptives 2019-2020 13


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Descriptives 2019-2020 14


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Descriptives 2019-2020 15


I- Paramètres de tendance centrale :
1-1-le Mode

Statistiques Descriptives 2019-2020 16


I- Paramètres de tendance centrale :
1-2-la médiane
• La médiane d'une série statistique est le
nombre qui sépare la série (ordonnée en
valeurs croissantes) en deux groupes de
même effectif.
• Ce paramètre est utile pour donner la
répartition du caractère étudié, car 50%
environ de la population étudiée a une
modalité inférieure à la médiane et 50% a une
modalité supérieure à la médiane.

Statistiques Descriptives 2019-2020 17


I- Paramètres de tendance centrale :
1-2-la médiane

18
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)

19
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)
- Si l'effectif total n est un nombre impair, la médiane est
toujours parfaitement déterminé : elle est donc le terme
de rang (n+1)/2
Exemple : soit la série : { 0, 6, 1,3,2,5,4}
la série ordonnée est: { 0,1,2,3,4,5,6}

n=7 , implique ((n+1)/2)= 4 , alors la médiane est :


Me=3
20
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)
Si l'effectif total n est un nombre pair, on ne peut définir qu’un
intervalle médian à l’intérieur duquel la médiane n’est pas
déterminée .
L'intervalle médian est formé par les termes de rang n/ 2 et le
rang (n/2)+1) :
Exemple : soit la série : {0, 6, 1,3,2,5,4,7}
la série ordonnée est: {0,1,2,3,4,5,6,7}
implique le rang ((n/2 )) = 4 et le rang ( (n/2) +1) = 5 , alors
l’intervalle médian est :*3 , 4]
La Médiane n’est que : (3+4)/2 = 3,5
21
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
B- Cas d’une variable discrète (les données ne sont pas
individualisées)
Lorsque les données ne sont pas individualisées , on a
donc un tableau {xi,ni}, la médiane se calcule par les
fréquences cumulées croissantes ou par les effectifs
cumulés croissants.
- la médiane est la modalité xi qui correspond à la
fréquence cumulée croissante 0,5.
ou
- la médiane est la modalité xi qui correspond à
l’effectif cumulé croissant (n/2).
22
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
B- Cas d’une variable discrète (les données ne sont pas
individualisées)
Nombre Effectifs Effectifs Fréquenc FCC
d’enfants (nᵢ) Cumulés
Par salarié croissants
es
0 6 6 0,2 0,2
1 5 11 0,17 0,37
2 4 15 0,13 0,50
3 8 23 0,27 0,77
4 4 27 0,13 0,9
5 3 30 0,1 1
La modalité qui correspond à la fréquence cumulée
croissante 0,5 ou à l’effectif cumulé croissant (n/2) est la
modalité «2» Alors la Mé = 2 23
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
B- Cas d’une variable discrète (les données ne sont pas individualisées)

Nombre Effectifs (nᵢ) Effectifs Cumulés Fréquence FCC (Fi)


d’enfants croissants
par salarié
(fi)
0 25 25 0,25 0,25
1 20 45 0,20 0, 45
2 20 65 0,20 0,65
3 18 83 0,18 0,83
4 12 95 0,12 0,95
5 5 100 0,05 1
Total 100
la plus petite fréquence cumulée qui dépasse strictement 0,5 est
FCC=0,65
Alors la médiane n’est pas exactement la modalité 2 enfants
24
Statistiques Descriptives 2019-2020
Statistiques Descriptives 2019-2020 25
I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue

26
Statistiques Descriptives 2019-2020
Courbe des ECD
FCC(FCD) /ECC(ECD)
1 50
0,9 45
0,8 40
0,7 35
O,6 30 Courbe des ECC
0,5 25
0,4 20
0,3 15
0,2 10
0,1 5
150 155 160 165 170 175

Statistiques Descriptives 2019-2020 27


I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue

28
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue

29
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue
Exemple

Classe de Effectifs Fréquen


valeurs (nᵢ) ces (fi)
[0 ; 10) 2 0,08
[10 ; 20) 7 0,28
[20 ; 30) 8 0,32
[30 ; 40) 5 0,2
[40 ; 50) 3 0,12
25 1
30
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue
Exemple
Classe de Effectifs ECC Fréquen Fréquences
(nᵢ) Cumulées
valeurs (Ni) ces (fi) croissantes
(FCC)
[0 ; 10) 2 2 0,08 0,08
[10 ; 20) 7 9 0,28 0,36
[20 ; 30) 8 17 0,32 0,68
[30 ; 40) 5 22 0,2 0,88
[40 ; 50) 3 25 0,12 1
25 1 31
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane

34
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-3- La moyenne
• La moyenne est l'indicateur le plus simple pour
résumer l'information fournie par un ensemble
de données statistiques
• La moyenne ne peut être définie que sur une
variable quantitative.
1er Cas : les données sont individualisées
– La moyenne est la somme des valeurs observées
divisée par leur nombre:

Statistiques Descriptives 2019-2020 35


I- Paramètres de tendance centrale :
1-3- La moyenne
2ème Cas les données ne sont pas individualisées
- La moyenne est calculée à partir des valeurs distinctes et des
effectifs comme suit:

Ce qui implique :
Avec n : l’effectif total
ni: l’effectif de la modalité xj
fi: la fréquence de la modalité xi

Statistiques Descriptives 2019-2020 36


I- Paramètres de tendance centrale :
1-3- La moyenne
Exemple 1: Cas d’une variable discrète
Xᵢ Effectifs (nᵢ)

0 25
1 35
2 11
3 2
4 1
5 1
Total 75

Statistiques Descriptives 2019-2020 37


I- Paramètres de tendance centrale :
1-3- La moyenne
Exemple 1: Cas d’une variable discrète
Xᵢ Effectifs (nᵢ) nᵢ x ᵢ fi fi xi

0 25 0 0,33 0

1 35 35 0,47 0,47

2 11 22 0,15 0,3

3 2 6 0,03 0,09

4 1 4 0,01 0,04

5 1 5 0,01 0,05

Total 1

Statistiques Descriptives 2019-2020 38


I- Paramètres de tendance centrale :
1-3- La moyenne
Exemple 2: Cas d’une variable Continue
Classes de Effectifs (nᵢ)
valeurs
[0 ;10[ 2
[10 ;20[ 7
[20 ;30[ 5
[30 ;40[ 8
[40 ;50[ 3
Total 25

Statistiques Descriptives 2019-2020


39
I- Paramètres de tendance centrale :
1-3- La moyenne
Exemple 2: Cas d’une variable Continue
Classes de Effectifs (nᵢ) Cᵢ nᵢ Cᵢ fi Fi Ci
valeurs
[0 ;10[ 2 5 10 0,08 0,4
[10 ;20[ 7 15 105 0,28 4,2
[20 ;30[ 5 25 125 0,2 5
[30 ;40[ 8 35 280 0,32 11,2
[40 ;50[ 3 45 135 0,12 5,4
Total
1

Statistiques Descriptives 2019-2020


40
La moyenne géométrique
• C’est la racine nième du produit des n valeurs positives du
caractère x.
• La moyenne géométrique simple est donnée par:

• Le calcul peut également se faire par les logarithmes

• La moyenne géométrique pondérée est donnée par:

• avec

• ou par car :

• Par les logarithmes

Statistiques Descriptives 2019-2020 41


Exemple
• Le chiffre d’affaires augmente de 5% les deux
premières années , de 9% les quatre années
suivantes et de 12% la dernière année
• Calculer l’augmentation moyenne annuelle du CA

• L’augmentation moyenne annuelle est :

• On dit que le CA augmente en moyenne de 8,3% par


an.
Statistiques Descriptives 2019-2020 42
La moyenne harmonique
• C’est la valeur de la variable pour laquelle son
inverse est la moyenne arithmétique de
l’inverse des valeurs de la variable.
• On emploie la moyenne harmonique dans le
calcul des moyennes de pourcentages , de
rapports, de durées moyennes et de vitesses
moyennes.
• On l’exprime le plus souvent par son inverse
(1/H)

Statistiques Descriptives 2019-2020


43
La moyenne harmonique
– La moyenne harmonique simple est donnée
par:

– La moyenne harmonique pondérée est


donnée par

Statistiques Descriptives 2019-2020


44
Exemple
• Sur un trajet d’un km on fait 60km/h à l’aller et
30km/h au retour . Quelle est la vitesse
moyenne?
On cherche la moyenne des rapports «une heures
pour x km».
Alors, on calcule la moyenne harmonique :

Donc H= 40 km/h

Statistiques Descriptives 2019-2020 45


La moyenne quadratique
• C’est la racine carrée de la moyenne
arithmétique des carrées des observations de
la série .
• On l’exprime souvent par son carré(Q²).
– Moyenne quadratique simple:

Statistiques Descriptives 2019-2020 46


La moyenne quadratique
– Moyenne quadratique pondérée :

Statistiques Descriptives 2019-2020 47


Moyenne d’ordre « r » ou Moyenne généralisée

• On remarque que la construction des trois


moyennes précédentes, relevait de la même
logique. Alors la moyenne pondérée d’ordre « r
» est donnée par:

Statistiques Descriptives 2019-2020 48


Moyenne d’ordre « r » ou Moyenne généralisée

Alors selon la valeur de r on retrouve les


différentes formules des moyennes:

Statistiques Descriptives 2019-2020 49


II- Paramètres de position :
2-1- Les quantiles

• on cherche une valeur de la variable


partageant la série en
– quatre sous-ensembles égaux  les quartiles
– dix sous-ensembles égaux  les déciles
– cent sous-ensembles égaux  les centiles
– ….

Statistiques Descriptives 2019-2020 50


a) Les quartiles
• Ce sont les valeurs du caractère (xi) qui
partagent la série en quatre sous-ensembles
égaux .
• Ils sont donc au nombre de trois : Q1,Q2,Q3
• Les intervalles qu’ils définissent contient chacun
25% des observations ,soit un quart de
l’effectif(n/4).
• L’intervalle interquartile [Q1,Q3] contient 50%
des observations
0 n
n/4 n/4 n/4 n/4

0,25 0,25 0,25 0,25


Q1 Q2 Q3
0 1
51
Intervalle interquartile:
Statistiques Descriptives 50%
2019-2020
a) Les quartiles

On note que :

- Q1 laisse 25% des observations « AVANT » et 75% «


APRES »

- Q2 laisse 50% des observations « AVANT » et 50 % «


APRES » c’es t la médiane

- Q3 laisse 75 % des observations « AVANT » et 25% «


APRES »

52
Statistiques Descriptives 2019-2020
b) les déciles
• Ce sont les valeurs du caractère (xi) qui partagent la série en dix sous-ensembles
égaux .
• Ils sont donc au nombre de neuf : D1,D2,D3,D4,D5,D6,D7,D8,D9
• Les intervalles qu’ils définissent contient chacun 10% des observations ,soit un quart
de l’effectif(n/10).
• L’intervalle
0 interdécile [D1,D9] contient 80% des observations n

n/10 n/10 n/10 n/10 n/10 n/10 n/10 n/10 n/10 n/10
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
0 D1 D2 D3 D4 D5 D6 D7 D8 D9 1
Intervalle interdécile : 80 %
On note que :
D1 laisse 10% des observations « AVANT » et 90% « APRES »
D2 laisse 20% des observations « AVANT » et 80 % « APRES »
D3 laisse 30 % des observations « AVANT » et 70% « APRES »
D4 laisse 40 % des observations « AVANT » et 60% « APRES »
D5 laisse 50 % des observations « AVANT » et 50% « APRES » c’est la médiane
D6 …. D9 : 90% des observations « AVANT » et 10% « APRES »;
53
Statistiques Descriptives 2019-2020
c) les centiles
• Ce sont les valeurs du caractère (xi) qui partagent la série en cent sous-ensembles
égaux en termes d’effectif.
• Ils sont donc au nombre de 99 : C1,C2,C3,…. C99
• Les intervalles qu’ils définissent contient chacun 1% des observations ,soit un quart
de l’effectif(n/100).
•0 L’intervalle interdécile [C1,C99] contient 99% des observations n

n/100 n/100 n/100 ............................ ……………………………………………………….. n/100


1% 1% 1% ……………………… ………………………………………………….. 1%
0 C1 C2 C3 C50 C99 1
Intervalle intercentile : 98 %

On note que :
C1 laisse 1% des observations « AVANT » et 99% « APRES »
C2 laisse 2% des observations « AVANT » et 98 % « APRES »
C3 laisse 3 % des observations « AVANT » et 97% « APRES »
C4……….C49 : 49 % des observations « AVANT » et 51% « APRES »
C50 laisse 50 % des observations « AVANT » et 50% « APRES » c’est la médiane
C51 …. C99 : 99 % des observations « AVANT » et 1 % « APRES »
54
Statistiques Descriptives 2019-2020
Application
Salaire Effectifs fi FCC ECC FCD ECD
[ 1500,2500 [ 10 0,05 0,05 10 1 200
[ 2500,3500 [ 20 0,1 0,15 30 0,95 190
[ 3500,4500 [ 50 0,25 0,40 80 0,85 170
[ 4500,5500 [ 60 0,3 0,7 140 0,60 120
[ 5500,6500 [ 40 0,2 0,9 180 0,3 60
[ 6500,7500 [ 20 0,1 1 200 0,1 20
Total 200 1 0 0
-Calculer les quartiles , l’intervalle interquartile et Interpréter les
résultats
-Calculer les déciles , l’intervalle interdécile et Interpréter les résultats
-Calculer les centiles C1,C50 ,C99 , l’intervalle intercentile et Interpréter
les résultats Statistiques Descriptives 2019-2020
55
I) Les quartiles
1) Q1: la modalité qui correspond à la plus petite fréquence Cumulée
croissante qui dépasse strictement 0,25 est la classe [ 3500,4500 [ ,
alors par interpolation linéaire (Q1 – 3500) / (4500 -3500) = (0,25-
0,15)/(0,40 -0,15)  Q1= 3500 + 1000* 0,6 = 3900
 On dit que 25% des salariés perçoivent un salaire inférieur ou
égal à 3900dh ou 75% des salariés perçoivent un salaire supérieur ou
égal à 4100dh .
2) Q3: : la modalité qui correspond à la plus petite fréquence
Cumulée croissante qui dépasse strictement 0,75 est la classe [
5500,6500 [ , alors par interpolation linéaire (Q3 – 5500) / (6500 -
5500) = (0,75-0,7)/(0,9 -0,7)  Q3= 5500 + 1000* 0,25 = 5750
 On dit que 75% de la pop étudiée ayant un salaire inférieur à
5750 dh ou 25% de la pop étudiée ayant un salaire supérieur à 5750
dh .
4) L’intervalle interquartile [ Q1,Q3] est donc [ 3900, 5750]
On dit que 50% de la pop étudiée perçoivent un salaire entre3900 dh
56
et 5750 dh Statistiques Descriptives 2019-2020
Statistiques Descriptives 2019-2020 57
III- Paramètres de dispersion:

Deux distributions peuvent, tout en ayant des


caractéristiques de tendance centrale voisines,
être très différentes.

Il est donc nécessaire de mesurer la dispersion


des valeurs autour des tendances centrales.

Statistiques Descriptives 2019-2020 58


III- Paramètres de dispersion:

Statistiques Descriptives 2019-2020 59


III- Paramètres de dispersion:

Statistiques Descriptives 2019-2020 60


III- Paramètres de dispersion:
2-1- L’´etendue
• L'étendue (ou amplitude) d'une série
statistique est la différence entre la valeur
maximum et la valeur minimum de la série.
• E = Maximum (X) - Minimum (X)
• Facile à déterminer, l'étendue ne dépend que
des 2 observations extrêmes qui sont parfois
le fait de situations exceptionnelles.
• Il est donc difficile de considérer l'étendue
comme une mesure stable de la dispersion.

Statistiques Descriptives 2019-2020 61


III- Paramètres de dispersion:
2-1- L’´etendue
L’´etendue est la différence entre la plus grande et la
plus petite valeur observée.
Classe des Effectifs (nᵢ) Effectifs
Xᵢ Effectifs Effectifs Cumulés
(nᵢ) Cumulés valeurs
croissants
croissants
[15 ;20 ) 8 8
19 12 12
18 25 37 [20 ;25 ) 18 26
20 32 69 [25 ;30 ) 23 49
22 27 96 [30 ;35 ) 16 65
21 8 104 [35 ;40 ) 10 75
L’étendu est 22 – 18 = 4 L’étendu est 40 – 15 = 25

Statistiques Descriptives 2019-2020 62


III- Paramètres de dispersion:
2-2- Les écarts interquantiles
𝐼𝑄𝑛 = 𝑄𝑛𝐷𝑒𝑟𝑛𝑖𝑒𝑟 − 𝑄𝑛1

• L‘écart interquartile relatif est donnée par le


Rapport :

𝐼𝑄𝑛
𝑀𝑒

Statistiques Descriptives 2019-2020 63


III- Paramètres de dispersion
2-3- La variance σ²
• La variance est la somme des carrés des écarts à la moyenne
divisée par le nombre d’observations

Statistiques Descriptives 2019-2020


64
III- Paramètres de dispersion
2-3- La variance σ²

Statistiques Descriptives 2019-2020


65
III- Paramètres de dispersion
2-3- La variance σ²
Xᵢ(u) Effectifs Nᵢ Xᵢ Eᵢ=(Xᵢ -𝒙) Eᵢ² Nᵢ Eᵢ² Xᵢ² NᵢXᵢ²
(nᵢ)
0 25
1 35
2 11
3 2
4 1
5 1
75

Statistiques Descriptives 2019-2020 66


III- Paramètres de dispersion
2-3- La variance σ²
Xᵢ(u) Effectifs (nᵢ) Nᵢ Xᵢ Eᵢ=(Xᵢ -𝒙) Eᵢ² Nᵢ Eᵢ² Xᵢ² NᵢXᵢ²
0 25 0 -0.96 0.9216 23.04 0 0

1 35 35 0.04 0 .0016 0.056 1 35

2 11 22 1.04 1.0816 11.8976 4 44

3 2 6 2.04 4.1616 8.3232 9 18

4 1 4 3.04 9.2416 9.2416 16 16

5 1 5 4.04 16.3216 16.3216 25 25


La moyenne 𝒙 = 72/75 = 0.96 68.88 138
75 72

ou

Statistiques Descriptives 2019-2020 67


III- Paramètres de dispersion
2-4- Écart-type (σ)
• Écart-type (σ ) = Racine carrée de la variance
• L'écart-type est la mesure de dispersion la plus
couramment utilisée en statistique lorsqu'on
emploie la moyenne pour calculer une
tendance centrale.

Statistiques Descriptives 2019-2020 68


III-Paramètres de dispersion
2-5- Coefficient de variation
• le coefficient de variation de X est un indice noté et
défini comme suit

• Le coefficient de variation est un indicateur du degré


d’homogénéité des valeurs de la distribution ;
• Le coefficient de variation est indépendant des unités
choisies, il est utile pour comparer des distributions qui
ont des unités différentes.

Statistiques Descriptives 2019-2020


69
III-Paramètres de dispersion

La variance, l'écart-type et le coefficient de


variation sont les paramètres de dispersion les
plus utilisés.

En particulier, le coefficient de variation permet


de comparer la variabilité relative de plusieurs
distributions qui diffèrent fortement par leur
ordre de grandeur et éventuellement même
par leur unité de mesure
Statistiques Descriptives 2019-2020
70
Comparons le salaire moyen dans 2
entreprises

Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000

Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000

La quelle des deux entreprise a le salaire


moyen le plus élevé ?

Statistiques Descriptives 2019-2020 71


Comparons le salaire moyen dans 2
entreprises

Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000
Dans l'entreprise A le salaire moyen est de : ….

Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000
Dans l'entreprise B le salaire moyen est de : ….
Statistiques Descriptives 2019-2020 72
• On constate donc que le salaire moyen
de B est égal à celui de A. Pourtant le
salaire moyen des hommes est
supérieur en B à celui des hommes en
A. Il en est de même pour les femmes.
• D'où vient ce résultat paradoxal ?

Statistiques Descriptives 2019-2020 73


• Il s'agit d'un effet de structure : cela vient
du fait que les femmes (au salaire plus
bas) sont plus nombreuses en B qu'en A.
• Cela montre aussi qu'une moyenne ne
résume pas bien une population
hétérogène, comprenant des sous-
populations différentes vis à vis du
caractère étudié (ici le salaire).

Statistiques Descriptives 2019-2020 74


Synthèse
En plus des tableaux et graphiques, on
résume l'observation d'une variable
quantitative par un petit nombre de
paramètres.

Statistiques Descriptives 2019-2020 75

Vous aimerez peut-être aussi