CHAPITRE 2 Départ
CHAPITRE 2 Départ
CHAPITRE 2 Départ
PARAMÈTRES STATISTIQUES
Mesures de position
Mesures de dispersion
Classes Effectifs
0-5 3
5-10 10
10-50 20
50-100 1
18
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)
19
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
A- Cas d’une variable discrète (les données sont
individualisées)
- Si l'effectif total n est un nombre impair, la médiane est
toujours parfaitement déterminé : elle est donc le terme
de rang (n+1)/2
Exemple : soit la série : { 0, 6, 1,3,2,5,4}
la série ordonnée est: { 0,1,2,3,4,5,6}
26
Statistiques Descriptives 2019-2020
Courbe des ECD
FCC(FCD) /ECC(ECD)
1 50
0,9 45
0,8 40
0,7 35
O,6 30 Courbe des ECC
0,5 25
0,4 20
0,3 15
0,2 10
0,1 5
150 155 160 165 170 175
28
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue
29
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-2-la médiane
C- Cas d’une variable continue
Exemple
34
Statistiques Descriptives 2019-2020
I- Paramètres de tendance centrale :
1-3- La moyenne
• La moyenne est l'indicateur le plus simple pour
résumer l'information fournie par un ensemble
de données statistiques
• La moyenne ne peut être définie que sur une
variable quantitative.
1er Cas : les données sont individualisées
– La moyenne est la somme des valeurs observées
divisée par leur nombre:
Ce qui implique :
Avec n : l’effectif total
ni: l’effectif de la modalité xj
fi: la fréquence de la modalité xi
0 25
1 35
2 11
3 2
4 1
5 1
Total 75
0 25 0 0,33 0
1 35 35 0,47 0,47
2 11 22 0,15 0,3
3 2 6 0,03 0,09
4 1 4 0,01 0,04
5 1 5 0,01 0,05
Total 1
• avec
• ou par car :
Donc H= 40 km/h
On note que :
52
Statistiques Descriptives 2019-2020
b) les déciles
• Ce sont les valeurs du caractère (xi) qui partagent la série en dix sous-ensembles
égaux .
• Ils sont donc au nombre de neuf : D1,D2,D3,D4,D5,D6,D7,D8,D9
• Les intervalles qu’ils définissent contient chacun 10% des observations ,soit un quart
de l’effectif(n/10).
• L’intervalle
0 interdécile [D1,D9] contient 80% des observations n
n/10 n/10 n/10 n/10 n/10 n/10 n/10 n/10 n/10 n/10
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
0 D1 D2 D3 D4 D5 D6 D7 D8 D9 1
Intervalle interdécile : 80 %
On note que :
D1 laisse 10% des observations « AVANT » et 90% « APRES »
D2 laisse 20% des observations « AVANT » et 80 % « APRES »
D3 laisse 30 % des observations « AVANT » et 70% « APRES »
D4 laisse 40 % des observations « AVANT » et 60% « APRES »
D5 laisse 50 % des observations « AVANT » et 50% « APRES » c’est la médiane
D6 …. D9 : 90% des observations « AVANT » et 10% « APRES »;
53
Statistiques Descriptives 2019-2020
c) les centiles
• Ce sont les valeurs du caractère (xi) qui partagent la série en cent sous-ensembles
égaux en termes d’effectif.
• Ils sont donc au nombre de 99 : C1,C2,C3,…. C99
• Les intervalles qu’ils définissent contient chacun 1% des observations ,soit un quart
de l’effectif(n/100).
•0 L’intervalle interdécile [C1,C99] contient 99% des observations n
On note que :
C1 laisse 1% des observations « AVANT » et 99% « APRES »
C2 laisse 2% des observations « AVANT » et 98 % « APRES »
C3 laisse 3 % des observations « AVANT » et 97% « APRES »
C4……….C49 : 49 % des observations « AVANT » et 51% « APRES »
C50 laisse 50 % des observations « AVANT » et 50% « APRES » c’est la médiane
C51 …. C99 : 99 % des observations « AVANT » et 1 % « APRES »
54
Statistiques Descriptives 2019-2020
Application
Salaire Effectifs fi FCC ECC FCD ECD
[ 1500,2500 [ 10 0,05 0,05 10 1 200
[ 2500,3500 [ 20 0,1 0,15 30 0,95 190
[ 3500,4500 [ 50 0,25 0,40 80 0,85 170
[ 4500,5500 [ 60 0,3 0,7 140 0,60 120
[ 5500,6500 [ 40 0,2 0,9 180 0,3 60
[ 6500,7500 [ 20 0,1 1 200 0,1 20
Total 200 1 0 0
-Calculer les quartiles , l’intervalle interquartile et Interpréter les
résultats
-Calculer les déciles , l’intervalle interdécile et Interpréter les résultats
-Calculer les centiles C1,C50 ,C99 , l’intervalle intercentile et Interpréter
les résultats Statistiques Descriptives 2019-2020
55
I) Les quartiles
1) Q1: la modalité qui correspond à la plus petite fréquence Cumulée
croissante qui dépasse strictement 0,25 est la classe [ 3500,4500 [ ,
alors par interpolation linéaire (Q1 – 3500) / (4500 -3500) = (0,25-
0,15)/(0,40 -0,15) Q1= 3500 + 1000* 0,6 = 3900
On dit que 25% des salariés perçoivent un salaire inférieur ou
égal à 3900dh ou 75% des salariés perçoivent un salaire supérieur ou
égal à 4100dh .
2) Q3: : la modalité qui correspond à la plus petite fréquence
Cumulée croissante qui dépasse strictement 0,75 est la classe [
5500,6500 [ , alors par interpolation linéaire (Q3 – 5500) / (6500 -
5500) = (0,75-0,7)/(0,9 -0,7) Q3= 5500 + 1000* 0,25 = 5750
On dit que 75% de la pop étudiée ayant un salaire inférieur à
5750 dh ou 25% de la pop étudiée ayant un salaire supérieur à 5750
dh .
4) L’intervalle interquartile [ Q1,Q3] est donc [ 3900, 5750]
On dit que 50% de la pop étudiée perçoivent un salaire entre3900 dh
56
et 5750 dh Statistiques Descriptives 2019-2020
Statistiques Descriptives 2019-2020 57
III- Paramètres de dispersion:
𝐼𝑄𝑛
𝑀𝑒
ou
Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000
Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000
Entreprise A :
1/ 3 de femmes , salaire moyen 8000Dh
2/3 hommes, salaire moyen 11000
Dans l'entreprise A le salaire moyen est de : ….
Entreprise B :
2/ 3 de femmes , salaire moyen 9000Dh
1/3 hommes, salaire moyen 12000
Dans l'entreprise B le salaire moyen est de : ….
Statistiques Descriptives 2019-2020 72
• On constate donc que le salaire moyen
de B est égal à celui de A. Pourtant le
salaire moyen des hommes est
supérieur en B à celui des hommes en
A. Il en est de même pour les femmes.
• D'où vient ce résultat paradoxal ?