Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Cours 3

Télécharger au format ppt, pdf ou txt
Télécharger au format ppt, pdf ou txt
Vous êtes sur la page 1sur 26

Statistique descriptive

Pr. Dounia JOUALY


Université Mundiapolis

Licence Ingénierie et Gestion des Entreprises


S1 2020-2021
Chapitre IV – traitements avancés des séries
statistiques à un caractère

 Le présent chapitre va permettre de définir des indicateurs dont l’objet est de


résumer quantitativement les caractéristiques d’ensembles observés.
 Les populations seront étudiées selon un caractère quantitatif.
 Propriétés du statisticien Yule:
 Objectivité: deux personnes différentes doivent obtenir la même valeur
pour l’indicateur retenu

 Cet indicateur doit prendre en compte toutes les observations. En


d’autres termes, si on modifie la valeur d’une observation, l’indicateur
varie.
 L’indicateur doit avoir une signification concrète

 L’indicateur doit être simple à calculer et se prêter à une manipulation


algébrique.

- Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (2)

Il existe Quatre grands groupes d’indicateurs ( ou caractéristiques):

 Les caractéristiques de tendance centrale ou de position

 Les caractéristiques de dispersion

 Les caractéristiques de forme

 Les caractéristiques de concentration

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (3)
1- les caractéristiques de tendance centrale et de position
1-1 la médiane:
Cas des variables statistiques discrètes

 La médiane est la valeur de la variable statistique qui partage la


population en deux effectifs égaux.
 Pour sa détermination, il convient, en préalable, de classer les individus
de la population par valeurs croissantes (ou décroissantes) du caractère.
Déterminer si la série comprend un nombre pair ou impair d’unités
statistiques :

Soit n le nombre d’unités statistiques. Deux cas peuvent alors se présenter :


celui ou n est pair et celui ou n est impair.

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (4)

 Si n est impair (n=2k+1) :


Dans ce cas, la médiane est égale à la valeur de la série classée qui a (n+1)/2 pour
rang.
 Exemple: 9 salariés classés en fonction de leur salaire hebdomadaire:
320; 250; 415; 906; 130; 610; 540 ;720; 813;
 Pour déterminer le salaire médian, on classe ces salariés par ordre
croissant de salaire:
130; 250; 320; 415; 540; 610; 720; 813; 906

 On a n = 9 ( impair).
la médiane est le salaire dont le rang est 9+1/ 2 = 5.
 La médiane est 540.

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (5)

 Si n est pair (n=2k) :


Dans ce cas, la médiane est égale à

 Exemple: 8 salariés classés en fonction de leur salaire hebdomadaire:


320; 250; 415;130; 610; 540 ;720; 813;
 Pour déterminer le salaire médian, on classe ces salariés par ordre
croissant de salaire:
130; 250; 320; 415; 540; 610; 720; 813;

 On a n =8 (n= 2k).
8 / 2 = 4.

Me = 415 + 540 / 2 = 477,5

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (6)

Cas des variables statistiques continues


 On effectue une interpolation linéaire de la classe médiane

Xm = x i-1 + a i ( N/2 – N i-1)/ (Ni – Ni-1)


Avec :
xi-1: extrémité inférieure de la classe médiane;
ai : amplitude de la classe médiane
Ni-1: effectif cumulé de la classe située avant la classe médiane
Ni: effectif cumulé de la classe médiane
N/2 représente la valeur théorique de l’image de la médiane par l’intermédiaire
de l’effectif cumulé.
Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (7)

Exemple: 75 ouvriers que l’on classe en fonction du nombre d’heures travaillées


pendant un mois
Classe de Effectif Effectifs cumulés
On calcule N/2 = 75/2 valeurs Croissant
= 37,5
[ 50,70[ 6 6
On doit déterminer la classe médiane
[ 70,100[ 9 15
C’est la classe [ 130-150[
[ 100,130[ 15 30

( 37,5 – 30) [ 130,150[ 23 53


Me = 130 + 20
( 53 - 30) [ 150,180[ 17 70
Me = 136,52
[ 180,200[ 5 75

Total 75 -

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (9)

1-2 les quartiles, déciles et centiles:


La généralisation de la médiane porte le nom de quantile.

Parmi les quantiles les plus utilisés, on retrouve les quartiles,


les déciles et les centiles.

 Les quartiles sont les valeurs d’une série ou d’une distribution statistique
rangées par ordre croissant qui partagent l’effectif total en quatre parties
égales.
 3 quartiles existent notés: Q1, Q2, Q3 Q2 = Me
On cherche la médiane de la première moitié de la population qui
correspond au 1er quartile.

On cherche la médiane de la seconde moitié de la population qui


correspond au troisième quartile.

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (10)

Cas de variables discrètes


 Si la population est de taille n, on distingue 4 cas:
 Si n = 4p
 Q1 = moyenne entre la p et (p+1) valeur.
 Q2 = moyenne entre la (2p) valeur et la (2p+1) valeur.
 Q3 = moyenne entre la (3p) valeur et la (3p+1) valeur.
 Exemple : série de 12 notes: 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 13, 16
 Q1 = 7,5 ; Q2 = 9,5 et Q3 = 10,5

 Si n = 4p+1
Q1 = moyenne entre la p et (p+1) valeur.
Q2 = (2p+1) valeur.
Q3 = moyenne entre la (3p+1) valeur et la (3p+2) valeur.

Exemple : série de 13 notes 4, 5, 7, 8, 8, 9, 10, 10, 10, 11,12, 13, 16

Q1 = 7,5 Q2 = 10 et Q3 = 11,5
Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (11)

 Si n = 4p+2
 Q1 = (p+1)e valeur.
 Q2 = moyenne entre la (2p+1)e valeur et la (2p+2)e valeur.
 Q3 = (3p+2)e valeur.
 Exemple : série de 14 notes 4, 5, 7, 8, 8, 9, 9, 10, 10, 10, 11, 12,13, 16
 Q1 = 8 ; Q2 = 9,5 et Q3 = 11

 Si n = 4p+3
Q1 = (p+1)e valeur.
Q2 = (2p+2)e valeur.
Q3 = (3p+3)e valeur.
Exemple : série de 15 notes 4, 5, 7, 8, 8, 9, 9, 10, 10, 10, 11,11, 12,
13, 16
Q1 = 8, Q2 = 10, Q3 = 11
Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (12)

Cas des variables continues


 pour déterminer les quantiles d’ordre p%, il faut identifier la classe
dans laquelle les fréquences cumulées croissante atteignent p%.

 On calcule le quantile d’ordre p% selon la formule suivante:

Avec :

F(a) la fréquence cumulée croissante (en pourcentage) de la classe précédente.


F(b) la fréquence cumulée croissante (en pourcentage) de la classe correspondante.

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (13)

Exemple: 75 ouvriers que l’on classe en fonction du nombre d’heures travaillées


pendant un mois
Classe de Effectif Effectifs cumulés
Pour calculer Q1: valeurs Croissant

On calcule N/4 = 75/4 [ 50,70[ 6 6


= 18,75
[ 70,100[ 9 15
On doit déterminer la classe de Q1
C’est la classe [ 100-130[ [ 100,130[ 15 30

( 18,75 – 15) [ 130,150[ 23 53


Q1 = 100 + 30
( 30 - 15) [ 150,180[ 17 70
Q1 = 100,75
[ 180,200[ 5 75

Total 75 -

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (14)

Classe de Effectif Effectifs cumulés


Pour calculer Q3: valeurs Croissant
[ 50,70[ 6 6
On calcule 3N / 4 = 3 * 75 / 4
= 56,25
[ 70,100[ 9 15
On doit déterminer la classe de Q3
[ 100,130[ 15 30

[ 130,150[ 23 53
C’est la classe [ 150-180[
( 56,25 – 53) [ 150,180[ 17 70
Q3 = 150 + 30
[ 180,200[ 5 75
( 70 – 53)
Q3 = 155,73 Total 75 -

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (15)

Rappel: les quantiles les plus connus sont:


1- Les quartiles:
Me: Q2
50 % des valeurs lui sont inférieures
50 % des valeurs lui sont supérieures
Q1
25 % des valeurs lui sont inférieures
75 % des valeurs lui sont supérieures
Q3
75 % des valeurs lui sont inférieures
25 % des valeurs lui sont supérieures

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (16)

2- Les quintiles 3- Les déciles


Ils permettent de diviser la population Ils permettent de diviser la population
en 5 parties égales en 10 parties égales
Q1 est le quintile inférieur D1 est le Décile inférieur
20 % des valeurs lui sont inférieures 10 % des valeurs lui sont inférieures

Q4 est le quintile supérieur D9 est le décile supérieur


80 % des valeurs lui sont inférieures 90 % des valeurs lui sont inférieures
4- Les centiles
Ils permettent de diviser la population
en 100 parties égales
C1 est le centile inférieur
1% des valeurs lui sont inférieurs

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (17)

1-3 le mode
On appelle mode d’une variable statistique, la valeur la plus fréquente
d’une série ( la valeur associé à l’effectif le plus élevé).

 Variable statistique discrète


Exemple 1 : soit la série suivante: ( 5; 4; 6; 4; 3;1)
- La valeur la plus fréquente est: 4
- Le mode est égal à 4. Distribution unimodale
- L’effectif associé à ce mode est 2.
Exemple 2 : soit la série suivante: ( 5 ; 4 ; 6 ; 4 ; 3 ; 1 ; 3)
- Les valeurs les plus fréquentes sont : 3 et 4
Distribution bimodale
- Cette série a 2 modes: 3 et 4.
Une série peut avoir 3 ou 4 ou 5 etc. de modes. Distribution multimodale

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (18)

Exemple 3: distribution de ménages selon leur nombre d’enfants

Nb. d’enfants Effectifs

0 8 Le mode est 2.
L’effectif associé à ce mode est 12;
1 7

2 12

3 6

4 3

5 4

Total 40

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (19)

 Variable statistique continue


L’effectif le plus élevé permet d’identifier la classe modale.
- Cas des amplitudes égales - Cas des amplitudes inégales
La classe modale est celle associée à La classe modale est celle associée à
l’effectif le plus grand. l’effectif le plus grand corrigé par
l’amplitude.
Salaires Effectifs Salaires Effectifs Amplitudes Effectif
2000-3000 80 corrigé

3000-4000 170 2000-3000 80 1000 0,08

4000-5000 120 3000-6000 170 3000 0,056


6000-8000 120 2000 0,06
La classe modale est la classe 3000-4000.
La classe modale est la classe 2000-3000.

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (20)

Détermination du mode au sein de la classe modale

Avec :

-L Mo : borne inférieure de la classe modale

-d 1 : différence entre l’effectif de la classe modale et l’effectif de la classe précédente

-d 2 : différence entre l’effectif de la classe modale et l’effectif de la classe suivante

- l: amplitude (largeur ) de la classe modale : (L2-L1)

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (21)

1-4 la moyenne arithmétique:


A- la moyenne arithmétique simple
 Elle se calcule par la formule suivante:

 Exemple: soit la série suivante: { 10, 12, 16, 12 }


La moyenne arithmétique: x = 10 + 12 + 16 + 12
4

x = 12,5

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (22)

B- la moyenne arithmétique pondérée


 Elle se calcule par la formule suivante:
 Exemple: soit la distribution suivante:

Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (23)

Exemple 2:
classes ni Ci (centre des classes ni ci
[ 0-2[ 4 1 4
[ 2-4[ 10 3 30
[ 4-6[ 6 5 30

Pour déterminer la moyenne, nous devons


Appliquer la formule suivante:

- Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (24)

1-5 la moyenne géométrique

Elle permet de calculer le taux de variation moyen

 Elle se calcule par la formule suivante:

- Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (25)

Exemple:
Soit un placement effectué à la banque est de 100 dh.
Ce placement augmentera la 1ère année de 20%.
Le montant après la 1ère année est de: 100+ (100*20%) = (100 * 1,2) = 120

L’année suivante, une hausse de 45%


Le montant après la 2ème année est de : 120 + (120 * 45%)
=100 ( 1+ 0,2) (1+0,45) = 174
L’année suivante, une hausse de 10%
Le montant après la 3ème année est de : 174 + (174 * 10%)
=100 ( 1+ 0,2) (1+0,45) (1+ 0,1)
Quel est le taux de croissement annuel moyen de ces 3 années ?
100 x (1+T)(1+T)(1+T) = 100 x 1,2 x 1,45 x 1,1

(1+T)³ = 1,2 x 1,45 x 1,1


1+T= racine cubique de 1,12 * 1,45 *1,1

- Statistique descriptive
Chapitre IV – traitements avancés des séries
statistiques à un caractère (26)

1-6 la moyenne harmonique


Elle permet, entre autre, de calculer des moyennes de pourcentages ou des
moyennes de ratios. L'utilisation la plus fréquente concerne les données sous
forme de fractions Comme des :
- vitesses moyennes ;
- quantités par unité : exemple: le PIB par habitants

Elle se calcule avec la formule suivante:


Exemple :
Un véhicule doit faire un aller-retour de 10 km.
- à l'aller, il roule à 100 km/h.
-au retour, il roule à 50 km/h
-Quelle est la vitesse moyenne?

Statistique descriptive

Vous aimerez peut-être aussi