PDF Statistiques
PDF Statistiques
PDF Statistiques
Christophe ROSSIGNOL
2 Moyenne cart-type 6
2.1 Quelques rappels sur la moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Une mesure de dispersion : lcart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 Effet de structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1
Table des figures
1 Diagramme en Bote n1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Diagramme en Bote n2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Diagramme en Bote Moustaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4 Diagrammes en Bote sur une TI 89 Titanium . . . . . . . . . . . . . . . . . . . . . . . . . . 5
5 Relev de temprature (exemple de nuage de points) . . . . . . . . . . . . . . . . . . . . . . . 8
6 Histogramme classes de mme amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
7 Histogramme Cas gnral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
8 Arbre Frquences par rapport aux lignes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
9 Arbre Frquences par rapport aux lignes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2
En prliminaire au cours :
Test A page 104 [Dclic] : Caractres qualitatifs, quantitatifs discrets et quantitatifs continus
Test D page 104 [Dclic] : Rappels sur la moyenne et la mdiane
1.1 Mdiane
Dfinition : On considre une srie statistique dont les valeurs du caractre tudi ont t rangs dans
lordre croissant :
a1 a2 a3 an
On appelle mdiane la valeur centrale de cette srie, cest--dire celle qui la spare en deux parties
de mme effectif.
On la note : Me.
Exemple 1 :
On considre la srie statistique suivante :
valeur du caractre 50 45 30 60 61
effectif 2 3 2 2 2
On range les valeurs par ordre croissant, chacune figurant en nombre de fois gal son effectif :
30 30 45 45 45 |{z}
50 50 60 60 61 6
| {z } | {z }
Me
srie infrieure srie suprieure
2 2 2 6 6 6 |{z} 7 8 8 8 9 9
| {z } | {z }
Me
srie infrieure srie suprieure
On pourrait choisir comme mdiane tout nombre de lintervalle [6 ; 7]. On choisit en gnral le
milieu de cet intervalle, soit ici : Me = 6, 5.
Exercices : 14, 15 page 1221 16, 18 page 1222 [Dclic]
30 30 45 45 45 50 50 60 60 61 61
Q1 Me Q3
3
Exemple 2 :
On reprend lexemple 2 du 1.1 :
2 2 2 6 6 6 7 8 8 8 9 9
Q1 Me Q3
} Q1 | {z
amin | {z } Me | {z
} Q3 | {z
} amax
25 %de leffectif 25 %de leffectif 25 %de leffectif 25 %de leffectif
| {z }
50 %de leffectif
4
Fig. 1 Diagramme en Bote n1
Exemple 2 :
On reprend lexemple 2 du 1.1 .
Le diagramme en bote est reprsent sur la figure 2.
Remarques :
1. On peut aussi reprsenter ces diagrammes verticalement.
2. On peut aussi faire figurer les dciles (D1 et D9 ) sur ce diagramme (voir figure 3). On parle
alors de diagramme en bote moustaches.
3. Il est possible dobtenir des diagrammes en bote sur les calculatrices graphiques (voir figure
4, capture dcran dune T.I. 89 Titanium).
4. Reprsenter sur un mme graphique plusieurs diagrammes en bote peut permettre de comparer
plusieurs sries statistiques (voir figure 4).
3 Vrai ou faux.
4 Dtermination de quartiles utilisation de la calculatrice.
5
Exercices : 22 page 123 29, 30, 31 page 1245 35, 37 page 1256 [Dclic]
2 Moyenne cart-type
Exemple 1 :
On reprend lexemple 1 du 1.1 :
2 50 + 3 45 + 2 30 + 2 60 + 2 61
x= ' 48, 8
11
Exemple 2 :
On reprend lexemple 2 du 1.1 :
32+29+17+38+36
x= ' 6, 1
12
Remarques :
1. Pour une srie statistique simple (non regroupe suivant lesPeffectifs) x1 , x2 ,. . .,xn la formule
n
de la moyenne est plus simplement : x = x1 +x2 +...+x
n
n
= n1 i=1 xi .
2. Pour une srie dont les valeurs sont regroupes en classes, on utilise le centre de chaque classe
comme valeur de xi dans le calcul de la moyenne.
6
Exemple 2 :
On reprend lexemple 2 du 1.1 :
2 2 2 2 2
3 (2 6, 1) + 2 (9 6, 1) + 1 (7 6, 1) + 3 (8 6, 1) + 3 (6 6, 1)
V = ' 6, 6
12
Donc, lcart-type est : = V ' 2, 6.
Remarques :
1. Pour une srie statistique simple (non regroupe suivant les effectifs) x1 , x2 ,. . .,xn la formule
2 2
+...+(xn x)2
de la variance est plus simplement : V = (x1 x) +(x2 x)
Pn 2
n = n1 i=1 (xi x) .
2. Pour une srie dont les valeurs sont regroupes en classes, on utilisele centre de chaque classe
comme valeur de xi dans le calcul de la variance.
Exercices : 41, 42 page 1267 45 page 1278 46 page 1279 49 page 12710 et 75 page 13311 [Dclic]
Modules : 1 page 7212 et 2 page 7413 [Modulo]
Exercice rsolu :
Dans deux entreprises A et B, les salaris sont classs en deux catgories : employs et cadres. Le tableau
suivant donne la rpartition des salaris des deux entreprise suivant leur catgorie professionnelle et de
leur salaire annuel S en milliers deuros. (voir tableau 1)
Entreprise A Entreprise B
Salaire 10 S < 20 20 S < 30 30 S < 40 10 S < 20 20 S < 30 30 S < 40
Employs 170 100 0 280 140 0
Cadres 0 10 20 0 40 40
Total 170 110 20 280 180 40
1.
(a) Calculer les moyennes des salaires xA et xB respectivement dans les entreprises A et B.
(b) Calculer les moyennes des salaires des employs x0A et x0B respectivement dans les entreprises
A et B.
(c) Calculer les moyennes des salaires des cadres x00A et x00B respectivement dans les entreprises A
et B.
2. Le PDG de lentreprise B dit celui de lentreprise A : Mes salaris sont mieux pays que les
vtres.
Ce dernier rpond : Faux, mes employs sont mieux pays et mes cadres galement.
Expliquer ce paradoxe apparent.
Solution :
7 Calculs de moyennes, dcart-types.
8 Comparaison entre [x ; x + ] et lintervalle interquartile.
9 Autre formule de la variance.
10 Application conomique.
11 QCM.
12 Fonctions statistiques dune calculatrice.
13 Tableur et calculs statistiques.
7
170 15 + 110 25 + 20 35 6000
1. (a) xA = = = 20 milliers de
170 + 110 + 20 300
280 15 + 180 25 + 40 35 10100
xB = = = 20, 2 milliers de
280 + 180 + 40 500
170 15 + 100 25 5050
(b) x0A = = ' 18, 7 milliers de
170 + 100 270
280 15 + 140 25 7700
x0B = = = 18, 3 milliers de
280 + 140 420
10 25 + 20 35 950
(c) x00A = = = 31, 7 milliers de
10 + 20 30
40 25 + 40 35 2400
x00B = = = 30 milliers de
40 + 40 80
2. Les deux PDG ont raison !
Ce nest pas un paradoxe. Il est simplement insuffisant, pour comparer deux sries statistiques,
duniquement comparer leurs moyennes. Il faut aussi tenir compte des rpartitions suivant les ca-
tgories (ici les employs et les cadres).
Lentreprise B propose un salaire moyen global plus important, mais il est plus avantageux de tra-
vailler dans lentreprise A, car les salaires moyens par catgorie y sont plus important. Les cadres
sont simplement proportionnellement moins nombreux dans cette entreprise.
Dfinition : On appelle srie chronologique une srie statistiques o les valeurs de la srie sont
observs des intervalles de temps gaux (minutes, heures, jours, mois, annes...).
Exemple : Relev de temprature
Temps (en h) 6 8 10 12 14 16 18 20 22
Temprature (en C) 2 3 0 3 6 8 5 0 1
Remarques :
1. Ces sries sont gnralement reprsentes graphiquement par un nuage de points. On place
les dates en abscisses et les valeurs du caractre tudi en ordonne. On peut ventuellement
relier les points par des segments (qui nont pas de relle signification). Pour un exemple, voir
la figure 5.
14 Effet de structure.
15 Srie chronologique.
8
2. Pour tudier la tendance dune srie chronologique dont les variations sont trs irrgulires,
on peut utiliser le lissage par moyennes mobiles (voir module) qui permet de lisser la
srie initiale.
Module : Lissage par moyennes mobiles (sur feuille polycopie)
Exercices : 64 page 13116 66 page 131 et 68, 70 page 13217 [Dclic]
3.2 Histogramme
Activit : Activit 2 page 10518 [Dclic]
Cette reprsentation est utilise pour des sries continues, cest--dire dont le caractre tudi peut
prendre un nombre infini de valeurs, et dont les valeurs du caractre ont t regroups en classes.
Laire des rectangles est proportionnel leffectif et la longueur de leur base est proportionnelle
lamplitude de la classe.
Remarque : On peut utiliser la calculatrice pour reprsenter des histogrammes, mais uniquement si les
classes ont toutes mme amplitude (voir page 113 [Dclic])
Exemple 2 : cas gnral classes damplitude quelconque
Classe [0 ; 100[ [100 ; 150[ [150 ; 250[ [250 ; 400[ [400 ; 700[
Effectif 100 80 120 90 60
Il faut que laire des rectangles soit proportionnelle leffectif, et non leur hauteur. Pour cela :
on commence par choisir une unit pour laxe des abscisses (valeurs du caractre) et une unit
daire (pour les effectifs)
on dtermine la hauteur de chaque rectangle connaissant son aire et la longueur de sa base.
Units :
1 cm pour 100 en abscisse.
1 cm2 pour un effectif de 20.
Calculs :
base : 1 cm aire 5
Sur [0 ; 100[ : hauteur : = = 5 cm
aire : 5 cm2 base 1
16 Reprsentation
de srie chronologique.
17 Utilisation
des moyennes mobiles.
18 Histogramme.
9
base : 0, 5 cm aire 4
Sur [100 ; 150[ : hauteur : = = 8 cm
aire : 4 cm2 base 0, 5
base : 1 cm aire 6
Sur [150 ; 250[ : hauteur : = = 6 cm
aire : 6 cm2 base 1
base : 1, 5 cm aire 4, 5
Sur [250 ; 400[ : hauteur : = = 3 cm
aire : 4, 5 cm2 base 1, 5
base : 3 cm aire 3
Sur [400 ; 700[ : hauteur : = = 1 cm
aire : 3 cm2 base 3
Histogramme :
Voir la figure 7. Lunit daire choisie est prcise par un petit rectangle situ ct de
lhistogramme. Les graduations de laxe des ordonnes nont ici aucun sens.
Dfinitions :
effectif de la classe
On appelle densit de leffectif dune classe le quotient : .
amplitude de la classe
La classe modale est la classe de plus grande densit.
Remarques :
1. Le calcul de densits permet de comparer les effectifs de classes nayant pas la mme amplitude.
2. La densit est proportionnelle la hauteur du rectangle reprsentant la classe. La classe modale
correspond donc au rectangle le plus haut.
Exercices : 50, 51 page 12819 55, 56 page 12920 53 page 12821 et 58 page 12922 [Dclic]
19 QCM.
20 Histogrammes pas constant utilisation de la calculatrice.
21 Histogramme : construction dans le cas gnral.
22 Utilisation dun histogramme.
10
4 Un exemple de srie statistique double
Dfinition : On appelle srie statistique double (ou srie statistique deux variables) une srie
statistique o deux caractres sont tudis simultanment. On prsente gnralement les rsultats
dans un tableau double entre.
Exemple : Le tableau 2 rsume les rponses la question Regardez-vous les matches de football la
tlvision ? suivant le sexe. Il sagit dune srie statistique double.
Rponse
Sexe oui non Total
Masculin 20 4 24
Fminin 10 6 16
Total 30 10 40
Il sagit dun tableau de contingence ne contenant plus les effectifs mais les frquences par rapport
leffectif total (situ lintersection de la ligne et la colonne Total ). Pour un exemple, voir le tableau 3.
Rponse
Sexe oui non Total
Masculin 0,5 0,1 0,6a
Fminin 0,25b 0,15 0,4
Total 0,75c 0,25 1
a 60 % des personnes interroges sont des hommes.
b 25 % des personnes interroges sont des femmes dont la rponse est oui .
c 75 % des personnes interroges ont rpondu oui .
Dfinitions : Les frquences situes dans les marges de ce tableau sont appeles frquences margi-
nales. Elles correspondent ltude dun des deux caractres indpendamment de lautre.
Les autres cases de ce tableau contiennent les frquences conjointes.
11
4.3 Frquences par rapport aux lignes, aux colonnes
Mthode : Il sagit dtudier les frquences par rapport au dernier rsultat de chaque ligne (celui de
la colonne Total ). Dans lexemple prcdent, il sagit donc dtudier, pour chaque sexe, la
rpartition des rponses (voir tableau 4).
Rponse
Sexe oui non Total
Masculin 0,83 0,17a 1
Fminin 0,625b 0,375 1
Ensemble 0,75c 0,25 1
a 17 % des hommes ont rpondu non .
b 62,5% des femmes ont rpondu oui .
c 75 % des personnes interroges ont rpondu oui .
Remarque : Le tableau obtenu nest plus un tableau de contingence. La dernire ligne nest plus une
ligne Total , mais rsume les frquences des rponses donnes indpendamment du sexe.
On peut alors retrouver les frquences conjointes par un calcul de pourcentage de pourcentage.
Par exemple :
frquence par rapport leffectif total des hommes qui ont rpondu oui : 0, 60 0, 83 ' 0, 5.
12
4.3.2 Frquences par rapport aux colonnes
Mthode : Il sagit dtudier les frquences par rapport au dernier rsultat de chaque colonne (celui
de la ligne Total ). Dans lexemple prcdent, il sagit donc dtudier, pour chaque rponse, la
rpartition des sexe (voir tableau 5).
Rponse
Sexe oui non Ensemble
Masculin 0,67 0,4a 0,6
Fminin 0,33b 0,6 0,4
Total 1 1 1
a 40 % des rponses ngatives ont t donnes par des hommes.
b 33 % des rponses positives ont t donnes par des femmes.
Remarques :
1. Le tableau obtenu nest plus un tableau de contingence. La dernire colonne nest plus une co-
lonne Total , mais rsume les frquences du sexe des personnes interroges indpendamment
de leur rponse.
2. Le tableau 5 rsume donc les frquences sachant la rponse.
3. On peut rsumer ces rsultats par un arbre (voir figure 9).
On peut alors retrouver les frquences conjointes par un calcul de pourcentage de pourcentage.
Par exemple :
frquence par rapport leffectif total des hommes qui ont rpondu oui : 0, 75 0, 67 ' 0, 5.
Exercices : 71, 72 page 13323 73, 74 page 13324 [Dclic]
Rfrences
[Dclic] Dclic 1re ES, Hachette ducation (dition 2005) 3, 4, 6, 7, 8, 9, 10, 13
[Modulo] Modulo 1re ES, Didier (dition 2005)
7
23 Tableaux double entre.
24 Application aux arbres.
13