Stat L1
Stat L1
Stat L1
Objet de la statistique
Historiquement, la statistique était l’étude des données découlant du recensement de la population et
permettant d’en décrire l’état. Aujourd’hui, une étude statistique consiste à recueillir des données, à les
organiser sous forme de tableaux ou de représentations graphiques, à les traiter à l’aide de procédés
ou de techniques mathématiques afin de permettre une analyse objective dégageant les lois
caractérisant le comportement de grands ensembles, lesquels ensembles sont le siège de phénomènes
aléatoires.
1
La fréquence d’une modalité est le rapport de l’effectif de la modalité par l’effectif total. On démontre
que la somme de toutes les fréquences d’une série statistique est égale à 1.
Remarque :
(1) La fréquence peut aussi s’exprimer en pourcentage. Dans ce cas, elle est de la forme :
ni
f i= ×100, où ni est l’effectif partiel et N l’effectif total.
N
(2) On définit les fréquences cumulées de la même façon que les effectifs cumulés.
Application :
Exercice 2 de la fiche de TD
2. Tableaux statistiques et représentations graphiques
2.1 Tableaux statistiques
Le tableau statistique le plus simple est formé de deux lignes :
- la ligne supérieure indiquant les différentes modalités ou classes ;
- la ligne inférieure indiquant les effectifs correspondant à chaque modalité ou classe.
Remarque:
(1) On peut aussi faire une présentation verticale des résultats, la première colonne indiquant
les modalités ou classes et la deuxième les effectifs correspondants.
(2) En plus des effectifs, un tableau statistique peut contenir les effectifs cumulés, les
fréquences et les fréquences cumulées.
Application:
On considère la série des notes suivantes relative à un devoir de mathématiques donné dans une
classe de L1 : 11 ; 13 ; 8 ; 9 ; 9 ; 11 ; 12 ; 7 ; 10 ; 7 ; 8 ; 9 ; 13 ; 13 ; 10 ; 8 ; 11 ; 14 ; 17 ; 6 ; 4 ; 9 ; 10 ;
13 ; 9 ; 5 ; 12 ; 10.
T.A.F :
1. Quelle est la population étudiée ? Quelle est sa taille ?
2. a) Quel est le caractère étudié dans la population ?
b) Quelles sont les valeurs prises par celui-ci ?
3. Dresser le tableau des effectifs, fréquences, effectifs cumulés et fréquence cumulées de cette
série statistique.
4. Regrouper ces notes dans des classes d’amplitude 4 : [4 ; 8[, [8 ; 12[, … puis dresser à nouveau le
tableau des centres, effectifs, fréquences, effectifs cumulés et fréquences cumulées.
Remarque :
2
On peut de la même façon présenter le diagramme à bâtons des effectifs cumulés ainsi que les
polygones correspondants.
Application :
Le dépouillement de 24 fiches de renseignement remplies par les ouvriers d’une entreprise fournit les
renseignements suivants sur le nombre d’enfants à charge :
1 ; 0 ; 2 ; 1 ; 3 ; 0 ; 1 ; 2 ; 1 ; 0 ; 1 ; 4 ; 1 ; 0 ; 2 ; 0 ; 1 ; 1 ; 2 ; 3 ; 2 ; 0 ; 1 ; 1.
T.A.F :
Construire le diagramme à bâtons relatif à cette série statistique puis tracer le polygone des effectifs.
Durée (min)
[0 ; 10[ [10 ;20[ [20 ;30[ [30 ;40[ [40 ;50[ [50 ;60[ [60 ;70[ [70 ;80[
Nombre
2 7 15 20 23 17 11 5
d’étudiants
T.A.F :
Construire l’histogramme de cette série et compléter le dessin par le polygone des effectifs.
Remarque :
Le polygone des effectifs ou des fréquences est obtenu en joignant les points d’abscisse le centre de la
classe et d’ordonnée l’effectif ou la fréquence.
Application :
Le tableau ci-dessous donne la répartition des abonnés d’une revue en fonction de leur âge.
3
Age [40 ; 50[ [50 ; 55[ [55 ; 60[ [60 ; 65[ [65 ; 70[
Effectif 178 361 983 438 92
T.A.F : Construire l’histogramme des effectifs de cette série statistique et compléter le dessin par le
polygone des effectifs.
On appelle moyenne arithmétique de la série statistique ( x i ; ni ) d’effectif total N, le nombre réel noté X́
k
1
défini par X́ = ∑ ni xi . Cette moyenne est appelée moyenne arithmétique pondérée.
N i=1
N
1
Lorsque chaque effectif est égal à 1, alors k =N et la moyenne arithmétique devient : X́ = ∑ x i
N i=1
Cette moyenne est appelée moyenne simple.
Médiane :
On appelle médiane d’une série statistique et on note Me, la valeur de la variable qui la partage en deux
sous-séries de même effectif, les modalités étant rangés par ordre croissant ou décroissant.
Graphiquement, la médiane Me est l’abscisse du point d’insertion des polygones des effectifs cumulés
croissants et décroissants.
Les quantiles
Les valeurs d’une série statistique étant rangées suivant un ordre croissant (ou décroissant), on appelle
quantiles des nombres réels qui partagent la série statistique en n parties de même effectif.
Remarque :
(1) Lorsque n = 4, les quantiles sont appelés quartiles.
Les quartiles sont justement les trois valeurs de la série qui partagent les observations rangées par
valeur croissante ou décroissantes, en quatre groupes de même effectif.
On les note généralement Q1, Q2 et Q3.
Pour une variable continue, ce sont les modalités qui correspondent respectivement aux effectifs
N 2 N 3N
cumulés croissants, , , , N étant l’effectif total.
4 4 4
4
(2) Lorsque n =10, les quantiles sont appelés déciles
(3) Lorsque n = 100, les quantiles sont appelés centiles.
(4) les quantiles se déterminent de la même manière que la médiane.
Application :
On donne dans le tableau suivant la répartition des dépannages d’une grande surface en
électroménager en fonction de leur durée :
Durée (min) [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 100[ [100 ;120[ [120 ;140[
Nombre de
4 36 64 80 58 24 14
dépannages
T.A.F :
1. Quelle est la durée moyenne des dépannages ?
2. Déterminer le mode MO, la médiane ME, le premier quartile Q1, le troisième quartile Q2.
3. Donner la signification de chacune de valeurs calculées à la question 1.
Remarque :
e
On peut comparer l’écart interquartile et la moitié de l’étendue. En effet, Q 3 – Q1 ¿ 2 nous fait penser à
une série moins dispersée.
- Variance
Soit x 1 , x 2 , … x k les modalités d’effectifs respectifs n1, n2 , ….,nk d’une série statistique de variable X.
La variance est le nombre réel noté V où V(X) et donné par la relation
k k
1 2 1
V ( X)= ∑ ni ( xi −x́ ) ou V ( X)= ∑ ni x ²i −(x́ )²
N i=1 N i=1
- Ecart –type
L’écart type noté σX est la racine carrée de la variance : σX = √ V (X )
5
Remarques :
(1) L’écart type est la caractéristique de dispersion la plus utilisée.
(2) Un écart type faible signifie que les valeurs observées sont regroupées autour des valeurs
centrales (on parle de série concentrée)
(3) Un écart type élevé signifie que les valeurs observées sont éloignées des valeurs centrales on
parle dans ce cas de série dispersée.
Application :
Une machine produit des pièces usinées (barres de métal). Un prélèvement d’un lot de 20 pièces fournit
les mesures de longueur suivantes (cm) :
76,5 76,3 76,4 76,8 76,2 76,6 76,5 76,1 76,5 76,7
76,8 76,5 76,4 76,7 76,3 76,7 76,2 76,6 76,5 76,7
T.A.F :
6
Thème :
Exercice I :
On considère la série des notes suivantes relative à un devoir de mathématiques donné dans une
classe de FC1 : 11 ; 13 ; 8 ; 9 ; 9 ; 11 ; 12 ; 7 ; 10 ; 7 ; 8 ; 9 ; 13 ; 13 ; 10 ; 8 ; 11 ; 14 ; 17 ; 6 ; 4 ; 9 ;
10 ; 13 ; 9 ; 5 ; 12 ; 10.
T.A. F :
1. Quelle est la population étudiée ? Quelle est sa taille ?
2. a) Quel est le caractère étudié dans la population ?
b) Quelles sont les valeurs prises par celui-ci ?
3. Dresser le tableau des effectifs, fréquences, effectifs cumulés et fréquence cumulées de cette
série statistique.
4. Regrouper ces notes dans des classes d’amplitude 4 : [4 ; 8[, [8 ; 12[, … puis dresser à nouveau
le tableau des centres, effectifs, fréquences, effectifs cumulés et fréquences cumulées.
Exercice II :
Dans le but d’équiper le laboratoire de son établissement, l’intendant d’un lycée achète des calculatrices
dont les prix varient de 1 000 F à 4 500 F.
b) Quelle est la fréquence des calculatrices dont le prix est inférieur ou égal à 2 500 F ?
3. Combien de calculatrices ont un prix strictement inférieur à 3 000 F ?
4. Calculer le coût total de cet achat.
7
Exercice III :
Le dépouillement de 24 fiches de renseignement remplies par les ouvriers d’une entreprise fournit les
renseignements suivants sur le nombre d’enfants à charge :
1 ; 0 ; 2 ; 1 ; 3 ; 0 ; 1 ; 2 ; 1 ; 0 ; 1 ; 4 ; 1 ; 0 ; 2 ; 0 ; 1 ; 1 ; 2 ; 3 ; 2 ; 0 ; 1 ; 1.
Construire le diagramme en bâtons relatif à cette série statistique puis tracer le polygone des effectifs.
Exercice IV :
Une enquête a été réalisée auprès de 100 étudiants de CEFAT-INTER sur la durée du trajet effectué
pour se rendre à l’école. Le tableau ci-dessous donne la répartition de la durée du trajet.
Durée (min)
[0 ; 10[ [10 ;20[ [20 ;30[ [30 ;40[ [40 ;50[ [50 ;60[ [60 ;70[ [70 ;80[
Nombre
2 7 15 20 23 17 11 5
d’étudiants
T.A.F :
1. Construire l’histogramme de cette série et compléter le dessin par le polygone des effectifs.
2. Déterminer la classe modale.
3. Calculer la médiane.
4. Calculer la durée moyenne d du trajet d'un étudiant et l'écart-type.
5. Déterminer la fréquence des étudiants dont le temps de trajet appartient à l'intervalle :
Exercice V :
Le tableau ci-dessous donne la répartition des abonnés d’une revue en fonction de leur âge.
Age [40 ; 50[ [50 ; 55[ [55 ; 60[ [60 ; 65[ [65 ; 70[
Effectif 178 361 983 438 92
Construire l’histogramme des effectifs de cette série statistique et compléter le dessin par le polygone
des effectifs.
Exercice VI :
On donne dans le tableau suivant la répartition des dépannages d’une grande surface en
électroménager en fonction de leur durée :
Durée (min) [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 100[ [100 ;120[ [120 ;140[
Nombre de
4 36 64 80 58 24 14
dépannages
T.A. F :
1. Déterminer le mode MO, la médiane ME, le premier quartile Q1, le troisième quartile Q2.
2. Donner la signification de chacune de valeurs calculées à la question 1.
3. Quelle est la durée moyenne des dépannages ?
Exercice VII :
8
Une machine produit des pièces usinées (barres de métal). Un prélèvement d’un lot de 20 pièces fournit
les mesures de longueur suivantes (cm) :
76,5 76,3 76,4 76,8 76,2 76,6 76,5 76,1 76,5 76,7
76,8 76,5 76,4 76,7 76,3 76,7 76,2 76,6 76,5 76,7
9
II - SERIES STATISTIQUES A DEUX VARIABLES
Dans cette partie les couples de modalités sont d’effectifs égaux à 1.
1- DEFINITIONS
1.2- Nuage de points : Considérons une population sur laquelle à n individus sur laquelle on étudie
simultanément deux caractères X et Y.
Dans le plan muni d’un repère orthogonal, on associe à chaque couple (x i ; yi) un point Mi représentant
un individu de la population.
On appelle nuage de points de la série statistique double de caractères X et Y, l’ensemble des points M i
(xi ,yi) du plan où xi est une modalité du caractère X et yi est une modalité du caractère Y. Application :
Le tableau ci-dessous donne l’évolution du nombre de pneus (en milliers) vendus annuellement entre
2011 et 2016, par une société commerciale.
Représenter le nuage de points associé à la série statistique (x,y) dans le plan muni d’un repère
orthogonal (O, I, J). On prendra 2 cm pour une année en abscisses et 1 cm pour 4000 pneus en
ordonnées.
1.3- Le point moyen : On appelle point moyen d’un nuage de n points de coordonnées (x i, yi), le point G
k k
1 1
de coordonnées (x́ ; ý ¿ ; telles que X́ = ∑ x i et Ý = ∑ y i
N i=1 N i=1
10
Application :
Reprendre l’énoncé de l’application précédente et déterminer le point moyen du nuage.
Si on désigne par G1(x1, y1) et par G2(x2, y2) les points moyens respectifs des deux sous-ensembles
constitués alors la droite (G1G2) est la droite d’ajustement appelée droite de Mayer.
Remarques:
(1) La droite de Mayer passe par le point moyen G( x́ ; ý) du nuage.
(2) La droite d’ajustement appelée aussi droite d’estimation est un précieux outil de prévision.
x 2−x 1
a= et b= ý −a . x́
y 2− y 1
Application :
On donne dans le tableau ci-dessous l'ancienneté et les primes correspondantes de six cadres d'une
entreprise.
Ancienneté Xi 2 6 10 17 20 26
Prime Yi (en millions de F) 1,1 2,8 3,3 3,8 4 4,8
T.A.F :
1. Représenter graphiquement le nuage de points associé à cette série statistique et montrer que l’on
peut envisager un ajustement linéaire du nuage de points obtenus.
Echelle : 1 cm pour 2 ans en abscisse
1 cm pour 0,5 (en million de F en ordonnées
On fractionne le nuage en deux groupes : groupe 1 de point moyen G1 correspondant aux 3 premiers
couples et le groupe 2 de point moyen G2 correspondant aux 3 derniers couples.
2. Calculer les coordonnées des points moyens G1 et G2.
3. Déterminer une équation de la droite (G1G2)
11
a) Selon la tendance dégagée par la droite, déterminer la prime d’un cadre dont l’ancienneté est
30 ans.
b) La prime d’un cadre s’élève à 6 000 000 F, quel est le nombre d’années (ou ancienneté)
correspondant ?
Cov (X ; Y )
r=
√ V ( X ) .V (Y )
Remarques :
(1) On a toujours −1 ≤r ≤ 1.
(2) Lorsque, 0,87 ≤|r|≤ 1, on dit qu’il y a une forte corrélation. Dans ce cas un ajustement
affine est justifié.
Propriétés :
(1) Une équation de la droite d’ajustement de y en x est Y =a . x +b avec :
Cov (X ; Y )
{a=
V ( X)
et b=Ý −a . x́
Remarque :
(1) les deux droites d’ajustement obtenues par la méthode des moindres carrés passent
par les points moyens du nuage.
Lorsque r = 1, les deux droites sont confondues et l’un ajustement est dit parfait.
12
Application :
Le tableau ci-dessous donne l’évolution du nombre de voitures (en milliers) vendues annuellement
entre 2013 et 2018, par un constructeur automobile.
1. Représenter le nuage de points associé à la série statistique (x,y) dans le plan muni d’un
repère orthogonal (O, I, J). On prendra 2 cm pour une année en abscisses et 1 cm pour 4000
voitures en ordonnées.
13
THEME Année : 2020 - 2021
STATISTIQUE A DEUX
VARIABLES
Matière : STATISTIQUE Classe : LICENCE 1
UP MATHEMATIQUES Visa CM
TRAVAUX DIRIGES
Exercice 1 :
Le tableau ci-dessous donne l’évolution du nombre de voitures (en milliers) vendues annuellement
entre 1981 et 1986, par la firme JAGUAR.
1. Représenter le nuage de points associé à la série statistique (x ; y) dans le plan muni d’un
repère orthogonal (O, I, J). On prendra 2 cm pour une année en abscisses et 1 cm pour 4000
voitures en ordonnées.
2. Calculer le coefficient de corrélation linéaire r entre les variables x et y à 10 -2 près. Interpréter
le résultat obtenu.
3. Déterminer une équation de la droite d’ajustement (D) de y en x par la méthode des
moindres carrés. Construire la droite (D).
4. En supposant que l’évolution se poursuit de la même façon dans les années à venir, donner
une estimation (en millier) du nombre de voitures de marque JAGUAR qui seront vendues en 2008.
Exercice 2 :
14
Les services comptables de la société ZAN-VIH ont relevé le chiffre d’affaires annuel de la société
depuis huit années dans le tableau suivant, où x est le numéro d’ordre de l’année et y le chiffre
d’affaires en millions de francs.
1. Construire dans un repère orthogonal le nuage de points associé à cette série statistique de
caractère (X, Y). Échelle : 1cm → 1an en abscisses et 1cm → 25×10 6 F en ordonnées.
Peut-on envisager un ajustement affine ? Justifier la réponse.
2. Reproduire et compléter le tableau ci- dessous (valeurs à 10 -3 près) :
Rang xi 1 2 3 4 5 6 7 8
zi = lnyi
Exercice 3 :
Le tableau ci-dessous donne les sommes x i dépensées par mois en frais de publicité et le chiffre
d’affaires yi exprimés en millions de francs d’une entreprise au cours des sept derniers mois d’activités
de l’année 2007.
xi 3,1 3,3 2 3,7 2,5 3 4
yi 45 42 38 49 41 44 50
1. Représenter dans un repère orthogonal le nuage de points associé à cette série statistique.
2. Calculer les coordonnées du point moyen G et le placer dans le repère précédent.
3. Calculer le coefficient de corrélation linéaire r entre les variables x et y.
Un ajustement affine de ce nuage de points est-il envisageable ? Justifier.
4. Déterminer une équation de la droite de régression de y en x obtenue par la méthode des
moindres carrées.
5. En supposant que cette tendance se poursuive, donner une estimation du chiffre d’affaires de
cette entreprise pour une dépense de 6 700 000 F de publicité mensuelle.
Exercice 4 :
On donne dans le tableau ci-dessous l'ancienneté et les primes correspondantes de six cadres d'une
entreprise.
15
Ancienneté Xi 2 6 10 17 20 26
Prime Yi (en millions de F) 1,1 2,8 3,3 3,8 4 4,8
1. Représenter graphiquement le nuage de points associé à cette série statistique et montrer que l’on
peut envisager un ajustement linéaire du nuage de points obtenus.
Echelle : 1 cm pour 2 ans en abscisse et 1 cm pour 0,5 (en million de F en ordonnées) On fractionne
le nuage en deux groupes : groupe 1 de point moyen G1 correspondant aux 3 premiers couples et le
groupe 2 de point moyen G2 correspondant aux 3 derniers couples.
2. Calculer les coordonnées des points moyens G1 et G2
3. Déterminer une équation de la droite (G1 G2)
4. a) Selon la tendance dégagée par la droite, déterminer la prime d’un cadre dont l’ancienneté
est 30.
c) La prime d’un cadre s’élève à 6 000 000 F, quel est le nombre d’années (ou ancienneté)
correspondant ?
Exercice 5 :
Un chef d’entreprise a noté le nombre de fautes de frappe faites par son assistante ainsi que le nombre
de pages des documents qu’elle a saisi. Les résultats de huit observations sont consignés dans le
tableau suivant :
1. Dans un repère (O, I, J), représenter le nuage de points associé à cette série statistique double.
On prendra 1 cm pour une unité sur chaque axe.
2. Calculer les coordonnées du point moyen G du nuage. Placer G dans le repère (O, I, J).
3. Démontrer qu’une équation de la droite d’ajustement affine obtenue par la méthode de Mayer est
y = 2x + 3.
4. Selon l’ajustement précédent :
a) donner une estimation du nombre de fautes de frappe dans un document de 23 pages ;
b) donner une estimation du nombre de pages d’un document pour lequel l’assistante a fait
35 fautes de frappe.
16