Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Stat L1

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 16

Thème :

Année Scolaire : 2020-2021


Matière : Maths Appliquées
STATISTIQUE Classes : LICENCE 1
UP-MATHEMATIQUES CM :
COURS

Objet de la statistique
Historiquement, la statistique était l’étude des données découlant du recensement de la population et
permettant d’en décrire l’état. Aujourd’hui, une étude statistique consiste à recueillir des données, à les
organiser sous forme de tableaux ou de représentations graphiques, à les traiter à l’aide de procédés
ou de techniques mathématiques afin de permettre une analyse objective dégageant les lois
caractérisant le comportement de grands ensembles, lesquels ensembles sont le siège de phénomènes
aléatoires.

Procédure d’obtention des données


Le recensement d’une population qui consiste à observer toutes les limites statistiques qui la
composent, n’est pas toujours facile. C’est pourquoi, on procède généralement à un sondage c'est-à-
dire qu’on observe une partie de la population appelée un échantillon qui doit être représentatif de la
population elle-même.
Lorsque chaque élément de la population (ou unité statistique) est une personne, il est soumis à un
questionnaire qui fait preuve d’impartialité et adapté à la situation.
Le résultat chiffré du recensement ou du sondage est obtenu après dépouillement.

I - STATISTIQUE A UNE VARIABLE


1- vocabulaire statistique
- Population : C’est l’ensemble sur lequel porte une étude statistique.
- Individu : Chaque élément d’une population est un individu ou une unité statistique.
- Caractère : C’est la propriété de la population faisant l’objet de l’étude.
Lorsque les valeurs prises par le caractère sont mesurables, on dit qu’il est quantitatif.
Dans le cas contraire on dit qu’il est qualitatif.
Un caractère quantitatif est discret, s’il prend des valeurs mesurables et isolées.
Un caractère quantitatif est continu lorsqu’il peut prendre toutes les valeurs possibles dans un intervalle
a+b
donné appelé aussi classe. Le centre ci d’une classe [a ; b [ est déterminé par la formule : C=
2
L’amplitude α d’une classe [a ; b [ est déterminée par la longueur de l’intervalle [a ; b[ : α = b – a.
Les modalités : Ce sont les valeurs prises par le caractère étudié.
L’effectif d’une modalité est le nombre de fois que la modalité est observée ou le nombre
d’observations appartenant à une classe donnée.
L’effectif total est le nombre d’individus que contient la population étudiée.
Effectifs cumulés : on distingue deux types d’effectifs cumulés
Dans le cas d’une série statistique à caractère quantitatif, les valeurs de la variable étant rangées selon
un ordre croissant, l’effectif cumulé croissant d’une modalité x i est le nombre d’individus présentant une
modalité inférieure ou égale à xi.
L’effectif cumulé décroissant d’une modalité x i est le nombre d’individus présentant une modalité
supérieure ou égale à xi.
Lorsque le caractère est continu, on attribue l’effectif cumulé croissant à la borne supérieure de la
classe. Quant à l’effectif cumulé décroissant, il est attribué à la borne inférieure de la classe.

1
La fréquence d’une modalité est le rapport de l’effectif de la modalité par l’effectif total. On démontre
que la somme de toutes les fréquences d’une série statistique est égale à 1.

∑ f i = 1, k étant le nombre de modalités.


i=1

Remarque :
(1) La fréquence peut aussi s’exprimer en pourcentage. Dans ce cas, elle est de la forme :
ni
f i= ×100, où ni est l’effectif partiel et N l’effectif total.
N

(2) On définit les fréquences cumulées de la même façon que les effectifs cumulés.

Application :
Exercice 2 de la fiche de TD
2. Tableaux statistiques et représentations graphiques
2.1 Tableaux statistiques
Le tableau statistique le plus simple est formé de deux lignes :
- la ligne supérieure indiquant les différentes modalités ou classes ;
- la ligne inférieure indiquant les effectifs correspondant à chaque modalité ou classe.
Remarque:
(1) On peut aussi faire une présentation verticale des résultats, la première colonne indiquant
les modalités ou classes et la deuxième les effectifs correspondants.
(2) En plus des effectifs, un tableau statistique peut contenir les effectifs cumulés, les
fréquences et les fréquences cumulées.
Application:
On considère la série des notes suivantes relative à un devoir de mathématiques donné dans une
classe de L1 : 11 ; 13 ; 8 ; 9 ; 9 ; 11 ; 12 ; 7 ; 10 ; 7 ; 8 ; 9 ; 13 ; 13 ; 10 ; 8 ; 11 ; 14 ; 17 ; 6 ; 4 ; 9 ; 10 ;
13 ; 9 ; 5 ; 12 ; 10.

T.A.F :
1. Quelle est la population étudiée ? Quelle est sa taille ?
2. a) Quel est le caractère étudié dans la population ?
b) Quelles sont les valeurs prises par celui-ci ?
3. Dresser le tableau des effectifs, fréquences, effectifs cumulés et fréquence cumulées de cette
série statistique.
4. Regrouper ces notes dans des classes d’amplitude 4 : [4 ; 8[, [8 ; 12[, … puis dresser à nouveau le
tableau des centres, effectifs, fréquences, effectifs cumulés et fréquences cumulées.

2.2 Représentations graphiques


2.2.1 Cas d’une variable discrète
La représentation graphique la plus utilisée est le diagramme à bâtons des effectifs ou des fréquences
obtenu en portant dans un repère orthogonal, les valeurs x i en abscisses et les effectifs ni ou
fréquences fi en ordonnées.
En joignant les extrémités des bâtons on obtient la ligne polygonale appelée le polygone des effectifs ou
des fréquences qui permet de visualiser plus facilement la série statistique.

Remarque :

2
On peut de la même façon présenter le diagramme à bâtons des effectifs cumulés ainsi que les
polygones correspondants.

Application :
Le dépouillement de 24 fiches de renseignement remplies par les ouvriers d’une entreprise fournit les
renseignements suivants sur le nombre d’enfants à charge :
1 ; 0 ; 2 ; 1 ; 3 ; 0 ; 1 ; 2 ; 1 ; 0 ; 1 ; 4 ; 1 ; 0 ; 2 ; 0 ; 1 ; 1 ; 2 ; 3 ; 2 ; 0 ; 1 ; 1.

T.A.F :
Construire le diagramme à bâtons relatif à cette série statistique puis tracer le polygone des effectifs.

2.2.2 Cas d’une variable continue


 Classes de même amplitude
Pour les séries à variable continue en général, on trace principalement des histogrammes.
Un histogramme est une suite de rectangles juxtaposés dont l’aire est proportionnelle à l’effectif ou à la
fréquence. Les classes sont portées en abscisses et les effectifs ou fréquences en ordonnées dans un
repère orthogonal.
Application :
Une enquête a été réalisée auprès de 100 étudiants de CEFAT-Inter sur la durée du trajet effectué pour
se rendre à l’école. Le tableau ci-dessous donne la répartition de la durée du trajet.

Durée (min)
[0 ; 10[ [10 ;20[ [20 ;30[ [30 ;40[ [40 ;50[ [50 ;60[ [60 ;70[ [70 ;80[
Nombre
2 7 15 20 23 17 11 5
d’étudiants

T.A.F :
Construire l’histogramme de cette série et compléter le dessin par le polygone des effectifs.

Remarque :
Le polygone des effectifs ou des fréquences est obtenu en joignant les points d’abscisse le centre de la
classe et d’ordonnée l’effectif ou la fréquence.

 Classes d’amplitudes inégales


Pour les classes d’amplitudes inégales, la hauteur égale à l’effectif ou à la fréquence ne permet pas
de construire un histogramme dont les surfaces sont proportionnelles à l’effectif ou à la fréquence. Il
faut donc corriger les effectifs. Pour effectuer ces corrections :
- on détermine l’amplitude minimale am ;
ai
- pour chaque classe d’amplitude ai, on détermine le coefficient r i =
am
' n i
- on calcule enfin l’effectif corrigé ni’ défini par n i= r i

Application :
Le tableau ci-dessous donne la répartition des abonnés d’une revue en fonction de leur âge.

3
Age [40 ; 50[ [50 ; 55[ [55 ; 60[ [60 ; 65[ [65 ; 70[
Effectif 178 361 983 438 92

T.A.F : Construire l’histogramme des effectifs de cette série statistique et compléter le dessin par le
polygone des effectifs.

3. Valeurs caractéristiques d’une série statistique

3.1 Les caractéristiques de position ou de tendance centrale


- Mode : On appelle mode toute modalité d’effectif maximal.
- La moyenne arithmétique
Soit, x1 ,x2,….., xk les modalités d’effectifs respectifs n1,n2 , ….,nk d’une série statistique de variable
X..

On appelle moyenne arithmétique de la série statistique ( x i ; ni ) d’effectif total N, le nombre réel noté X́
k
1
défini par X́ = ∑ ni xi . Cette moyenne est appelée moyenne arithmétique pondérée.
N i=1
N
1
Lorsque chaque effectif est égal à 1, alors k =N et la moyenne arithmétique devient : X́ = ∑ x i
N i=1
Cette moyenne est appelée moyenne simple.

 Médiane :
On appelle médiane d’une série statistique et on note Me, la valeur de la variable qui la partage en deux
sous-séries de même effectif, les modalités étant rangés par ordre croissant ou décroissant.
Graphiquement, la médiane Me est l’abscisse du point d’insertion des polygones des effectifs cumulés
croissants et décroissants.

 Les quantiles
Les valeurs d’une série statistique étant rangées suivant un ordre croissant (ou décroissant), on appelle
quantiles des nombres réels qui partagent la série statistique en n parties de même effectif.

Remarque :
(1) Lorsque n = 4, les quantiles sont appelés quartiles.

Les quartiles sont justement les trois valeurs de la série qui partagent les observations rangées par
valeur croissante ou décroissantes, en quatre groupes de même effectif.
On les note généralement Q1, Q2 et Q3.

Pour une variable continue, ce sont les modalités qui correspondent respectivement aux effectifs
N 2 N 3N
cumulés croissants, , ,  , N étant l’effectif total.
4 4 4

Le deuxième quartile Q2 est égal à la médiane.

4
(2) Lorsque n =10, les quantiles sont appelés déciles
(3) Lorsque n = 100, les quantiles sont appelés centiles.
(4) les quantiles se déterminent de la même manière que la médiane.

Application :
On donne dans le tableau suivant la répartition des dépannages d’une grande surface en
électroménager en fonction de leur durée :

Durée (min) [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 100[ [100 ;120[ [120 ;140[
Nombre de
4 36 64 80 58 24 14
dépannages

T.A.F :
1. Quelle est la durée moyenne des dépannages ?
2. Déterminer le mode MO, la médiane ME, le premier quartile Q1, le troisième quartile Q2.
3. Donner la signification de chacune de valeurs calculées à la question 1.

3.2 Les caractéristiques de dispersion


- Étendue
L’étendue e d’une série statistique de variable x est la différence entre la valeur la plus élevée et celle la
plus faible : e = xmax - xmin
- Écart interquartiles
De manière générale, on appelle écart interquantile, la différence entre deux quantiles extrêmes d’une
série. Ainsi l’écart interquartile est la différence entre le troisième et le premier quartile.
Il vaut : Q3 – Q1.
Il mesure l’amplitude de l’intervalle [Q 3 ; Q1[ qui contient 50% des observations.
Plus Q3 – Q1 est petit, moins les valeurs de la série sont dispersées (plus les valeurs de la série sont
concentrées) ; plus Q3 – Q1 est grand, plus les valeurs de la série sont dispersées.

Remarque :
e
On peut comparer l’écart interquartile et la moitié de l’étendue. En effet, Q 3 – Q1 ¿ 2 nous fait penser à
une série moins dispersée.
- Variance
Soit x 1 , x 2 , … x k les modalités d’effectifs respectifs n1, n2 , ….,nk d’une série statistique de variable X.
La variance est le nombre réel noté V où V(X) et donné par la relation

k k
1 2 1
V ( X)= ∑ ni ( xi −x́ ) ou V ( X)= ∑ ni x ²i −(x́ )²
N i=1 N i=1

- Ecart –type
L’écart type noté σX est la racine carrée de la variance : σX = √ V (X )
5
Remarques :
(1) L’écart type est la caractéristique de dispersion la plus utilisée.
(2) Un écart type faible signifie que les valeurs observées sont regroupées autour des valeurs
centrales (on parle de série concentrée)
(3) Un écart type élevé signifie que les valeurs observées sont éloignées des valeurs centrales on
parle dans ce cas de série dispersée.

Application :
Une machine produit des pièces usinées (barres de métal). Un prélèvement d’un lot de 20 pièces fournit
les mesures de longueur suivantes (cm) :

76,5 76,3 76,4 76,8 76,2 76,6 76,5 76,1 76,5 76,7

76,8 76,5 76,4 76,7 76,3 76,7 76,2 76,6 76,5 76,7

T.A.F :

1. Effectuer un regroupement des valeurs et en dresser le tableau des effectifs.


2. Calculer la moyenne x, la variance V et l’écart-type σ de cette série.
3. Combien de pièces sont à écarter si l’on rejette celles dont la longueur est extérieure à l’intervalle
[x – σ ; x + σ].

6
Thème :

Année Scolaire : 2020-2021


Matière : Maths Appliquées
Statistique à une variable Classes : LICENCE 1
UP-MATHEMATIQUES CM :
FICHE DE TRAVAUX DIRIGES N°1

Exercice I :
On considère la série des notes suivantes relative à un devoir de mathématiques donné dans une
classe de FC1 : 11 ; 13 ; 8 ; 9 ; 9 ; 11 ; 12 ; 7 ; 10 ; 7 ; 8 ; 9 ; 13 ; 13 ; 10 ; 8 ; 11 ; 14 ; 17 ; 6 ; 4 ; 9 ;
10 ; 13 ; 9 ; 5 ; 12 ; 10.

T.A. F :
1. Quelle est la population étudiée ? Quelle est sa taille ?
2. a) Quel est le caractère étudié dans la population ?
b) Quelles sont les valeurs prises par celui-ci ?
3. Dresser le tableau des effectifs, fréquences, effectifs cumulés et fréquence cumulées de cette
série statistique.
4. Regrouper ces notes dans des classes d’amplitude 4 : [4 ; 8[, [8 ; 12[, … puis dresser à nouveau
le tableau des centres, effectifs, fréquences, effectifs cumulés et fréquences cumulées.

Exercice II :
Dans le but d’équiper le laboratoire de son établissement, l’intendant d’un lycée achète des calculatrices
dont les prix varient de 1 000 F à 4 500 F.

b) Quelle est la fréquence des calculatrices dont le prix est inférieur ou égal à 2 500 F ?
3. Combien de calculatrices ont un prix strictement inférieur à 3 000 F ?
4. Calculer le coût total de cet achat.

7
Exercice III :
Le dépouillement de 24 fiches de renseignement remplies par les ouvriers d’une entreprise fournit les
renseignements suivants sur le nombre d’enfants à charge :
1 ; 0 ; 2 ; 1 ; 3 ; 0 ; 1 ; 2 ; 1 ; 0 ; 1 ; 4 ; 1 ; 0 ; 2 ; 0 ; 1 ; 1 ; 2 ; 3 ; 2 ; 0 ; 1 ; 1.
Construire le diagramme en bâtons relatif à cette série statistique puis tracer le polygone des effectifs.

Exercice IV :
Une enquête a été réalisée auprès de 100 étudiants de CEFAT-INTER sur la durée du trajet effectué
pour se rendre à l’école. Le tableau ci-dessous donne la répartition de la durée du trajet.

Durée (min)
[0 ; 10[ [10 ;20[ [20 ;30[ [30 ;40[ [40 ;50[ [50 ;60[ [60 ;70[ [70 ;80[
Nombre
2 7 15 20 23 17 11 5
d’étudiants

T.A.F :

1. Construire l’histogramme de cette série et compléter le dessin par le polygone des effectifs.
2. Déterminer la classe modale.
3. Calculer la médiane.
4. Calculer la durée moyenne d du trajet d'un étudiant et l'écart-type.
5. Déterminer la fréquence des étudiants dont le temps de trajet appartient à l'intervalle :

Exercice V :
Le tableau ci-dessous donne la répartition des abonnés d’une revue en fonction de leur âge.

Age [40 ; 50[ [50 ; 55[ [55 ; 60[ [60 ; 65[ [65 ; 70[
Effectif 178 361 983 438 92

Construire l’histogramme des effectifs de cette série statistique et compléter le dessin par le polygone
des effectifs.

Exercice VI :
On donne dans le tableau suivant la répartition des dépannages d’une grande surface en
électroménager en fonction de leur durée :

Durée (min) [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 100[ [100 ;120[ [120 ;140[
Nombre de
4 36 64 80 58 24 14
dépannages

T.A. F :
1. Déterminer le mode MO, la médiane ME, le premier quartile Q1, le troisième quartile Q2.
2. Donner la signification de chacune de valeurs calculées à la question 1.
3. Quelle est la durée moyenne des dépannages ?

Exercice VII :
8
Une machine produit des pièces usinées (barres de métal). Un prélèvement d’un lot de 20 pièces fournit
les mesures de longueur suivantes (cm) :

76,5 76,3 76,4 76,8 76,2 76,6 76,5 76,1 76,5 76,7

76,8 76,5 76,4 76,7 76,3 76,7 76,2 76,6 76,5 76,7

1. Effectuer un regroupement des valeurs et en dresser le tableau des effectifs.


2. Calculer la moyenne x, la variance V et l’écart-type σ de cette série.
3. Combien de pièces sont à écarter si l’on rejette celles dont la longueur est extérieure à l’intervalle
[x – σ ; x + σ].

9
II - SERIES STATISTIQUES A DEUX VARIABLES
Dans cette partie les couples de modalités sont d’effectifs égaux à 1.

1- DEFINITIONS

1.1- Une série double :


P est une population de n individus sur laquelle sont étudiés simultanément deux caractères X et Y. Sur
chaque individu i, on observe une modalité x i du caractère X et une modalité Y du caractère Y.
On appelle série statistique double de caractère (X ; Y) l’ensemble des couples de modalités
(xi ; yi).

1.2- Nuage de points : Considérons une population sur laquelle à n individus sur laquelle on étudie
simultanément deux caractères X et Y.

Individus 1er 2ème ………… (n-1)ème nème


Modalités de X x1 x2 ………… xn-1 xn
Modalité de Y y1 y2 ………… yn-1 yn

Dans le plan muni d’un repère orthogonal, on associe à chaque couple (x i ; yi) un point Mi représentant
un individu de la population.
On appelle nuage de points de la série statistique double de caractères X et Y, l’ensemble des points M i
(xi ,yi) du plan où xi est une modalité du caractère X et yi est une modalité du caractère Y. Application :
Le tableau ci-dessous donne l’évolution du nombre de pneus (en milliers) vendus annuellement entre
2011 et 2016, par une société commerciale.

Année 2011 2012 2013 2014 2015 2016


Rang xi de l’année 1 2 3 4 5 6
Nombre de pneus vendus yi (en milliers) 14 22 28 33,5 38,5 41

Représenter le nuage de points associé à la série statistique (x,y) dans le plan muni d’un repère
orthogonal (O, I, J). On prendra 2 cm pour une année en abscisses et 1 cm pour 4000 pneus en
ordonnées.

1.3- Le point moyen : On appelle point moyen d’un nuage de n points de coordonnées (x i, yi), le point G
k k
1 1
de coordonnées (x́ ; ý ¿ ; telles que X́ = ∑ x i et Ý = ∑ y i
N i=1 N i=1

10
Application :
Reprendre l’énoncé de l’application précédente et déterminer le point moyen du nuage.

2. Notion d’ajustement affine


La disposition des points du nuage peut caractériser une courbe dont on peut déterminer une équation.
On peut ensuite substituer aux valeurs observées, des valeurs calculées à l’aide de cette équation.
Lorsque la courbe est une droite, on dit qu’on réalise un ajustement affine.
2.1 Ajustement affine
Nous retenons deux méthodes pour la détermination de l’équation de la droite d’ajustement.

2.1.1 Méthode de Mayer


Principe de la méthode
Les modalités xi étant rangées dans l’ordre croissant, l’ensemble des points à ajuster est partagé en
deux parties de même effectif ou à une unité près.

Si on désigne par G1(x1, y1) et par G2(x2, y2) les points moyens respectifs des deux sous-ensembles
constitués alors la droite (G1G2) est la droite d’ajustement appelée droite de Mayer.
Remarques:
(1) La droite de Mayer passe par le point moyen G( x́ ; ý) du nuage.

(2) La droite d’ajustement appelée aussi droite d’estimation est un précieux outil de prévision.

Équation de la droite de Mayer Propriété :


L’équation réduite de la droite de Mayer est de la forme : Y =ax+ b avec a et b des nombres réels.
Les coefficients a et b sont déterminés à l’aide des formules suivantes :

x 2−x 1
a= et b= ý −a . x́
y 2− y 1

Application :
On donne dans le tableau ci-dessous l'ancienneté et les primes correspondantes de six cadres d'une
entreprise.

Ancienneté Xi 2 6 10 17 20 26
Prime Yi (en millions de F) 1,1 2,8 3,3 3,8 4 4,8

T.A.F :
1. Représenter graphiquement le nuage de points associé à cette série statistique et montrer que l’on
peut envisager un ajustement linéaire du nuage de points obtenus.
Echelle : 1 cm pour 2 ans en abscisse
1 cm pour 0,5 (en million de F en ordonnées
On fractionne le nuage en deux groupes : groupe 1 de point moyen G1 correspondant aux 3 premiers
couples et le groupe 2 de point moyen G2 correspondant aux 3 derniers couples.
2. Calculer les coordonnées des points moyens G1 et G2.
3. Déterminer une équation de la droite (G1G2)

11
a) Selon la tendance dégagée par la droite, déterminer la prime d’un cadre dont l’ancienneté est
30 ans.
b) La prime d’un cadre s’élève à 6 000 000 F, quel est le nombre d’années (ou ancienneté)
correspondant ?

2.1.2 Méthode des moindres carrés


2.1.2.1 Covariance d’une série à deux variables.
Etant donnée une série double (X, Y) de nuage de points M i (xi yi) la covariance des variables X et Y est
le nombre réel noté cov (X ,Y) et défini par ;
n n
1 1
Cov ( X ; Y ) = ∑ ( x i−x́ ) . ( yi − ý ) ou Cov ( X ; Y )= ∑ xi . y i−x́ . ý
n i=1 n i=1

2.1.2.2 Coefficient de corrélation.


Le coefficient de corrélation linéaire permet de mesurer le degré de liaison fonctionnelle qui existe
entre les deux variables de la série. Il permet donc d’apprécier la qualité l’ajustement. C’est le nombre
réel noté r et défini par la relation :

Cov (X ; Y )
r=
√ V ( X ) .V (Y )
Remarques :
(1) On a toujours −1 ≤r ≤ 1.
(2) Lorsque, 0,87 ≤|r|≤ 1, on dit qu’il y a une forte corrélation. Dans ce cas un ajustement
affine est justifié.

2.1.2.3 Equations des droites de régression


Par la méthode des moindres carrés, on distingue des droites d’ajustement :
 la droite d’ajustement de y en x ;
 la droite d’ajustement de x en y.

Propriétés :
(1) Une équation de la droite d’ajustement de y en x est Y =a . x +b avec :
Cov (X ; Y )
{a=
V ( X)
et b=Ý −a . x́

(2) Une équation de la droite d’ajustement de x en y est X =a' . y +b ' avec :


Cov( X ;Y )
{a' =
V (Y )
et b' = X́−a' . Ý

Remarque :
(1) les deux droites d’ajustement obtenues par la méthode des moindres carrés passent
par les points moyens du nuage.
Lorsque r = 1, les deux droites sont confondues et l’un ajustement est dit parfait.

12
Application :
Le tableau ci-dessous donne l’évolution du nombre de voitures (en milliers) vendues annuellement
entre 2013 et 2018, par un constructeur automobile.

Année 2013 2014 2015 2016 2017 2018


Rang xi de l’année 1 2 3 4 5 6
Nombre de voitures vendues yi
(en milliers) 14 22 28 33,5 38,5 41

1. Représenter le nuage de points associé à la série statistique (x,y) dans le plan muni d’un
repère orthogonal (O, I, J). On prendra 2 cm pour une année en abscisses et 1 cm pour 4000
voitures en ordonnées.

2. Calculer le coefficient de corrélation linéaire r entre les variables x et y à 10 -2 près. Interpréter


le résultat obtenu.
3. Déterminer une équation de la droite d’ajustement (D) de y en x par la méthode des
moindres carrés. Construire la droite (D).
4. En supposant que l’évolution se poursuit de la même façon dans les années à venir, donner
une estimation (en milliers) du nombre de voitures qui seront vendues par le constructeur en 2024.

13
THEME Année : 2020 - 2021
STATISTIQUE A DEUX
VARIABLES
Matière : STATISTIQUE Classe : LICENCE 1
UP MATHEMATIQUES Visa CM
TRAVAUX DIRIGES

Exercice 1 :
Le tableau ci-dessous donne l’évolution du nombre de voitures (en milliers) vendues annuellement
entre 1981 et 1986, par la firme JAGUAR.

Année 1981 1982 1983 1984 1985 1986


Rang xi de l’année 1 2 3 4 5 6
Nombre de voitures vendues yi (en
14 22 28 33,5 38,5 41
milliers)

1. Représenter le nuage de points associé à la série statistique (x ; y) dans le plan muni d’un
repère orthogonal (O, I, J). On prendra 2 cm pour une année en abscisses et 1 cm pour 4000
voitures en ordonnées.
2. Calculer le coefficient de corrélation linéaire r entre les variables x et y à 10 -2 près. Interpréter
le résultat obtenu.
3. Déterminer une équation de la droite d’ajustement (D) de y en x par la méthode des
moindres carrés. Construire la droite (D).
4. En supposant que l’évolution se poursuit de la même façon dans les années à venir, donner
une estimation (en millier) du nombre de voitures de marque JAGUAR qui seront vendues en 2008.

Exercice 2 :

14
Les services comptables de la société ZAN-VIH ont relevé le chiffre d’affaires annuel de la société
depuis huit années dans le tableau suivant, où x est le numéro d’ordre de l’année et y le chiffre
d’affaires en millions de francs.

Année 1998 1999 2000 2001 2002 2003 2004 2005


Rang xi 1 2 3 4 5 6 7 8
C A yi (106 F) 25 30 40 50 85 130 205 300

1. Construire dans un repère orthogonal le nuage de points associé à cette série statistique de
caractère (X, Y). Échelle : 1cm → 1an en abscisses et 1cm → 25×10 6 F en ordonnées.
Peut-on envisager un ajustement affine ? Justifier la réponse.
2. Reproduire et compléter le tableau ci- dessous (valeurs à 10 -3 près) :

Rang xi 1 2 3 4 5 6 7 8
zi = lnyi

3. Calculer le coefficient de corrélation linéaire r entre x et z. Que peut-on en déduire ?


4. a) Donner l’équation de la droite d’ajustement de z en x par la méthode des moindres carrés.
b) En déduire l’équation de la courbe d’ajustement du nuage initial, associé à l’ajustement
précédent, sous la forme : y = αekx où α et k sont des nombres réels déterminés à 10 -2 près.
5. En supposant que cette tendance se poursuit, déterminer le chiffre d’affaires espéré pour l’année
2006.

Exercice 3 :
Le tableau ci-dessous donne les sommes x i dépensées par mois en frais de publicité et le chiffre
d’affaires yi exprimés en millions de francs d’une entreprise au cours des sept derniers mois d’activités
de l’année 2007.
xi 3,1 3,3 2 3,7 2,5 3 4
yi 45 42 38 49 41 44 50

1. Représenter dans un repère orthogonal le nuage de points associé à cette série statistique.
2. Calculer les coordonnées du point moyen G et le placer dans le repère précédent.
3. Calculer le coefficient de corrélation linéaire r entre les variables x et y.
Un ajustement affine de ce nuage de points est-il envisageable ? Justifier.
4. Déterminer une équation de la droite de régression de y en x obtenue par la méthode des
moindres carrées.
5. En supposant que cette tendance se poursuive, donner une estimation du chiffre d’affaires de
cette entreprise pour une dépense de 6 700 000 F de publicité mensuelle.

Exercice 4 :
On donne dans le tableau ci-dessous l'ancienneté et les primes correspondantes de six cadres d'une
entreprise.

15
Ancienneté Xi 2 6 10 17 20 26
Prime Yi (en millions de F) 1,1 2,8 3,3 3,8 4 4,8

1. Représenter graphiquement le nuage de points associé à cette série statistique et montrer que l’on
peut envisager un ajustement linéaire du nuage de points obtenus.
Echelle : 1 cm pour 2 ans en abscisse et 1 cm pour 0,5 (en million de F en ordonnées) On fractionne
le nuage en deux groupes : groupe 1 de point moyen G1 correspondant aux 3 premiers couples et le
groupe 2 de point moyen G2 correspondant aux 3 derniers couples.
2. Calculer les coordonnées des points moyens G1 et G2
3. Déterminer une équation de la droite (G1 G2)
4. a) Selon la tendance dégagée par la droite, déterminer la prime d’un cadre dont l’ancienneté
est 30.
c) La prime d’un cadre s’élève à 6 000 000 F, quel est le nombre d’années (ou ancienneté)
correspondant ?

Exercice 5 :
Un chef d’entreprise a noté le nombre de fautes de frappe faites par son assistante ainsi que le nombre
de pages des documents qu’elle a saisi. Les résultats de huit observations sont consignés dans le
tableau suivant :

Nombre de pages des documents xi 1 3 5 7 8 9 11 12


Nombre de fautes de frappe yi 3 8 14 19 19 22 24 27

1. Dans un repère (O, I, J), représenter le nuage de points associé à cette série statistique double.
On prendra 1 cm pour une unité sur chaque axe.
2. Calculer les coordonnées du point moyen G du nuage. Placer G dans le repère (O, I, J).
3. Démontrer qu’une équation de la droite d’ajustement affine obtenue par la méthode de Mayer est
y = 2x + 3.
4. Selon l’ajustement précédent :
a) donner une estimation du nombre de fautes de frappe dans un document de 23 pages ;
b) donner une estimation du nombre de pages d’un document pour lequel l’assistante a fait
35 fautes de frappe.

16

Vous aimerez peut-être aussi