Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

4 Cours Statistiques

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 7

Lycée Rue Ahmed Amara Le Kef 4ème

Habib Gammar
Statistiques 1/7

I- Séries Statistiques Doubles :

 Exemple : Le tableau suivant donne le poids en Kg et la taille en cm d’un groupe de 10 enfants :

Pi 25 27 23 30 27 23 25 30 32 28
Ti 90 92 85 99 93 88 92 98 99 90

Le couple (P1 , T1 ) = (25,90) veut dire que l’enfant N°1 pèse 25 Kg et mesure 90 cm.
On a donc une population de 10 enfants sur laquelle on a observé simultanément les deux variables P et T.

 Définition : On dit qu’un couple (X,Y) de variables statistiques définies une série double si les deux
variables X et Y sont observés simultanément sur une même population.
La moyenne arithmétique des poids est : P = …………………………………….
 La moyenne arithmétique des Tailles est : T = …………………………………….
Placer dans un repère orthogonal l’ensemble des points M i (Pi , Ti ) :

99 Taille
98

93
G
92

90

88

85
Poids
O 23 24 25 26 27 28 29 30 31 32 33

 Définition : Soit une série statistique définie par deux variables X et Y . On désigne par x1 , x 2 ,......, x n

les valeurs de X et par y1 , y 2 ,......, y n celles de Y. Le plan étant rapporté à un repère orthogonal.

L’ensemble des points Mi (x i , yi ) ; i ∈ {1, 2,....., n} est appelé Nuage De Points.

Le point G(x , y) est appelé point moyen du nuage.

www.mathsplus.12r.org
Lycée Rue Ahmed Amara Le Kef 4ème
Habib Gammar
Statistiques 2/7

 Distributions marginales :
Soit le tableau statistique suivant : X : note en mathématiques ; Y : nombre de frères et sœurs. N = 100

Y
0 1 2 3 4 5 6 Totaux
X
[0,4[ 1 0 1 1 0 1 1
[4,8[ 2 2 4 3 3 4 2 20
[8,12[ 5 5 10 7 6 4 3
[12,16[ 2 3 5 5 4 4 2 25
[16,20[ 1 1 2 3 2 1 0
Totaux 11 22 15 8 100
Les totaux inscrits en marge de chaque tableau à double entrée définissent deux distributions marginales,
l’une associée à la première variable statistique et l’autre associée à la deuxième variable statistique.

X : Note en Maths [0,4[ [4,8[ [8,12[ [12,16[ [16,20[ Total


Distribution marginale de X
7
∑nij 20 25 10 100
j=1

Y : nombre de
0 1 2 3 4 5 6 Total Distribution marginale de Y
frères et soeurs
Effectif n • j 11 22 15 8 100

• Calcul de la moyenne ( X ) ; la variance ( V ( X ) ) et l’écart-type ( σ ( X ) )


p
∑ xi ni (2 × 5) + (6 × 20) + (10 × 40) + (14 × 25) + (18 × 10)
i =1
X = = = ...............................................................
N 100
p
∑xi2 ⋅ ni (2 2 × 5) + (6 2 × 20) + (10 2 × 40) + (14 2 × 25) + (18 2 × 10)
i =1 2 2
 V(X) = −X = − X = ................
N 100

 σ (X) = V(X) ≈ .............................................


q
∑ yi n i (0 × 11) + (1 × 11) + (2 × 22) + (3 × 19) + (4 × 15) + (5 × 14) + (6 × 8)
i =1
Y = = = ........................................
N 100
q
∑ yi 2 ⋅ n i (0 2 × 11) + (12 × 11) + (2 2 × 22) + ............ + (6 2 × 8)
i =1 2 2
 V(Y) = −Y = − Y = ......................
N 100

 σ (Y) = V(Y) ≈ ..........................................

www.mathsplus.12r.org
Lycée Rue Ahmed Amara Le Kef 4ème
Habib Gammar
Statistiques 3/7

II- Ajustement affine d’une série statistique double :


Lorsque le nuage des points, représentant graphiquement une série statistique à deux caractères X et Y,
a une forme allongée, on peut approcher la relation entre les deux variables X et Y par une relation affine
définie par : Y = aX + b ou X = a 'Y + b ' .
On appelle ajustement affine toute méthode permettant la détermination d’une telle relation.

1) Méthode de Mayer :
La méthode de Mayer consiste à :
• Partager le nuage de points en deux parties P1 et P2 situées de part et d’autre par rapport à une droite

parallèle à l’axe des ordonnées et contenant à peu prés le même nombre de points.
• Déterminer les points moyens respectifs G 1 et G 2 des parties P1 et P2 .

• La droite (G 1 G 2 ) est alors la droite d’ajustement affine du nuage de points représentant la série.

• La droite (G 1 G 2 ) est appelée droite de Mayer et passe par le point moyen G du nuage global.

 Exemple :
Le tableau ci-dessous présente la consommation de fuel d’une habitation en fonction de la température.

Température x i en °C -5 -3 -1 2 5 7 10 13
Consommation y i de fuel /24h en L 38 36 30 29 25 20 15 12

1) Compléter le nuage de points M ( x i , y i ) dans le repère ci-dessus.


2) Fractionner le nuage de points en deux parties égales.
3) Calculer les coordonnées du point moyen G 1 de la première partie du nuage.

www.mathsplus.12r.org
Lycée Rue Ahmed Amara Le Kef 4ème
Habib Gammar
Statistiques 4/7

−5 − 3 − 1 + 2 38 + 36 + 30 + 29
G1 ( ; ) alors G 1 (.................................... ; ......................................... )
4 4
4) Calculer les coordonnées du point moyen G 2 de la deuxième partie du nuage.

G 2 (.................................... ; ......................................... )

5) Tracer la droite (G 1 G 2 ) .

6) Calculer les coordonnées du point moyen G du nuage. G (.................................... ; ......................................... )

7) Déterminer l’équation réduite de la droite (G 1 G 2 ) . ( y = ax + b ).


y G1 − y G 2
a= = ........................................................................................................... ≈ −1, 45
x G1 − x G 2
b = y G1 − a ⋅ x G1 = ................................................................................................................. ≈ 30, 71 donc (G 1 G 2 ) : y = ..........................................

8) A partir de l’équation de la droite, donner une estimation de la consommation de fuel pour une
température de –10°C.

9) Déterminer graphiquement, à l’aide de la droite d’ajustement, la température pour une consommation


de 22L.

10) Retrouver le résultat précédent par le calcul à partir de l’équation de (G 1 G 2 ) .

2) Méthode des Moindres carrés :


On peut reconnaître la relation affine éventuelle entre les deux variables X et Y à l’aide d’un moyen non
graphique et en faisant intervenir deux paramètres statistiques à savoir : la covariance Cov(X, Y) et le
coefficient de corrélation linéaire r.
 Covariance : Soit une série statistique (X, Y) double définie par { x 1 ,.........., x n } et { y1 ,.........., y n }

observée sur une population de n individus. On appelle covariance du couple (X, Y) le réel :
n
1
Cov(X, Y) = ∑ x i yi − X Y = XY − X Y
n i=1

 Exemple : Soit la série statistique double définie par le tableau suivant, Compléter le tableau :

xi 2 5 3 1 1 4 2 3 ∑ xi = ...................... X = ...........................
yi 25 40 10 5 0 15 50 12 ∑ yi = ............................... Y = ..............................
x i yi 50 30 0 100 ∑ x i yi = ........................... XY = ..................................

Cov(X, Y) = XY − X Y = .....................................................................................................

www.mathsplus.12r.org
Lycée Rue Ahmed Amara Le Kef 4ème
Habib Gammar
Statistiques 5/7

 Exercice : Calculer la covariance de la série statistique double (X, Y) définie par :

xi 1 2 2 2 5
yi 7 8 9 5 8
X = ...................................................................................................................................

Y = ......................................................................................................................................

XY = .......................................................................................................................................

Cov(X, Y) = XY − X Y = ..............................................................................................................
 Coefficient de corrélation linéaire :
Cov(X, Y)
On appelle coefficient de corrélation linéaire le réel r défini par : r= ; r ∈ [−1,1]
σ(X) ⋅ σ(Y)
 Exercice :
Calculer le coefficient de corrélation linéaire r pour la série statistique suivante :
xi 1 2 3 4 5 6 7 8 9 10
yi 200 205 211 216 220 225 240 260 280 300

• X = ................................................................................... • Y = ...........................................................................................................
• XY = ...........................................................................................................................
• V(X) = ............................................................................................................................................

• V(Y) = ...............................................................................................................................................

• Cov(X, Y) = .............................................................................. • σ(X) = .......................................................... • σ(Y) = ..................................................................

• r = .....................................................................................................................

 Théorème :

X et Y deux variables statistiques observées sur une population d’effectif N.


 Si 0, 75 ≤ r ≤ 1 alors il y a une relation linéaire entre X et Y ; (Y = a X + b ; X = a ' Y + b ')

représentées graphiquement par deux droites passant par G(X , Y) .


Cov(X, Y)
 Y = a X + b : Droite de régression de Y en X avec a = et b = Y − aX .
V(X)
Cov(X, Y)
 X = a 'Y + b ' :Droite de régression de X en Y avec a ' = et b ' = X − a ' Y .
V(Y)

www.mathsplus.12r.org
Lycée Rue Ahmed Amara Le Kef 4ème
Habib Gammar
Statistiques 6/7

 Exercice :
Soit la série statistique suivante :

xi 100 150 200 300 500


yi 0,7 1 1,2 1,6 2,3

Donner les résultats arrondi à 10 −4 près si nécessaire.


1) Calculer le coefficient de corrélation linéaire r .
2) Existe-t-il une relation de type affine entre X et Y.
3) Déterminer une équation de la droite de régression de Y en X .
4) Pour x = 650 que peut-on prévoir pour y ?.
♦ Solution :
1
1) • X = (100 + 150 + 200 + 300 + 500 ) = 250 ;
5
1(
• V(X) = 100 2 + 150 2 + 200 2 + 300 2 + 500 2 ) − 250 2 = 20000
5
• σ(X) = 20000 ≈ 141, 4214
1
• Y= ( 0, 7 + 1 + 1, 2 + 1, 6 + 2,3) = 1,36 ;
5

• V(Y) =
1
( 0, 7 2 + 12 + 1, 2 2 + 1, 6 2 + 2,3 2 ) − 1, 36 2 ≈ 0,3064
5
• σ(Y) = 0,3064 ≈ 0,5535
1
• XY = ( (100 × 0, 7) + (150 × 1) + ( 200 × 1, 2) + (300 × 1, 6) + (500 × 2, 3) ) = 418
5
• Cov( X, Y ) = XY − X Y = 418 − 250 × 1,36 = 78

Cov( X, Y )
• r= ≈ 0,9965
σ(X )σ( Y )
2) r ≈ 0.9965 donc 0, 75 ≤ r ≤ 1 alors il existe une relation de type affine entre X et Y.
3) Equation de la droite de régression de Y en X : Y = aX + b
Cov( X, Y )
avec a = = 0, 0039 et b = Y − a X = 0,385
V(X)
4) Si x = 650 alors y = 0, 0039 × 650 + 0, 385 = 2,92

www.mathsplus.12r.org
Lycée Rue Ahmed Amara Le Kef 4ème
Habib Gammar
Statistiques 7/7

 Utilisation de la calculatrice : ( Exemple pour une calculatrice Sharp EL-531WH )


Le tableau suivant donne la distance de freinage d (en mètres) d’une voiture, en fonction de sa
vitesse v ( en kilomètres par heure )
v (km / h) 30 40 50 60 70 80
d ( mètres) 42 60 80 90 95 110

1) Calculer v , d , V(v) , V(d) , σ(v) , σ(d) , Cov(v, d) et le coefficient de corrélation linéaire entre v et d.
2) Déterminer une équation de la droite de régression de d en v ( d = a v + b ).
• Choisir le mode statistique double : MODE 1 1

• Entrer les données en tapant 30 STO 42 M+


40 STO 60 M+
50 STO 80 M+
60 STO 90 M+
70 STO 95 M+
80 STO 110 M+

• v: RCL 4 → v = 55

• d : RCL 7 → d = 79,5

• V ( v) : RCL 6 x2 = → V ( v ) = 291, 66

• V (d ) : RCL 9 x2 = → V (d ) = 511, 25

• σ ( v) : RCL 6 → σ ( v ) ≈ 17, 07

• σ (d ) : RCL 9 → σ (d ) ≈ 22, 61

• Cov( v, d ) : RCL ÷ × RCL 6 × RCL 9 = → Cov( v, d ) = 379,166 .

• r: RCL ÷ → r ≈ 0, 981

• a: RCL ) → a = 1,3

• b: RCL ( → b=8
• Donc : d = 1,3v + 8

www.mathsplus.12r.org

Vous aimerez peut-être aussi