STAT-Prev-Chap-22 2
STAT-Prev-Chap-22 2
STAT-Prev-Chap-22 2
Sophie PEREIRA
1
SERIES A 2 CARACTERES ET PREVISIONS
1. Séries à 2 caractères
2. L’ajustement linéaire
3. Méthode des moindres carrés
4. Méthode des points extrêmes
5. Méthode de Mayer
2
1. De quoi parle-t-on ?
2. Liaison statistique
3. Pondération
4. Vocabulaire
3
L’objet de l’analyse des données statistiques à 2
dimensions est de permettre de :
4
Les différents calculs sur ces données
statistiques à deux dimensions vont
permettre de saisir l’existence et l’intensité
de la liaison statistique entre les deux
caractères.
5
On distingue :
Les séries non pondérées
Les données sont rangées dans un tableau simple avec
o 2 caractères
o Aucun effectif de population
6
Les séries pondérées
Les données sont rangées dans un tableau à
double entrée ou tableau de contingence avec
o 2 caractères
o Des effectifs de la population
7
X et Y désignent les deux caractères
xi et yi sont les modalités (les différentes valeurs) des
2 caractères
N est l’effectif total de la population ;
n est le nombre de modalités quand la série
statistique est non pondérée
8
LES GRAPHIQUES :
FORMES POSSIBLES DES NUAGES DE POINTS
Les liaisons
entre x et y sont
mesurées par
un coefficient
de corrélation
qui indique
l’intensité de la
liaison linéaire
9
LES GRAPHIQUES : LA DROITE D’AJUSTEMENT
le nuage de points est remplacé par une droite nommée « droite
d’ajustement » si les points du nuage sont alignés. La droite
d’ajustement permet de faire une prévision.
10
Age Revenu Existe-t-il un lien statistique entre
annuel (€) l’âge et le revenu annuel ?
20 15 000
30 27 500 Si oui, quelle est la nature de ce
40 36 500 lien ? Est-ce que le revenu
augmente avec l’âge par exemple
50 38 200
? Peut-on exprimer ce lien grâce à
une fonction linéaire ?
11
Age Revenu X : l’âge
annuel (€)
est la variable explicative,
x y
on l’appelle la variable
20 15 000
indépendante
30 27 500
40 36 500
50 38 200 Y : le revenu annuel
Est la variable expliquée,
on l’appelle la variable
dépendante
12
Revenu annuel en fonction de l’âge
Age Revenu Revenu annuel (€)
annuel (€) 45 000
x y
40 000
35 000
20 15 000 30 000
30 27 500
25 000
20 000
40 36 500 15 000
50 38 200
10 000
5 000
0
0 10 20 30 40 50 60
13
1.Comment faire des prévisions ?
2.Qu’est ce que l’ajustement linéaire
3.Quelles sont les données statistiques
concernées
4.Comment fonctionnent les méthodes de
prévision ?
14
Trouver l’équation de la droite
Calculer
le coefficient directeur a
L’ordonnée à l’origine b
Incrémenter la valeur de x pour trouver le
nouvel y
15
y=ax+b
Ajuster (remplacer) le
nuage de points par la
droite qui passe « au
plus près » des points
16
Séries statistiques à 2 caractères non
pondérées
Corrélation forte entre les 2 caractères
Séries chronologiques
17
Méthodes fondées sur
L’analyse des données issues du passé.
L’analyse de la tendance générale de la série
L’hypothèse que les événements passés se
reproduisent dans le futur.
18
1.Calcul de la covariance
2.Calcul de la droite
d’ajustement
19
Dans l’équation 𝑦 = 𝑎𝑥 + 𝑏
𝑐𝑜𝑣 (𝑥,𝑦)
a=
𝑣(𝑥)
20
La covariance entre x et y, notée Cov(x,y), se définit comme la
moyenne arithmétique du produit des écarts (xi – x) et (yi – y).
C’est une sorte de variance pour les séries à 2
dimensions.
σ 𝑥𝑖𝑦𝑖
Ou 𝑐𝑜𝑣 𝑥, 𝑦 = − 𝑥𝑦
𝑛
21
Age Revenu Rappel des 2 formules
annuel (€) 1
1/ 𝑐𝑜𝑣 𝑥, 𝑦 = × σ 𝑥𝑖 − 𝑥 × (𝑦𝑖 − 𝑦)
x y 𝑛
σ 𝑥𝑖𝑦𝑖
20 15 000 2/ 𝑐𝑜𝑣 𝑥, 𝑦 = − 𝑥𝑦
𝑛
30 27 500
40 36 500 Etape 1 : calcul des 2 moyennes
50 38 200 𝑥 = (20+30+40+50)/4 = 35
𝑦 = (15000+27500+36500+38200)/4 = 29 300
Formule 2
Cov (x,y) = [(20x15000 + 30x27500 + 40x36500 + 50x38200)/4]
– 35x29300 = 98 250
22
σ 𝑛𝑖𝑥𝑖²
𝑣 𝑥 = − 𝑥²
𝑁
σ 𝑥𝑖²
𝑣 𝑥 = − 𝑥²
𝑛
23
Age Revenu
annuel (€)
x y
σ 𝑥𝑖²
20 15 000 Où 𝑉 𝑥 = − 𝑥²ҧ
𝑛
30 27 500
40 36 500
50 38 200
24
Dans l’équation 𝑦 = 𝑎𝑥 + 𝑏
y= 786 𝑥 + 1790
26
y= 786 𝑥 + 1790
Si 𝑥 = 53
27
Les étapes de calcul
Illustration
28
Etape 1 : Identifier les 2 points extrêmes de la série A et B
avec A(𝑥𝐴 ; 𝑦𝐴) et B (𝑥𝐵 ; 𝑦𝐵)
𝑦𝐵 −𝑦𝐴
Etape 2 : on trouve a => 𝑎=
𝑥𝐵 −𝑥𝐴
2 2700 2. Trouver a
3 2750 2860 − 2500
4 2860 𝑎=
4−1
= 120
3. Trouver b
y= 120 𝑥 +2380
Années CA Pour réaliser la prévision
On remplace le x par la valeur
1 2500 suivante dans l’équation :
2 2700
y= 120 𝑥 +2380
3 2750
4 2860 y = 120 x 5 + 2380 = 2 980
𝑦𝐵 −𝑦𝐴
Etape 2 : on trouve a => 𝑎 =
𝑥𝐵 −𝑥𝐴
Fiche d’entraînement
36