Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Échantillonnage Et Estimation

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 26

Echantillonnage

Estimation ponctuelle:
Estimation par intervalle de confiance

Echantillonnage et estimation des paramètres

HDHIRI I.
GM1

2019-2020

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Echantillonnage et estimation des paramètres

Etude Statistique = Etude des caractéristiques (variables


statistiques) d’une population.
L’inférence statistique est définie comme le processus
d’utilisation des données d’un échantillon pour estimer ou
tester des hypothèses sur les caractéristiques numériques («
paramètres ») d’une population.
Une population (ou « population mère ») est l’ensemble de
tous les éléments d’intérêt dans une étude particulière.
Un échantillon est un sous-ensemble de la population.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Pourquoi un échantillon? Le recensement de toute la population


est coûteux, long, impossible (population infinie), mesures
destructrices ..
⇒ On n’étudie qu’une partie de la population : un échantillon. On
cherche alors à extrapoler à la population entière les propriétés
mises en évidence sur l’échantillon :

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Méthode d’échantillonnage aléatoire:principe Soit une


population de N unités statistiques (objets, individus) sur laquelle
nous désirons prélever un échantillon de taille n. Nous supposons
que l’on dispose d’une liste de toutes les unités qui constituent la
population, sans omission, ni répétition. Cette liste est la base de
sondage. Une façon de construire un échantillon est d’attribuer à
chaque unité de la population un numéro unique et prélever ensuite
par tirage au sort, n numéros. Les unités correspondantes à ses
numéros constituent l’échantillon requis.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Principe de la construction d’un échantillon:


Pour construire un échantillon aléatoire le tirage peut s’effectuer
de deux manières:
Tirage sans remise: les unités tirées ne sont pas remises dans
la population. Chaque unité figure au plus une fois dans la
population. La composition de la base d’échantillonnage varie
à chaque tirage.
Tirage avec remise: chaque unité tirée au hasard dans la base
de sondage est observée puis remise à la population avant
qu’une autre unité ne soit tirée. Une unité peut être désignée
plusieurs fois. La composition de la base d’échantillonnage est
inchangée.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Les méthodes aléatoires : Reposent sur le tirage au hasard


d’échantillons et sur le calcul des probabilités.
Echantillonnage aléatoire simple : On prélève dans la
population, des individus au hasard, sans remise
Echantillonnage aléatoire stratifié : Suppose que la population
soit stratifiée, i.e. constituée de sous-populations homogènes,
les strates. (ex : stratification par tranche d’age). Dans
chaque strate, on fait un échantillonnage aléatoire simple, de
taille proportionnelle à la taille de strate dans la population
(échantillon représentatif)
Echantillonnage par grappe : on tire au hasard des grappes ou
familles d’individus, et on examine tous les individus de la
grappe.
Dans toute la suite du cours, on se place dans le cadre d’un
échantillonnage aléatoire simple, sauf mention contraire.
HDHIRI I.GM1 Echantillonnage et estimation des paramètres
Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Soit une population de taille N sur laquelle est observée une


caractéristique dont on connaît la moyenne µ et la variance σ 2 . On
supposera que la taille de la population est infinie, ou que le taux
de sondage est faible.
Si on prélève n individus dans cette population, on obtient n
valeurs x1 , x2 , ..., xn .
L’observation xi peut être considérée comme une observation
d’une variable aléatoire Xi de même loi que X;

Definition
Les v.a. (X1 , X2 , ...., Xn ) sont indépendantes et de même loi.
Elles constituent un échantillon
Toute application définie sur l’échantillon est appelée
statistique

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Exemples de statistiques:
Moyenne d’échantillon : X n = n1 (X1 + ... + Xn )
1 Pn 2
Variance de l’échantillon: Σ2n = n i=1 (Xi − X n)
1 Pn 2
Variance corrigée de l’échantillon: Sn2 = n−1 i=1 (Xi − X n)

Remarque
Il ne faut pas confondre ces statistiques qui sont des v.a., donc des
applications avec les valeurs prises par ces applications sur un
ensemble de n individus qui sont des valeurs numériques.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Paramètres de la distribution de X n : La moyenne d’échantillon


suit une loi de probabilité dont la moyenne est:

E (X n ) = E (X ) = µ

et la variance
σ2
Var (X n ) =
n
L’écart-type de la moyenne appelé également erreur-type de la
moyenne est donné par
σ
σ(X n ) = √
n
.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Théorème central limite: Si des échantillons aléatoires de taille n


sont prélevés d’une population infinie dont les éléments possèdent
un caractère mesurable X de moyenne E (X ) = µ et de variance
Var (X ) = σ 2 , alors la distribution de X n tend à se rapprocher
2
d’une loi Normale de moyenne µ et de variance σn ou encore
Xn − µ
Loi( ) → N (0, 1),
√σ
n
et ce d’autant plus que la taille de l’échantillon est grande.
Remarque
On peut appliquer le théorème central limite dès que
l’échantillon dépasse 30 observations.
Ce théorème est très puissant car il n’impose aucune
restriction sur la distribution de X dans la population
Si σ 2 est inconnu, un grand échantillon (n ≥ 30) permet
1 Pn 2
d’approcher σ 2 par sn2 = n−1 i=1 (xi − x )
HDHIRI I.GM1 Echantillonnage et estimation des paramètres
Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Paramètres de la distribution de Sn2 On a:

E [Sn2 ] = σ 2 ; Var (Sn2 ) −→n→∞ 0,

Si X ∼ N (µ, σ 2 ) alors
Pn 2
(n − 1)Sn2 i=1 (Xi − X n)
= suit la loi χ2n−1
σ2 σ2
et
− µ)2
Pn
i=1 (Xi
suit la loi χ2n .
σ2

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Distribution d’échantillonnage d’une proportion: On cherche à


étuduer la proportion p d’individus possédant un caractère
qualitatif donné. La proportion f obtenue dans un n-échantillon est
la valeur observée d’une variable aléatoire F , appelée proportion
d’échantillon.
On a:
1
F = (X1 + ...Xn );
n
où Xi suivent des lois de Bernouilli de paramètre p D’où

p(1 − p)
E [F ] = p, Var (F ) =
n
et d’après T.C.L,
√ F −p
np → N (0, 1).
p(1 − p)

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Estimation des paramètres

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

On s’intéresse à la caractéristique X d’une population, dont la


loi dépend d’un paramètre inconnu θ. On note fθ (x ) la densité
de X si X est continue et Pθ (X = x ); x ∈ R, la loi de X si X
est discrète.
Estimer le paramètre θ consiste à donner une valeur approchée
à ce paramètre à partir d’un sondage de la population.
On dispose d’un sondage de taille n de la population
(l’observation de X sur n individus) , noté (x1 , ...xn ) et on
note (X1 , ...Xn ) l’échantillon aléatoire associé à ce sondage (il
s’agit d’un vecteur aléatoire dont une réalisation particulière
est (x1 , ...xn )).

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Lorsque un paramètre θ d’une population est estimé par un seul


nombre, déduit des résultats de l’échantillon, ce nombre est appelé
une estimation ponctuelle du paramètre θ.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Definition
Un estimateur Tn de θ est une statistique de l’échantillon
aléatoire Tn = h(X1 , ..., Xn ): telle que pour chaque réalisation
(x1 , ...xn ) de l’échantillon aléatoire, la valeur h(x1 , ...xn ) prise
par Tn approche θ.
θbn := h(x1 , ...xn ) s’appelle une estimation de θ. C’est une
réalisation particulière de l’estimateur Tn .

Exemple:
Un estimateur ponctuel de la moyenne µ d’une population est
la moyenne de l’échantillon X n .
Un estimateur ponctuel de la proportion P possèdant un
caractère qualitatif, est la proportion F de l’échantillon.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Soit Tn un estimateur de θ
Estimateur convergent: Tn est dit convergent si ∀ > 0,

P[|Tn − θ| > ] →n→∞ 0.

D’après l’inégalité de Markov, on a si E [Tn ] →n→∞ θ alors Tn est


convergent
Ecart quadratique: E [|Tn − θ|2 ] = Var (Tn ) + [E (Tn ) − θ]2
| {z }
Biais

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Un estimateur ponctuel doit posséder certaines qualités pour


fournir des bonnes estimation, nous le résumons comme suit.
Estimateur non biaisé: un estimateur Tn de θ est dit non
biaisé ou sans biais si E (T
cn ) = θ.
Exemple:
X n est un estimateur sans biais de µ: E [X n ] = µ
Σ2 est un estimateur biaisé de σ 2 : E [Σ2 ] = n−1
n σ
2

Estimateur efficace: Le choix parmi plusieurs estimateurs


sans biais s’effectue en comparant les variances des
estimateurs. Un estimateur sans biais mais de variance élevée
peut fournir des estimations très éloignées de la vraie valeur.
Un estimateur sans biais est plus efficace si sa variance est la
plus faible parmi celles des autres estimateurs sans biais.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Estimation par intervalle de confiance:


L’estimation par intervalle de confiance d’un paramètre inconnu
consiste à calculer à partir d’un estimateur choisi, un intervalle
dans lequel il est vraisemblable que la valeur correspondante du
paramètre s’y trouve. L’intervalle de confiance est défini par deux
limites auxquelles est associée une certaine probabilité, fixée à
l’avance.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Il s’agit de construire une « fourchette de valeurs numériques


permettant de situer » θ avec une probabilité 1 − α.

P[a < θ < b] = 1 − α.

1 − α est dit degré de confiance.


La démarche comprend deux étapes :
avant le tirage d’un échantillon de taille n, un estimateur T a
été choisi et la loi de probabilité de T permet de construire un
intervalle aléatoire susceptible de contenir la valeur du
paramètre θ avec une probabilité 1 − α fixée a priori.
après le tirage, la valeur particulière t T calculée à partir des
données de l’échantillon permet de déterminer les bornes de
l’intervalle de confiance recherché

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

On parlera :
d’intervalle bilatéral symétrique si : α1 = α2 = α/2
d’intervalle bilatéral si α1 > 0 α2 > 0
d’intervalle unilatéral à gauche si α2 = 0
d’intervalle unilatéral à droite si α1 = 0
Lorsque l’estimateur est sans biais, il est naturel de construire un
intervalle centré sur l’estimation ponctuelle obtenue pour θ.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Estimation de la moyenne d’une population normale de


variance connue: A partir d’un échantillon aléatoire de taille n
d’une population normale de variance connue σ 2 . On a
X n −µ
√σ v N (0, 1)
n

h σ σ i
P µ ∈]X n + u α2 ( √ ), X n − u α2 ( √ )[ = 1 − α.
n n

Ainsi, on définit un intervalle de confiance ayant un degré de


confiance (1 − α) de contenir la vraie valeur de µ comme suit:
σ σ
X n + u α2 ( √ ) < µ < X n − u α2 ( √ ).
n n

La marge d’erreur est |X n − µ| < |u α2 ( √σn )|

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

N (0, 1)

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Application: On cherche un intervalle de confiance bilatéral


symétrique de degré de confiance 95% de la moyenne µ d’une
population de loi normale dont l’écart type est σ = 2. On prélève
dans cette population un échantillon de taille n = 100 et on calcule
sa moyenne x n = 10.
On a α = 0.05, d’où u α2 = −1.96. D’où
h σ σ i
P µ ∈]X n − 1.96( √ ), X n + 1.96( √ )[ = 1 − α.
n n

Ainsi l’intervalle
q de confianceq
de µ de degré de confiance 95% est:
2 2
]10 − 1.96( 100 ), 10 + 1.96( 100 )[=]9.61, 10.39[.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres


Echantillonnage
Estimation ponctuelle:
Estimation par intervalle de confiance

Estimation par intervalle de confiance de la moyenne d’une


population lorsque la variance de la population est inconnue:
On a dans ce cas, X√nS−µ suit la loi de Student T (n − 1). D’où
n−1

 S S 
P µ ∈ [X n + t α2 ( √ ), X n − t α2 ( √ )] = 1 − α.
n−1 n−1
où t α2 est lue sur la table de Student.

HDHIRI I.GM1 Echantillonnage et estimation des paramètres

Vous aimerez peut-être aussi