td10 11!!!!!!!!!!!
td10 11!!!!!!!!!!!
td10 11!!!!!!!!!!!
2010-2011
Feuille de TD no 1
Estimation, tests et régions de confiance
Exercice 1
Soit (X1 , ..., Xn ) un n-échantillon de la loi uniforme sur [0, θ], où θ > 0 est inconnu.
1. (a) Calculer Eθ (X1 ) et en déduire un estimateur θbn de θ par la méthode des moments.
(b) Calculer l’estimateur du maximum de vraisemblance θen de θ.
(c) Les estimateurs θbn et θen sont-ils biaisés ?
(d) Comparer les risques quadratiques de θbn et θen .
√
(e) Etudier la convergence en loi de n(θbn −θ) et de n(θen −θ) lorsque n tend vers l’infini.
2. Soit θ0 > 0. On souhaite tester H0 : “θ = θ0 ” contre H1 : “θ 6= θ0 ”.
(a) Construire un test de niveau α en utilisant l’estimateur θen . Tracer la courbe de
puissance de ce test.
(b) Construire un test de niveau asymptotique α en utilisant l’estimateur θbn et une
approximation gaussienne.
Exercice 2
Soit (X1 , ..., Xn ) un n-échantillon de la loi uniforme sur [θ − 12 , θ + 21 ], où θ est un réel inconnu.
L’estimateur du maximum de vraisemblance de θ est-il bien défini ?
Exercice 3
Soit X : (Ω, A) → (E, E) une variable aléatoire dont la loi appartient à une famille donnée
{Pθ , θ ∈ Θ}. La vraie valeur du paramètre de la loi de X, notée θ, est inconnue.
1. On dispose d’une région de confiance I(X) de coefficient de sécurité 1 − α pour θ. Pour
tout θ0 ∈ Θ, construire un test de niveau α de H0 (θ0 ) : “θ = θ0 ” contre H1 (θ0 ) : “θ 6= θ0 ”.
2. Pour tout θ0 ∈ Θ, on dispose d’un test de niveau α de H0 (θ0 ) : “θ = θ0 ” contre H1 (θ0 ) :
“θ 6= θ0 ”. Construire une région de confiance I(X) de coefficient de sécurité 1 − α pour θ.
Exercice 4
Soit (X1 , ..., Xn ) un n-échantillon de la loi uniforme sur [0, θ], où θ > 0 est inconnu. En utilisant
l’exercice 3 et la question 2a de l’exercice 1, construire un intervalle de confiance pour θ de
coefficient de sécurité 1 − α.
Exercice 5
Quelques rappels de probabilités utiles en statistique asymptotique. On suppose dans toute la
suite que (Xn )n∈N est une suite de variables aléatoires dans Rd , convergeant en loi vers une v.a.
X.
1. Soit g une fonction continue en tout point d’un sous-ensemble C de Rd tel que P(X ∈
C) = 1. Montrer que (g(Xn ))n∈N converge en loi vers g(X).
2. Dans cette question, on suppose que X est constante p.s, égale à 0. Soit g une fonction
de Rd dans Rk telle que g(h) = o(khkp ) au voisinage de 0, pour un entier p > 0. Montrer
que g(Xn ) = oP (kXn kp ), c’est à dire qu’il existe une variable aléatoire réelle Yn dans Rk ,
convergeant vers 0 en probabilité, telle que g(Xn ) = Yn kXn kp .
3. Soit (Yn )n∈N une suite de variables aléatoires dans R, convergeant en loi vers une constante
c. Montrer que Xn .Yn converge en loi vers X.c.
4. Soit rn une suite de réels tendant vers +∞ et θ ∈ Rd tel que rn (Xn − θ) converge en
loi vers une variable aléatoire T . Soit g de Rd dans Rk , une fonction différentiable en θ.
Montrer que rn (g(Xn ) − g(θ)) converge en loi vers la variable aléatoire Dgθ (T ).
Exercice 6
Soit (X1 , ..., Xn ) un n-échantillon de la loi de Poisson de paramètre inconnu θ > 0.
1. Estimer θ. On notera θbn l’estimateur proposé.
2. Déterminer la loi limite de θbn − θ convenablment renormalisé (de sorte que la loi limite
ne soit pas triviale), puis construire un intervalle de confiance asymptotique de coefficient
de sécurité 1 − α pour θ.
3. Proposer un estimateur asymptotiquement sans biais et consistant de Pθ (X1 = 0).
Exercice 7
Soit (X1 , ..., Xn ) un n-échantillon de la loi Gaussienne N (µ, σ 2 ), où µ ∈ R et σ > 0. On note
n n
1X 1X
µ
bn = Xi et bn2 =
σ bn )2 .
(Xi − µ
n n
i=1 i=1
(les réalisations de µ
bn et de σ
bn sont ici 0.1171 et 0.8955).
Statistiques
2010-2011
Feuille de TD no 2
Tests non paramétriques
Exercice 8
Soit (X1 , . . . , Xn ) un n-échantillon. On note Fn la fonction de répartition empirique associée :
n
1X
∀t ∈ R, Fn (t) = 1IXi 6t .
n
i=1
1. Soit (U1 , ..., Un ) un n-échantillon de la loi uniforme sur [0, 1] et F une fonction de répartition.
On note Un la fonction de répartition empirique associée à (U1 , ..., Un ), X une variable
aléatoire de fonction de répartition F et F −1 l’inverse généralisé de F :
Exercice 9
Soient (X1 , . . . , Xn ) un n-échantillon d’une loi continue µ et (Y1 , . . . , Ym ) un m-échantillon
d’une loi ν, indépendant de (X1 , ..., Xn ). On note Fn la fonction de répartition empirique de
(X1 , ..., Xn ), Gm la fonction de répartition empirique de (Y1 , ..., Ym ) et on définit
Exercice 10
Soit X une variable aléatoire de fonction de répartition inconnue F , et soit (X1 , ..., Xn ) un
n-échantillon de la loi de X. Pour tout θ > 0, on note Fθ la fonction de répartition définie par
Fθ (x) = (1 − exp(−x/θ)) 1Ix>0 .
1. On suppose que F ∈ F, où F = {Fθ , θ > 0}. Déterminer l’estimateur T du maximum de
vraisemblance de θ, puis construire un test de θ = 100 contre θ 6= 100 au niveau 5%.
2. On note Fn la fonction de répartition empirique de (X1 , ..., Xn ), et on définit
Exercice 11
Partant de races pures, Bauer a croisé des mufliers ivoires avec des mufliers rouges. A la deuxième
génération, après autofécondation des plantes de la première, il a obtenu 22 mufliers rouges,
52 pâles et 23 ivoires. Si la couleur des fleurs est gérée par un couple d’allèles, la probabilité
théorique d’obtenir une fleur rouge (resp. pâle, resp. ivoire) est de 1/4 (resp. 1/2, resp. 1/4).
Que conclure ?
Statistiques
2010-2011
Feuille de TD no 3
Modèles linéaires gaussiens
Exercice 12
Soient n1 et n2 des entiers positifs. On observe Yij (i = 1, 2, j = 1, ..., ni ) où pour tout (i, j), Yij
est de loi N (µi , σi2 ), µi et σi étant inconnus. Les variables Yij sont supposées indépendantes.
1. Tester l’égalité des variances σ12 et σ22 .
2. On suppose ici les variances égales.
(a) Ecrire le modèle sous forme matricielle.
(b) Estimer les paramètres du modèle.
(c) Construire le test de Fisher de l’hypothèse H0 : ”µ1 = µ2 ” contre H1 : ”µ1 6= µ2 ”.
3. On traite 12 parcelles de terrain identiques avec un engrais A et 12 autres avec un nouvel
engrais B. On obtient avec A une production moyenne de 4,8 quintaux avec un écart-type
empirique observé égal à 0,36. Les quantités correspondantes pour B valent 5,1 et 0,4. On
modélise cette expérience comme ci-dessus. Tester l’égalité des variances et des espérances
pour A et B, au niveau 10%.
Exercice 13
Soit p un entier positif, et pour tout i = 1, ..., p, soit ni un entier positif. On suppose le modèle
linéaire suivant régulier.
Les xij sont des réels fixés et les εij sont des variables aléatoires indépendantes entre elles, de
loi N (0, σ 2 ). Les paramètres ai , bi (i = 1, ..., p) et σ sont inconnus.
1. Estimer les paramètres du modèle.
2. Tester l’égalité des droites de régression (d’équations respectives y = ai + bi x).
3. On suppose les droites de régression identiques. Le modèle s’écrit alors Yij = a + bxij + εij .
(a) Déterminer les estimateurs du maximum de vraisemblance des paramètres.
(b) Construire une région de confiance avec coefficient de sécurité 1 − α (α ∈]0, 1[) pour
le paramètre (a, b).
(c) Tester l’hypothèse “la droite de régression passe par le point (x0 , y0 )”, où x0 et y0
sont des réels fixés.
4. Application :
Des photographies aériennes de champs d’orge sont analysées au photomètre, qui mesure
la brillance de chaque champ. On recherche la relation entre les rendements des parcelles
et la brillance, en tenant compte de l’application d’un fongicide sur certaines parcelles
pour combattre le mildiou. On considère le modèle linéaire décrit ci-dessus en (1), où
xij désigne la brillance du jème champ soumis au fongicide i, et Yij représente le ren-
dement de ce champ. Les données sont dans le fichier fongicide.dat, sous la forme
(rendement, brillance, fongicide).
(a) Tracer sur un même graphe les rendements en fonction de la brillance, en distinguant
avec deux couleurs différentes selon le groupe (i.e avec ou sans fongicide).
(b) Vérifier rapidement l’allure des résidus.
(c) Tester l’absence d’effet du fongicide sur le rendement.
(d) Estimer les paramètres du modèle (donner des intervalles de confiances).
Exercice 14
Soient p, q et r des entiers strictement supérieurs à 1. Pour tout i ∈ {1, ..., p}, j ∈ {1, ..., q} et
k ∈ {1, ..., r} (k est un indice de répétition), on observe Yi,j,k = mi,j + εi,j,k , où les variables
εi,j,k sont indépendantes, de loi N (0, σ 2 ), σ 2 étant inconnu. On considère un modèle d’analyse
de la variance à deux facteurs complet et équilibré, c’est-à-dire qu’on suppose qu’il existe µ, αi ,
βj et γi,j (inconnus) tels que
1. Dans un modèle linéaire non régulier Y = Xβ + ε, on dit que Lβ = 0 est une contrainte
d’identifiabilité si L est une application linéaire et si pour tout m de l’image de X, il existe
un unique β tel que Xβ = m et Lβ = 0. Vérifier que C est une contrainte d’identifiabilité.
2. Estimer les paramètres du modèle.
3. Tester les hypothèses suivantes :
(a) absence d’effet du facteur j (i.e. βj = 0 et γij = 0 pour tout (i, j))
(b) absence d’effet du facteur i (i.e. αi = 0 et γij = 0 pour tout (i, j)).
(c) absence d’interaction (i.e. γij = 0 pout tout (i, j)).
4. Application :
Une expérience est destinée à étudier l’adaptation de deux variétés de moutarde à la
sécheresse. On a un dispositif à 4 traitements différents dérivant de 2 variétés (Clause et
Gisilba) notées A et B et de 2 intensités lumineuses (29000 lux et 8000 lux) notées X et
Y. On dispose de 4 plants pour chacun des traitements AX, AY, BX et BY. Un indicateur
de l’adaptation à la sécheresse est l’apparition de racines courtes tubérisées. Le tableau
suivant indique le nombre observé de ces racines.
AX : 78 79 44 77
AY : 64 96 30 20
BX : 137 85 302 315
BY : 64 67 102 47
Feuille de TD no 4
Affinités et risque minimax
Exercice 16
Pour tout couple de réels (µ, µ′ ), on note h(µ, µ′ ) la distance de Hellinger entre la loi gaussienne
d’espérance µ et de variance 1 et la loi gaussienne d’espérance µ′ et de variance 1. On note
ρ(µ, µ′ ) l’affinité de Hellinger entre ces deux lois.
1. Montrer que pour tout couple de réels (µ, µ′ ),
′ 1 ′ 2
ρ(µ, µ ) = exp − (µ − µ ) .
8
Exercice 17
Soient µ et µ′ deux réels strictement positifs. On note ρ(µ, µ′ ) l’affinité de Hellinger entre la loi
uniforme sur l’intervalle [0, µ] et la loi uniforme sur l’intervalle [0, µ′ ].
1. Montrer que
′ |µ − µ′ | 1/2
ρ(µ, µ ) = 1 − .
µ ∨ µ′
2. Soient µ > 0, λ ∈]0, 1[ et cn ∈ R. On souhaite tester H0 : “θ = µ” contre H1 : “θ = µ + cn ”
sur la base de l’observation d’un n-échantillon (X1 , ..., Xn ) de la loi uniforme sur l’intervalle
[0, θ]. Donner une condition nécessaire puis une condition suffisante sur cn pour qu’il existe
un test ϕn tel que Eµ (ϕn ) + Eµ+cn (1 − ϕn ) 6 λ.
Exercice 18
Soient w une application bijective croissante et concave de [0, 1] sur [0, 1] et Hw la famille des
fonctions f définies sur [−1, 1] telles que |f (t)−f (0)| 6 w(|t|) pour tout t ∈ [−1, 1]. On considère
le modèle suivant
Yi = f (i/n) + εi , i ∈ Z(n) = Z ∩ [−n, n],
où f est une fonction inconnue définie sur [−1, 1] dont on sait qu’elle appartient à Hw , et
ε−n , . . . , εn sont indépendantes et de même loi normale centrée et réduite. On souhaite étudier
le risque quadratique minimax Rn (Hw ) pour l’estimation de f (0) sur la base des observations
Y−n , . . . , Yn :
Rn (Hw ) = inf sup Ef (T − f (0))2 ,
T f ∈Hw
On définit H(n) = sup{H 6 n : (2H + 1)w2 (H/n) 6 1}. On suppose n assez grand pour
que w2 (1/n) 6 1/3.
(a) Vérifier que 1 6 H(n) < n.
(b) Vérifier que fH ∈ Hw pour tout entier positif H 6 n. En déduire que
1
Rn (Hw ) > w2 (H(n)/n).
8
h 2α i
(c) Soit 0 < α 6 1 et w(t) = tα , t ∈ [0, 1]. Démontrer que lim inf n n 2α+1 Rn (Hw ) > 0.
3. Soient 0 < α 6 1 et w(t) = tα , t ∈ [0, 1]. Soit (hn )n∈N une suite de nombres réels positifs
tels que :
hn −−→ 0 et nhn −−→ ∞ .
n∞ n∞
i
On pose xi = n et :
n
X
1
fb(0) = Yi 1I|xi |6hn .
2⌊nhn ⌋ + 1
i=−n
Trouver (hn )n∈N de sorte que fb(0) soit un estimateur minimax, à une constante multi-
plicative près, de f (0).
Statistiques
2010-2011
Feuille de TD no 5
Estimateurs bayesiens
Exercice 19
Soit (X1 , . . . , Xn ) un n-échantillon de la loi N (0, σ 2 ) et soit θ = σ −2 le paramètre à estimer.
On considère la loi a priori
Exercice 20
Soit (X1 , ..., Xn ) un n-échantillon de loi de Poisson de paramètre θ inconnu.
1. Calculer l’espérance et la fonction de risque quadratique de X.
2. Calculer l’estimateur de Bayes T de θ relatif au risque quadratique et à la loi a priori
Γ(h, a).
3. Comparer les fonctions de risque de X et T.
4. Montrer que T est admissible.
Exercice 21
Soient (X1 , ..., Xn ) un n-échantillon de loi uniforme sur {1, 2, . . . , θ} et p ∈]0, 1[.
1. Calculer l’estimateur de Bayes T de θ relatif au risque quadratique et à la loi a priori
définie par : ∀θ ∈ N∗ , ν(θ) = Cp θn pθ .
2. Cet estimateur est-il admissible ?
Exercice 22
Soit X une variable aléatoire réelle et α ∈]0, 1[. On pose, pour tout a ∈ R :
et
Fα (a) = E[(X − a)− ] + αE[X − a] .
2. Montrer que pour tous réels a 6 b,
Fα (a) − Fα (b) = E[(X − a) 1IX∈]a,b[ ] + (b − a)(P(X > b) − (1 − α)) ,
et
Fα (b) − Fα (a) = E[(b − X) 1IX∈]a,b[ ] + (b − a)(P(X 6 a) − α) .
3. On dit que q ∈ R est un quantile d’ordre α de X si et seulement si :
P(X 6 q) > α et P(X > q) > 1 − α .
Montrer que :
Fα (q) = min Fα (a) ⇐⇒ q est un quantile d’ordre α de X .
a∈R
4. On dit que m est une médiane de X si c’est un quantile d’ordre 1/2 de X. En déduire
que les médianes de X sont les réels qui minimisent a 7→ E[|X − a|].
Exercice 23
Soit (X1 , ..., Xn ) un n-échantillon de la loi N (θ, 1), θ ∈ R. Calculer l’estimateur de Bayes Tσ
de θ relatif à la loi a priori N (0, σ 2 ) et à la perte l(θ, θ′ ) = |θ − θ′ |.
Exercice 24
On observe X, dont la loi est de la forme Pθ pour un paramètre θ ∈ Θ inconnu. On souhaite
estimer g(θ) sur la base de l’observation X, où g est définie sur Θ et à valeurs réelles. On
considère la fonction de perte l et la loi a priori ν sur Θ.
1. On suppose qu’il existe un estimateur bayesien de risque constant, relatif à ν et l. On note
T (X) cet estimateur.
(a) Montrer que T (X) est minimax relativement à la perte l.
(b) Montrer que ν est la loi a priori “la moins favorable”, c’est-à-dire que si µ désigne
une autre loi a priori,
inf Rν (U ) > inf Rµ (U ),
U U
où l’inf est étendu à l’ensemble des estimateurs U (X) et où pour toute loi a priori τ ,
Z
τ
R (U ) = Eθ [l(g(θ), U (X))] dτ (θ).
Θ
2. Dans cette question, X = (X1 , . . . , Xn ) est un n-échantillon de la loi de Bernoulli de
paramètre inconnu θ ∈]0, 1[. On considère la fonction de perte définie par
(θ − a)2
l(θ, a) =
θ(1 − θ)
P
et on note X̄ = ni=1 Xi /n. On souhaite estimer θ.
(a) Montrer que X̄ est bayesien relativement à l et à la loi a priori uniforme sur ]0, 1[.
(b) Montrer que X̄ est de risque constant.
(c) En déduire que X̄ est minimax et que la loi uniforme sur ]0, 1[ est la loi a priori la
moins favorable.
Indication : Pour la question 2(a),
R 1 on pourra utiliser la propriété suivante. Si pour tout a > 0
et tout b > 0, on note B(a, b) = 0 x (1 − x)b−1 dx, alors
a−1
Γ(a)Γ(b)
B(a, b) =
Γ(a + b)
R∞
où pour tout b > 0, Γ(b) = 0 tb−1 e−t dt.
Statistiques
2010-2011
Feuille de TD no 6
Théorie de Neyman-Pearson
Exercice 25
Soit X une variable aléatoire de loi B(n, p).
1. Soient p0 et p1 des réels fixés dans ]0, 1[ tels que p0 < p1 . Bâtir un test de Neyman-Pearson
de niveau α de p = p0 contre p = p1 .
2. Soit p0 ∈]0, 1[. Bâtir un test uniformément le plus puissant parmi les tests de niveau α de
p 6 p0 contre p > p0 .
Exercice 26
Soient α ∈]0, 1[ et (X1 , ..., Xn ) un n-échantillon de la loi N (θ, 1), θ ∈ R. Bâtir un test uni-
formément le plus puissant parmi les tests de niveau α de θ > θ0 contre θ < θ0 , puis déterminer
la puissance de ce test.
Exercice 27
Soient τ1 , τ2 , . . . , τm , . . . des variables aléatoires indépendantes et de même loi exponentielle de
paramètre θ inconnu. Pour tout n ∈ N, on note Tn = τ1 + · · · + τn . Bâtir un test uniformément
le plus puissant de θ 6 θ0 contre θ > θ0 lorsqu’on observe
P
1. Nt = n>1 1I(Tn 6t) pour un t > 0 fixé (on montrera que Nt suit une loi de Poisson de
paramètre θt) ;
2. (T1 , . . . , Tm ), où m est un entier fixé ;
Exercice 28
Soient τ1 , . . . , τn les variables aléatoires associées à la durée de vie de n ampoules. On suppose
que τ1 , . . . , τn sont indépendantes et de même loi exponentielle dont le paramètre, noté θ, est
inconnu. On observe seulement τ(1) , . . . , τ(m) , où m 6 n est un entier fixé et τ(1) < · · · < τ(n)
sont les statistiques d’ordre associées à l’échantillon. On note τ(0) = 0 et pour tout i = 1, . . . , n,
Xi = τ(i) − τ(i−1) .
Enfin, on note
Sm = τ(1) + · · · + τ(m−1) + (n − m + 1)τ(m) .
m
X
1. (a) Vérifier que Sm = (n − i + 1)Xi .
i=1
(b) Déterminer la loi de (X1 , . . . , Xn ) et en déduire que 2θSm suit une loi χ2 (2m).
2. Construire un test uniformément le plus puissant parmi les tests de niveau α de θ > θ0
contre θ < θ0 .
Exercice 29
Soient X = (X1 , ..., Xn ) un n-échantillon de la loi uniforme sur [0, θ] et α ∈]0, 1[.
1. Soit ϕ un test de θ = θ0 contre θ > θ0 . Montrer que ϕ est uniformément le plus puis-
sant parmi les tests de niveau α si et seulement si Eθ0 ϕ(X) = α et ϕ(X) = 1 lorsque
max(X1 , . . . , Xn ) > θ0 .
2. Montrer qu’il existe un unique test uniformément le plus puissant de θ = θ0 contre θ 6= θ0
au niveau α, donné par ϕ(X) = 1 lorsque max(X1 , . . . , Xn ) > θ0 ou max(X1 , . . . , Xn ) 6
θ0 α1/n et ϕ(X) = 0 sinon.
Exercice 30
Soit (X1 , ..., Xn ) un n-échantillon de la loi admettant la densité x 7→ a exp(−a(x − b)) 1I(x>b)
par rapport à la mesure de Lebesgue.
1. On suppose que a est connu.
(a) Déterminer la loi de Yi = exp(−aXi ).
(b) En utilisant l’exercice 29, montrer qu’il existe un unique test uniformément le plus
puissant de b = b0 contre b 6= b0 ; décrire ce test.
2. Montrer qu’il existe un test uniformément le plus puissant de a = a0 , b = b0 contre
a > a0 , b < b0 ; décrire ce test.
Statistiques
2010-2011
Feuille de TD no 7
Exhaustivité, efficacité
Exercice 31
1. Soit (X1 , . . . , Xn ) un n-échantillon de la loi de Bernoulli de paramètre inconnu θ ∈]0, 1[.
Déterminer un estimateur uniformément de variance minimale parmi les estimateurs sans
biais de θ.
2. Soit (X1 , . . . , Xn ) un n-échantillon de la loi N (m, σ 2 ). Déterminer un estimateur uni-
formément de variance minimale parmi les estimateurs sans biais de m (resp. de σ 2 ).
Exercice 32
Soit (X1 , ..., Xn ) un n-échantillon de la loi uniforme sur [0, θ], θ > 0.
1. Donner une statistique exhaustive et complète pour θ puis construire un estimateur uni-
formément de variance minimale parmi les estimateurs sans biais de θ.
2. En déduire sans calcul la valeur de Eθ (X̄| max16i6n Xi ).
Exercice 33
Soit (X1 , ..., Xn ) un n-échantillon de la loi exponentielle de paramètre
Pθ, θ > 0. On veut estimer
Pθ (X1 6 t) pour t > 0 donné. Montrer que l’estimateur empirique n1 ni=1 1I(Xi 6t) est sans biais.
Déterminer un estimateur uniformément de variance minimale parmi les estimateurs sans biais.
Exercice 34
2
Soit (X1 , . . . , Xn ) un P Pn de 2la loi N (θ, γθ ), où γ > 0 est connu et le paramètre est
n-échantillon
n
θ ∈ R. Montrer que ( i=1 Xi , i=1 Xi ) est une statistique exhaustive non complète.
Exercice 35
Soient {Pθ , θ ∈ Θ} un modèle dominé, P une dominante privilégiée, Z une statistique et T une
statistique exhaustive.
1. Montrer que si Z est indépendante de T pour P , alors c’est une statistique libre.
2. Soit X1 , . . . , Xn un n-échantillon de la loi uniforme sur [θ − 1/2, θ + 1/2], θ ∈ R.
(a) Montrer que X(n) − X(1) est une statistique libre.
(b) Montrer que (X(1) , X(n) ) est exhaustive.
(c) Montrer que la réciproque de 1. est fausse.
3. Montrer que si Z est libre et T est exhaustive complète, alors Z et T sont indépendantes
pour P et pour Pθ , quel que soit θ ∈ Θ.
4. Soit X1 , . . . , Xn un n-échantillon de la loi uniforme sur [θ − 1/2, θ + 1/2], θ ∈ R. Vérifier
que (X(1) , X(n) ) est une statistique exhaustive non complète.
Exercice 36
Soit (X1 , . . . , Xn ) un n-échantillon de la loi Fθ . Montrer que X̄ est un estimateur efficace de
l’espérance de Fθ lorsque
1. Fθ est la loi de Bernoulli de paramètre θ ∈]0, 1[,
2. Fθ est la loi gaussienne N (θ, 1), θ ∈ R,
3. Fθ est la loi exponentielle de paramètre θ > 0.
Exercice 37
Soit (X1 , ..., Xn ) un n-échantillon de la loi de Poisson de paramètre inconnu θ > 0.
1. Ecrire l’inégalité de Cramér-Rao pour un estimateur sans biais de g(θ) = Pθ (X1 = 0).
2. On note T = 1IX1 =0 . Vérifier que T est un estimateur sans biais de g(θ). En déduire qu’il
existe un estimateur uniformément de variance minimale parmi les estimateurs sans biais
de g(θ), puis montrer qu’il n’existe pas d’estimateur efficace de g(θ).
Exercice 38
Soit (X1 , ..., Xn ) un n-échantillon de la loi N (m, σ 2 ), où (m, σ 2 ) ∈ R×]0, ∞[ est inconnu.
1. Calculer l’information de Fisher de cet échantillon en (m, σ 2 ).
1 Pn
2. Calculer le risque quadratique de S 2 = n−1 2 2
i=1 (Xi − X̄) pour estimer σ . Existe-t-il
un estimateur efficace de σ 2 ?
Statistiques
2010-2011
Feuille de TD no 8
Efficacité asymptotique
Exercice 39
Soit (Pθ )θ∈Θ une famille de probabilités distinctes sur un espace X , où Θ est un intervalle ouvert
non vide de R. On considère φ : X → R telle que Eθ (φ2 ) < ∞ pour tout θ, et on suppose que
la fonction
θ 7→ g(θ) := Eθ (φ)
est dérivable sur Θ, de dérivée strictement positive.
On observe des variables aléatoires indépendantes et de même loi X1 , . . . , Xn , dont la loi
inconnue appartient à la famille (Pθ )θ∈Θ . On estime g(θ) par
n
1X
Tn = φ(Xi ) .
n
i=1
Exercice 40
Soit (X1 , ..., Xn ) un n-échantillon de la loi N (m, σ 2 ), où θ = (m, σ 2 ) ∈ R×]0, ∞[ est inconnu.
On note σbn2 l’estimateur du maximum de vraisemblance de σ 2 et Rθ (b σn2 ) son risque quadratique
en θ. Montrer que
√ Lθ
σn2 − σ 2 ) −→
n(b N (0, 2σ 4 ) quand n → ∞.
σn2 ) = 2σ 4 .
et que de plus, lim nRθ (b
n→∞
Exercice 41
Soit (X1 , ..., Xn ) un n-échantillon d’une loi de Poisson de paramètre θ > 0 inconnu. On souhaite
estimer g(θ) = exp(−kθ), où k est un entier positif fixé.
1. Construire un estimateur asymptotiquement efficace de g(θ).
n
k Sn X
2. Soit Tn = 1 − , où Sn = Xi .
n
i=1
(a) Montrer que Tn est uniformément de variance minimale parmi les estimateurs sans
biais de g(θ).
(b) Montrer que Tn est asymptotiquement efficace.
(c) Tn est-il efficace ?
Exercice 42
Soit f une densité de probabilité de classe C 2 sur R, telle que
- pour tout x ∈ R, f (x) est strictement positif,
- les fonctions f ′′ et (f ′ )2 /f sont intégrables par rapport à la mesure de Lebesgue.
- la fonction f ′′ /f − (f ′ /f )2 est uniformément continue sur R.
Pour tout θ ∈ R et x ∈ R, on note
fθ (x) = f (x − θ) et lθ (x) = log fθ (x).
Pour tout x ∈ R, la fonction θ 7→ lθ (x) est alors de classe C 2 sur R ; on note lθ′ (x) et lθ′′ (x)
ses dérivées première et seconde au point θ. On note de même fθ′ (x) la dérivée première de
θ 7→ fθ (x) au point θ. Enfin, on note X une variable aléatoire admettant la densité fθ0 , θ0 ∈ R.
1. Montrer les propriétés suivantes :
R
(a) R fθ′′0 (x) dx = 0,
(b) Il existe un voisinage V de θ0 et une fonction mesurable réelle h dans L1 (Pθ0 ) telle
que pour tout θ ∈ V et tout x ∈ R, |lθ′′ (x)| 6 h(x),
(c) L’information de Fisher de l’observation X est finie et strictement positive. Elle ne
dépend que de f et est égale à
Z
(f ′ (x))2
I(f ) = dx.
f (x)
Exercice 43
Soit (ξ1 , ..., ξn ) un n-échantillon d’une loi admettant une densité strictement positive par rapport
à la mesure de Lebesgue, de fonction de répartition F ( . − θ), où θ ∈ R est inconnu et F est
connue et de classe C 2 . A chaque tirage, on observe seulement
Xi = 1I]−∞,a] (ξi ), 1I]a,b] (ξi ), 1I]b,∞[ (ξi ) .
On souhaite construire un estimateur asymptotiquement efficace de θ sur la base des observa-
tions (X1 , ..., Xn ).
1. Calculer l’information de Fisher de l’échantillon (X1 , ..., Xn ).
P
2. Soit Sa = ni=1 1IXi =(1,0,0) . On considère l’estimateur θen = a−F −1 (Sa /n). Cet estimateur
est-il asymptotiquement efficace ?
3. Construire un estimateur asymptotiquement efficace de θ.
Statistiques
2010-2011
Feuille de TD no 9
Tests du χ2 asymptotiques
Exercice 44
Soit (X1 , . . . , Xn ) un n-échantillon de loi de Poisson de paramètre θ > 0. Construire un test du
rapport de vraisemblance de niveau asymptotique α ∈]0, 1[ de “θ = θ0 ” contre “θ 6= θ0 ”.
Exercice 45
On observe deux caractères X et Y , où X (resp. Y ) est à valeurs dans {1, ..., r} (resp. {1, ..., s}).
On souhaite tester l’indépendance des variables X et Y , sur la base d’un n-échantillon ((X1 , Y1 ), ..., (Xn , Yn ))
de la loi du couple (X, Y ). Pour toutP couple (i, j) ∈ {1, ...,
P r} × {1, ..., s}, on note Nij le nombre
d’observations égales à (i, j), Nio = sj=1 Nij et Noj = ri=1 Nij .
1. Montrer que si X et Y sont indépendantes, alors
r X
X s
(Nij − Nio Noj /n)2 L
n −→ χ2 ((r − 1)(s − 1)) quand n → ∞,
Nio Noj
i=1 j=1
L1 L2 L3
E1 45 26 12
E2 32 50 21
E3 4 10 17
Exercice 46
Soit (X, Y ) un couple de variables aléatoires à valeurs dans {1, ..., k}2 . On souhaite tester la
symétrie de la loi de (X, Y ), sur la base d’un n-échantillon ((X1 , Y1 ), ..., (Xn , Yn )) de la loi du
couple (X, Y ). Pour tout couple (i, j) ∈ {1, ..., k}2 , on note Nij le nombre d’observations égales
à (i, j).
1. Montrer que si la loi de (X, Y ) est symétrique, alors
X (Nij − Nji )2 L
−→ χ2 (k(k − 1)/2) quand n → ∞,
Nij + Nji
16i<j6k