Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Regression TD1 MIASHS

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 2

Licence MIASHS, 3ème année Année 2023/2024

Modèle linéaire

Feuille 1.

I- Soient X et Y deux variables i.i.d. de loi N (0, 1). Déterminer la loi du couple aléatoire
(X − Y, X + Y ). Montrer qu'en particulier, les deux variables X − Y et X + Y sont
indépendantes.
II- Soit (X, Y ) un vecteur gaussien centré tel que E[X ] = 4 et E[Y ] = 1 et tel que les deux
T 2 2

variables 2X + Y et X − 3Y soient indépendantes.


1. Déterminer la matrice de covariance de (X, Y ) . T

2. Déterminer la loi du couple aléatoire (X − Y, X + 2Y ) . T

III- Soient X et X deux variables i.i.d. suivant chacune une loi N (0, 1). Soit Y = (Y , Y ) T

tel que
1 2 1 2

Y = AX + b,

où A = −11 12 , X = (X , X ) et b = (2, 3) .
 
T T
1 2

1. Déterminer la loi de Y .
2. Déterminer la loi de (Y + Y + 1, 3Y − Y ) .
1 2 1 2
T

3. Quelles sont les lois de Y + Y + 1 et de 3Y − Y .


1 2 1 2
IV- Dans cet exercice, X , Y et Z sont trois variables aléatoires indépendantes de loi N (0, 1).
1. Quelle est la loi de X√ + Y ? 2 2

2. Quelle est la loi de 2 ? √ Z


X 2 +Y 2

3. Quelle est la loi de 2 ?Z2


X 2 +Y 2

4. Quelle est la loi de X + Y ? Quelle est la loi de +Z ? (X+Y )2 2

5. Quelle est la loi de ?


2
q X−Y
(X+Y )2
+Z 2

V- Soit X un vecteur gaussien de loi N (0, I ).


2

4
1. Quelle est la loi de (X − X ) /2 + (X + X ) /2 ?
1 2
2
1 2
2

2. Quelle est la loi de ?


(X1 −X2 )2
(X1 +X2 )2
3. Quel est le projeté orthogonal π (X) de X sur l'espace vectoriel engendré par les
vecteurs (1, 1, 0, 0) et(0, 0, 1, 1) ?
E
T T

4. Quelle est la loi de ∥π (X)∥ ? Quelle est la loi de


E
2 ? ∥πE (X)∥2
∥X−πE (X)∥2
VI- 1. La fonction qnorm de R permet de calculer les quantiles d'une loi normale. Vérier que
q0.975≃ 1.96 et donner une valeur approchée de q . 0.995
2. La fonction rnorm de R permet de simuler un échantillon i.i.d. d'une loi normale.
(a) Simuler un échantillon x de taille n = 1000 d'une loi N (0, 1).
(b) Faire un histogramme de x avec la fonction hist de R et superposez la densité
gaussienne N (0, 1).
(c) Calculer le nombre de composantes du vecteur x qui sont plus petits que q .
Commenter.
0.975

(d) Calculer le nombre de composantes du vecteur x qui sont plus petits que q et
plus grands que −q . Commenter.
0.975
0.975
VII- Reprendre l'exercice IV et vérier les résultats numériquement en superposant un échan-
tillon de la variable à déterminer avec la densité de la loi trouvée.
VIII- Le jeu de données data brest.csv sur moodle représente les relevés de température à Brest-
Guipavas entre 1945 et 2022. On notera t ∈ {1945, . . . , 2022} les dates et x , . . . , x
les températures correspondantes.
1945 2022

1. Tracer le graphe représentant ces données.


2. Calculer t̄, x̄, s , s , r les indicateurs des séries statistiques t = (t ) et x = (x ).
2 2
tx i i
3. Déterminer les coecients de la droite de régression de x par rapport à t. Rajouter la
t x

droite sur le graphe.


4. Que font les commandes lm(x ∼ t) et abline(lm(x ∼ t)) ?
IX- On a calculé les droites des moindres carrés pour un nuage de points. Les équations obtenues
sont les suivantes :
 quand on cherche à expliquer la variable y à partir de la variable x, on obtient la droite
d'équation y = x + 30.
 quand on cherche à expliquer la variable x à partir de la variable y, on obtient la droite
d'équation x = y/4 + 60.
1. Calculer le coecient de corrélation linéaire entre les deux séries.
2. Calculer les moyennes arithmétiques des deux séries.
X- On considère le jeu de données UNLifeExpectancy.csv disponible sur Moodle. Nous allons
étudier ce jeu de données durant plusieurs séances. Pour le moment nous nous contenterons
d'importer et préparer les données, puis de faire une première régression linéaire simple.
Les variables concernées par cette première approche sont
 COUNTRY : nom du pays
 LIFEEXP : espérance vie à la naissance, en années
 POP : population, en millions
 GDP : PIB en milliards de Dollars.
1. Importer les données sous R.
2. Renommer les lignes en utilisant le nom des pays, en utilisant la fonction R row.names .
3. Ajouter une variable nommée PIB obtenue en divisant la variable GDP par la variable
POP : ce sera le PIB par habitant.
4. Ajuster un modèle de régression linéaire simple pour expliquer la variable LIFEEXP
(espérance vie) à partir de la variable PIB. On stocke les informations dans un objet
appelé t.
5. Tracer sur un même graphe le nuage de points et la droite de régression. L'hypothèse
d'un modèle linéaire vous semble réaliste?
6. Comment améliorer le modèle?
XI- On dispose d'un échantillon de couples (x , y ) , à partir duquel nous cherchons à
estimer les paramètres β , β du modèle suivant :
i i i∈{1,...,n}
0 1

Yi = β0 + β1 xi + Wi ,

avec W , . . . , W i.i.d. de loi N (0, σ ), pour σ > 0.


1 n
2

1. Calculer la vraisemblance de l'échantillon associée aux réalisations y , . . . , y .


1 n
2. En déduire les estimateurs du maximum de vraisemblance de β et β . 0 1
3. Que remarque-t-on?

Vous aimerez peut-être aussi