M2 Exo1 23
M2 Exo1 23
M2 Exo1 23
Exercice 1
1. Le fichier Excel 'M2 Ex01 données 23.xls' contient une liste d'une population de N = 3 048
personnes. Le fichier contient une variable d'identification et deux variables d'enquête :
l'indice de masse corporelle (IMC) de chaque répondant ainsi qu'une variable binaire (1=oui,
0=non) indiquant si le répondant s'est déjà fait dire par un médecin qu'il avait cholestérol
élevé (CHLEV). Tirer un échantillon aléatoire simple de taille n = 40 en utilisant le tableau de
nombres aléatoires dans « M2 Random Digits 23.pdf ». Par souci de réplication, sélectionnez
les exemples de nombres aléatoires en commençant dans le coin supérieur gauche, ligne 1,
colonnes 1-4 (premier nombre, 4901). Continuez à sélectionner des nombres en descendant
les colonnes 1-4. Si plus de 50 nombres aléatoires sont nécessaires pour sélectionner
l'échantillon (c'est-à-dire que les 50 nombres des colonnes 1 à 4 ont été utilisés), passez à la
ligne 1, colonnes 6 à 9 (numéro 3404). Si plus de 100 nombres aléatoires sont nécessaires
pour sélectionner l'échantillon, continuez avec la ligne 1, colonnes 11-14 (numéro 7200).
Répondez ensuite aux questions suivantes concernant l'échantillon :
(a) Énumérez les numéros d'identification (ID) et les deux variables (IMC et CHLEV) des unités
échantillonnées.
(b) Estimez l'indice de masse corporelle (IMC) moyen et comparez-le à la moyenne de la
population pour l'IMC. S'ils diffèrent, expliquez brièvement pourquoi.
(c) Estimez la variance d’élément de l'IMC, la variance d'échantillonnage et l'erreur type de
l'IMC moyen.
(d) Calculer un intervalle de confiance à 95% pour l'IMC moyen.
(e) Estimez la proportion de personnes à qui un médecin a déjà dit qu'elles avaient un taux de
cholestérol élevé (CHLEV = 1), son erreur standard et son intervalle de confiance à 90 %.
(f) Si la taille de l'échantillon d'un SRS de cette population était augmentée de n = 40 à n = 100,
quelle serait l'erreur type estimée de l'IMC moyen ?
(g) Quelle taille d'échantillon n pour un SRS de cette population est nécessaire pour obtenir un
coefficient de variation d'au plus 0,025 à la fois pour l'IMC moyen et la proportion de
personnes à qui on a déjà dit qu'elles souffraient d'hypertension ?
(h) Calculez un intervalle de confiance à 99 % pour le nombre total de personnes à qui un
médecin a déjà dit qu'elles avaient un taux de cholestérol élevé.