Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Exercices 4

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 4

UE SV04Y050 - Biostatistiques 2-Tests d’hypothèses

Contrôle continu 2 - Devoir maison

Leslie REGAD

Exercice 4
Cet exercice reprend les données des exercices 1, 2 et 3.

N’oubliez pas de rédiger, identifier la variable aléatoire, poser les hypothèses, identifier le test à réaliser et les
conditions d’application du test. N’oubliez pas de commenter vos résultats, graphiques ou résultats d’un test.

1. Ouvrez les 3 jeux de données : forme.Asym_WT_50ale.csv, forme.Asym_i82F_50ale.csv, et


form_Asym.csv

Partie 1
Dans l’exercice 3, vous avez utilisé un deuxième jeu de 100 nouvelles structures. Ainsi, nous disposons 4 jeux
de données :
• échantillon 1 composé de 100 structures sauvages extraites de la simulation 1
• échantillon 2 composé de 100 structures mutantes extraites de la simulation 2
• échantillon 3 composé de 50 structures sauvages extraites de la simulation 3
• échantillon 4 composé de 50 structures mutantes extraites de la simulation 4
Pour chaque structure, on s’intéresse toujours :
• à sa forme : 3 formes sont possibles : “closed”, “semiOpen”, et “open”.
• à son asymétrie.
Dans cette partie, nous voulons savoir si les échantillons 1 et 3 sont homogènes ainsi que les échantillons 2 et
4.

1. Pour les structures sauvages, est-ce que la simulation a un impact sur la forme de la PR2 ? Pour
répondre à cette question suivez le protocole proposé :
• Déterminez la table de comptage croisant la variable FORME et la variable SIMULATION. La table que
vous devez obtenir est présentée ci-dessous :
closed semiOpen
echantillon1 NA NA
echantillon3 NA NA
Vous pouvez utiliser les fonctions table() et rbind(), pour créer la table demandée.
• Représentez graphiquement la distribution de la forme des structures dans les deux échantillons (i.
100 structures sauvages et ii. les 50 structures sauvages). Mettez sur le même graphique, les deux

1
échantillons. Pour cela, utilisez la fonction barplot(x, beside=TRUE). Le graphique que vous devez
obtenir est présenté en Figure 1.
Remarque : Pour vous aider à utiliser la fonction barplot(), vous pouvez vous référer au TP2 du S3 module
BS1 - section “Partie 3 : Visualisation des données”.

N LY NL
Y
NL
Y
FO OF
O
OF
O
OO O O
50

P R N LY échantillon1 R NL
Péchantillon3 Y PR NL
Y
FO F O F O
OO OO OO
40

PR Y R Y R Y
O NL P
O NL P
ONL
F F F
OO OO OO
30

R Y R Y R Y
P
O NL P
O NL P
ONL
F F F
OO OO OO
20

R Y R Y R Y
P
O NL P
O NL P
ONL
O OF O OF OOF
10

PR Y PR Y PR Y
O NL O NL ONL
F F F
ROO ROO ROO
0

P P P
closed semiOpen

Figure 1: Distribution observée des deux formes de PR2 dans les structures des simulations 1 et 1’.

Essayez de jouer avec les couleurs, le texte de la légende, sa position et ses couleurs.
• Réalisez un test statistique pour comparer la distribution des formes closed et semiOpen dans les
structures sauvages extraites des simulations 1 et 3.

2. Pour les structures mutantes, est-ce que la simulation a un impact sur la forme de la PR2 ? Ne
considérer que les modalités : semiOpen et open. Pour répondre à cette question, suivez le protocole :
• Déterminez la table de comptage croisant la variable FORME et la variable SIMULATION.
• Représentez graphiquement la distribution de la forme des structures dans les deux échantillons. Ne
considérez que les formes semiOpen et open.
• Réalisez un test pour comparer la distribution des formes open et semiOpen dans les structures sauvages
des deux simulations.

3. Concluez sur l’homogénéité des deux échantillons (200 et 100 structures) ?

Partie 2
Dans cette partie, on cherche à étudier l’impact de la mutation sur l’asymétrie. Pour cela, la variable
Asymétrie va être discrétisée en trois classes :
• F AIBLE classe qui caractérise une structure faiblement asymétrique, c’est-à-dire qui contient au
maximum 40 positions asymétriques.

2
• M OY EN classe qui caractérise une structure moyennement asymétrique, c’est-à-dire qui contient entre
41 et 50 (exclu) positions asymétriques.
• F ORT classe qui caractérise une structure fortement asymétrique, c’est-à-dire qui contient au moins 50
positions asymétriques.
Cette variable est nommée QualiAsym.

1. Créez le vecteur v.Qasym.200 qui contient les valeurs de la variable QualiAsym pour les structures des
échantillons 1 (100 structures sauvages) et 2 (100 structures mutantes). Pour cela, utilisez la fonction
which().

2. En utilisant la fonction table() sur le vecteur v.Qasym.200, déterminez et commentez la distribution


de la variable QualiAsym dans les 200 structures sauvages et mutantes.

3. A l’aide de la fonction table(), créez la table mat.occ qui correspond au tableau de comptages croisant
les variables v.Qasym.200 (3 classes) et TYPE (2 classes : sauvage et mutante). La table que vous devez
obtenir est présentée ci-dessous.
FAIBLE FORT MOYEN
I82F - - -
WT - - -

4. Représentez la distribution observée de la variable v.Qasym.200 dans les 200 structures sauvages
et mutantes (cf Figure 2). Mettez sur le même graphique la distribution de v.Qasym.200 pour les
structures sauvages et mutantes.

Y Y Y Y Y
60

O NL ONL ONL ONL ONL


F I82F WT F F F F
OO Y OO Y OO Y OO Y OO Y
50

P R
O NL P R
ON L P R
ONL P R
ONL P R
ONL
O OF Y O OF Y OOF Y OOF Y OOF Y
40

PR O NL PR ON L PR ONL PR ONL PR ONL


F F F F F
OO Y OO Y OO Y OO Y OO Y
30

P R
O NL P R
ON L P R
ONL P R
ONL P R
ONL
F F F F F
OO Y OO Y OO Y OO Y OO Y
20

P R
O NL P R
ON L P R
ONL P R
ONL P R
ONL
F F F F F
OO Y OO Y OO Y OO Y OO Y
10

P R
O NL P R
ON L P R
ONL P R
ONL P R
ONL
F F F F F
OO OO OO OO OO
0

P R P R P R P R P R
FAIBLE FORT MOYEN

Figure 2: Distribution observée des classes d’asymétrie dans les structures sauvages (jaune) et mutantes
(magenta) de la grande simulation.

5. A partir du tableau de comptages, pouvez-vous dire que le type de structure a un impact sur l’asymétrie
de la structure ?

3
Partie 3 : Conclusion globale
D’après les résultats que vous avez obtenus sur l’ensemble des exercices, concluez sur :
• l’impact des simulations sur l’asymétrie et la forme des PR2
• l’impact de la mutation I82F sur l’asymétrie de la PR2.

Vous aimerez peut-être aussi