Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Statistic Project

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 21

Projet Statistique

ll)Test Parametrique:
1)Qu est ce qu un test parametrique ?
a)Definition,avantage,inconvenient et utilité
Un test paramètrique est un test statistique qui se base sur les paramètres d’une
population en suivant un type de loi de distribution connu (en général la loi
normale).Autrement dit ,ce test est utilisé si on a des informations par rapport
aux paramètres de la population mère et les variables etudiés sont d’ordre mètrique
ou mésurable(intervalle). Certaines conditions de validité doivent être
vérifiées pour que le résultat d’un test paramétrique soit fiable. Par
exemple, le test t de Student pour échantillons indépendants n’est fiable
que si les données associées à chaque échantillon suivent une distribution
normale et si les variances des échantillons sont homogènes.Ces tests sont
en général très fins, mais ils nécessitent que les données suivent
effectivement la loi de distribution supposée. Ils sont en particulier très
sensibles aux valeurs aberrantes et ne sont pas conseillés si des valeurs
aberrantes sont détectée . Les tests paramétriques sont généralement plus
puissants que les tests non paramétriques lorsque les hypothèses sont
satisfaites, mais peuvent être moins robustes lorsque ces hypothèses sont
violées.

Les avantages des tests paramétriques résident dans leur


puissance statistique – ils ont tendance à être plus sensibles et précis
lorsqu’il s’agit de tester des hypothèses sur les moyennes et les variances, à
condition que certaines conditions soient remplies. Par exemple, si vous
disposez de données distribuées normalement avec des variances égales
entre les groupes, un test t ou une ANOVA donnera probablement des
résultats plus précis qu’un équivalent non paramétrique comme le test de
somme de rangs de Wilcoxon ou le test de Kruskal-Wallis.Un autre
avantage des tests paramétriques est qu’ils nécessitent généralement des
tailles d’échantillon plus petites que les tests non paramétriques pour
atteindre le même niveau de signification.D’un autre côté, les limites des
tests paramétriques découlent de leurs hypothèses sur la distribution des
données, qui ne sont pas toujours vraies en pratique. Si vos données sont
biaisées ou ont des valeurs aberrantes, par exemple, l’utilisation d’un test
paramétrique peut conduire à des conclusions incorrectes en raison de
violations des hypothèses de normalité ou d’homoscédasticité.

Un facteur majeur est de savoir si vos données répondent aux


hypothèses d’un test paramétrique. Ces hypothèses comprennent
la distribution normale, l’égalité des variances et l’indépendance
des observations. Si vos données ne respectent aucune de ces
hypothèses, un test non paramétrique peut être plus approprié.
Une autre considération est le type d’analyse que vous devez
effectuer. Par exemple, si vous souhaitez évaluer la relation entre
deux variables continues, vous pouvez utiliser une régression
linéaire ou une analyse de coefficient de corrélation – toutes deux
étant des tests paramétriques. ils requièrent des échantillons de
taille importante (> 30 observations). Ils sont traditionnellement
utilisés pour les variables quantitatives. En recapitulant on peut
dire que ce test s utilise lorsque la comparaison se fait entre deux
populations independantes.Par exemple, la comparaison entre
Homme et Femme.

2) Quels sont les differents test parametrique ?

OBJECTIVE :

L'idée dans les tests paramétriques est d'ajouter de l'information


structurante. En pratique, on va modéliser la loi de la variable d'intérêt
et/ou des estimateurs considérer. On a donc besoin de disposer d'outils
de modélisation qui sont ici des lois de probabilités. On l utilise afin de
demontrer l existence d un effet( difference entre deux
moyenne,presence d une corellation). Il y a differents type de
test parametrique pour de divers echantillon.
Diferrents tests :

A quoi ils servent Test


Moyenne observée VS Test t pour un échantillon
théoriques
Comparer deux moyennes Test t de Student sur deux
indépendantes échantillons indépendants
Moyenne observée VS
théoriques(en connaissant la Test z pour un echantillon
variance ou l ecart-type)
Comparer deux moyennes Test t de Student sur deux
dépendantes observées échantillons appariés
Moyenne observée VS
Test Z pour deux echantillon
théoriques(en connaissant la
independant
variance ou l ecart-type)

NB : Pour utiliser ces tests ci-dessus ,les donnés doivent suivre un type de
loi de distribution connue.Par exemple : Si vous souhaitez comparer la
moyenne des notes en mathematiques d une classe a la moyenne du
pays,vous allez utiliser un test parametrique sachant que les donnés
suivent une distribution normale.

A) Test t :
1) Definition,difference avec distribution normale,tableau de valeur
critique.
Le test T est une statistique inférentielle utilisée pour évaluer les
différences entre les moyennes de deux groupes. Le test T est
généralement utilisé lorsque les ensembles de données suivent une
distribution normale et peuvent avoir des variances inconnues. Le test t,
également appelé test de Student ou distribution t, est un
test statistique populaire servant à mesurer les différences
entre les moyennes de deux groupes ou d’un groupe par
rapport à une valeur standard. Il est basé sur une loi de
probabilité appelée loi de Student. L’exécution de ce test
sert à comprendre si les différences sont statistiquement
significatives, c’est-à-dire si elles ne sont pas le fruit du
hasard.

En utilisant le test T, un analyste va être en mesure de


savoir s’il existe des facteurs qui influencent les différences
entre les résultats de plusieurs échantillons observés.

t -Distribution vs distribution normale


La distribution t est similaire à une distribution normale. Il a une définition
mathématique précise. Au lieu de plonger dans des mathématiques complexes,
examinons les propriétés utiles de la distribution t et pourquoi elle est importante
dans les analyses.

 Comme la distribution normale, la distribution t a une forme lisse.


 Comme la distribution normale, la distribution t est symétrique. Si vous
envisagez de le plier en deux au milieu, chaque côté sera le même.
 Comme une distribution normale standard (ou distribution z), la
distribution t a une moyenne de zéro.
 La distribution normale suppose que l'écart type de la population est
connu. La distribution t ne fait pas cette hypothèse.
 La distribution t est définie par les degrés de liberté . Ceux-ci sont liés à la
taille de l’échantillon.
 La distribution t est particulièrement utile pour les échantillons de petite
taille, lorsque l'écart type de la population n'est pas connu, ou les deux.
 À mesure que la taille de l’échantillon augmente, la distribution t devient
plus similaire à une distribution normale.
Considérons le graphique suivant comparant trois distributions t avec une
distribution normale standard :

La forme de la distribution t dépend des degrés de liberté. Les courbes avec plus de
degrés de liberté sont plus hautes et ont des queues plus fines. Les trois
distributions t ont des « queues plus lourdes » que la distribution z.

Vous pouvez voir comment les courbes avec plus de degrés de liberté ressemblent
davantage à une distribution z. Comparez la courbe rose avec un degré de liberté à
la courbe verte pour la distribution z. La distribution t avec un degré de liberté est
plus courte et a des queues plus épaisses que la distribution z. Comparez ensuite la
courbe bleue avec 10 degrés de liberté à la courbe verte pour la distribution z. Ces
deux distributions sont très similaires.
Dans le calcul du test T, le résultat obtenu est appelé valeur T. Cette valeur
T est comparée à un tableau de valeurs critiques, appelée tableau de
distribution T. La comparaison est faite pour déterminer l’effet du hasard
sur la différence et déterminer si la différence se situe en dehors du champ
de cette chance.

Nous devons toujours nous référer à des tables spécialisées de la distribution de t


selon le degré de liberté (n – 1) pour déterminer le seuil de signification qui y est
associé. Le tableau suivant présente les principales valeurs critiques de la
distribution t de Student. Les premières rangées indiquent les valeurs critiques
choisies lorsque le test est unidirectionnel (uni) ou bidirectionnel (bi) et la première
colonne, le degré de liberté.
SPSS

2)test t pour un echantillon :


Definition:

Le test t pour échantillon unique est utilisé pour


tester si la moyenne d’un échantillon (x) pour une
variable spécifique est « probable » ou « improbable
» en regard de l’hypothèse que cette moyenne
provient d’un échantillon qui a été tiré au hasard
d’une population dont nous connaissons la moyenne
(μ), mais non l’écart-type. Dans ce cas, la
distribution échantillonnale des moyennes ne suit
plus la forme de la distribution normale. En fait,
lorsque nous ne connaissons pas tous les paramètres
de la population (moyenne et écart-type réel), nous
pouvons utiliser la distribution t, apparentée à la
distribution normale, et tester si un échantillon
provient d’une population avec une moyenne connue,
mais un écart-type qui ne l’est pas. Ce dernier teste
la probabilité d’erreur (valeur de p ou degré de
signification) associée au rejet de cette hypothèse
nulle si celle-ci est vraie dans la réalité.

VOICI LA FORMULE POUR UN TEST T D’UN ECHQNTILLON:

T = (X̄ – μ) /( S/√n)
Où X̄ est la moyenne de l'échantillon, μ est la moyenne hypothétique de la
population, S est l'écart type de l'échantillon et n est le nombre
d'observations dans l'échantillon.

EXEMPLE : Un échantillon de 16 personnes est prélevé. Le nombre moyen


de jours passés en vacances par les personnes de l'échantillon s'avère être
de 9 jours avec un écart type de l'échantillon de 3 jours.

 Hypothèse nulle ( H 0 ) : Le nombre moyen de jours qu'une


personne passe en vacances est égal à 5
jours. Mathématiquement, H 0 : μ = 5 .
 Hypothèse alternative ( H a ) : Le nombre moyen de jours
qu'une personne passe en vacances est supérieur à 5
jours. Mathématiquement, H a : μ > 5 .

Pour les données dont nous disposons, où la moyenne de


l'échantillon est de 9 jours, et où nous testons l'affirmation selon
laquelle le nombre moyen de jours de vacances est supérieur ou
égal à 5, un test unilatéral est le plus approprié.

T = (X̄ – μ) / (S/√n)

= (9 – 5)/(3/√16)

= 5,33

Si la valeur t calculée est de 5,33 et que la valeur t critique pour un test


unilatéral au niveau alpha de 0,05 est de 1,753, vous pouvez tirer les
conclusions suivantes concernant l'hypothèse nulle :

Étant donné que la valeur t calculée (5,33) est supérieure à la valeur t


critique (1,753), vous disposez de preuves suffisantes pour rejeter
l'hypothèse nulle au niveau de signification de 0,05. Cela signifie qu'il existe
une différence statistiquement significative entre la moyenne de
l'échantillon et la moyenne hypothétique de la population, et que
l'échantillon fournit suffisamment de preuves pour étayer l'affirmation
selon laquelle le nombre moyen de jours qu'une personne passe en
vacances est supérieur à 5 jours.
3) Test t pour deux echantillons independants :

Un test t à 2 échantillons permet de comparer deux groupes indépendants pour


déterminer s'ils sont différents. Ce test suppose que les deux populations possèdent
des variances égales et qu'elles sont distribuées normalement. Le test t pour les
moyennes indépendantes est utilisé lorsque nous voulons savoir s'il existe une
différence entre les populations . Par exemple, nous souhaiterions peut-être savoir si
les étudiants et les étudiantes diffèrent sur certaines caractéristiques
psychologiques. Pour évaluer cela, nous aurions besoin d’informations recueillies
auprès d’un groupe d’hommes et d’informations recueillies auprès d’un groupe
distinct de femmes. Les moyennes sont considérées comme « indépendantes
» lorsqu'il n'y a pas de chevauchement entre les groupes ; une personne ne peut pas
être à la fois un homme et une femme. Le test t pour les moyennes indépendantes est
utilisé uniquement pour les tests des moyennes de l'échantillon . Ainsi, notre
hypothèse teste si l'écart moyen entre les scores ( M 1 - M 2 ) suggère que nos
étudiants sont issus d'une population où il n'y a pas de différence entre hommes et
femmes (m1- m2= 0) ou s'ils sont issus d'une population différentes populations (par
exemple, hommes et femmes universitaires).

Les hypothèses statistiques pour les tests t pour les moyennes indépendantes prennent
l'une des formes suivantes, selon que votre hypothèse de recherche est directionnelle
ou non directionnelle. Ces hypothèses sont de forme identique aux hypothèses
statistiques utilisées pour le test t pour les moyennes dépendantes.
Toutes les statistiques paramétriques comportent un ensemble d'hypothèses qui
doivent être respectées afin d'utiliser correctement les statistiques pour tester les
hypothèses. Les hypothèses du test t pour les moyennes indépendantes sont
énumérées ci-dessous.

Échantillonnage aléatoire à partir d'une


population définie
Échelle de mesure d'intervalle ou de rapport
Les scores dans les populations sont
normalement distribués
Les variances de population sont égales

Exemple médical :
Pour une société pharmaceutique, vous souhaitez voir si un médicament XY vous
aide ou non à perdre du poids. Cela se fait en donnant le médicament à 20
personnes et à 20 personnes un placebo.

La Formule du test T :
Voici la formule du test T à deux échantillons Pour des variances egales ou
inegales:

Où:

 X bar 1et X bar 2 sont les moyennes d'échantillon des deux


groupes comparés.
 n1et n2sont les tailles d’échantillon des deux groupes comparés
 sp2 est la variance de l'échantillon groupé.
 S1² et S2² sont les variances de chaque echantillon.
 Df est la degré de liberté.

La méthode des variances inégales suppose que les variances des


deux groupes comparés sont différentes.
EXEMPLE 1 : Supposons que nous avons deux échantillons de
notes d'étudiants dans deux classes différentes, et nous
voulons savoir s'il y a une différence significative entre les
moyennes des deux classes.
Voici les moyennes des notes pour chaque classe :

 Classe A : 75, 80, 85, 90


 Classe B : 70, 72, 78, 82
Pour effectuer un test t de Student pour échantillons
indépendants avec des variances supposées égales, nous
pouvons utiliser la formule suivante :
t = (moyenne1 - moyenne2) / √(s² * (1/n1 + 1/n2))
où moyenne1 et moyenne2 sont les moyennes des
échantillons, s² est l'estimateur non biaisé de la variance
commune, et n1 et n2 sont les tailles des échantillons.
En utilisant cette formule, on peut calculer la statistique de
test t.
Pour calculer la statistique de test t dans cet exemple, nous
pouvons suivre les étapes suivantes :
Étape 1 : Calculer les moyennes des échantillons

 Moyenne de la classe A : (75 + 80 + 85 + 90) / 4 = 82.5


 Moyenne de la classe B : (70 + 72 + 78 + 82) / 4 = 75.5

Étape 2 : Calculer la variance commune Pour des


échantillons de petites tailles, nous considérons
l'estimateur non biaisé de la variance commune, qui est
donné par la formule : s² = ((n1 - 1)*variance1 + (n2 -
1)*variance2) / (n1 + n2 - 2) Où variance1 et variance2 sont
les variances des échantillons, et n1 et n2 sont les tailles
des échantillons.

Pour notre exemple, supposons que les variances des deux


échantillons sont égales à 25 (c'est un exemple simplifié).
Nous pouvons utiliser cette valeur pour calculer la variance
commune.
s² = ((4-1)25 + (4-1)25) / (4+4-2) = (325 + 325) / 6 = 150 / 6 = 25
Étape 3 : Calculer la statistique de test t Maintenant, nous
pouvons utiliser la formule pour calculer la statistique de
test t : t = (moyenne1 - moyenne2) / √(s² * (1/n1 + 1/n2))
t = (82.5 - 75.5) / √(25 * (1/4 + 1/4)) t = 7 / √(25 * 0.5) t = 7 /
√12.5 t ≈ 7 / 3.54 t ≈ 1.98
Donc, la statistique de test t est d'environ 1.98.
EXEMPLE 2 :Supposons que nous voulons comparer les
performances moyennes de deux groupes de participants,
un groupe expérimental et un groupe témoin. Voici les
résultats de leur performance dans un test de mémoire :
Groupe expérimental : 75, 80, 85, 90, 95 Groupe témoin : 70,
75, 80, 85
Étapes pour effectuer le test t de Welch :

Étape 1 : Calcul des moyennes et des variances des


échantillons.
Moyenne du groupe expérimental : (75 + 80 + 85 + 90 + 95) /
5 = 85 Variance du groupe expérimental : ((75-85)^2 + (80-
85)^2 + (85-85)^2 + (90-85)^2 + (95-85)^2) / 4 ≈ 50
Moyenne du groupe témoin : (70 + 75 + 80 + 85) / 4 = 77.5
Variance du groupe témoin : ((70-77.5)^2 + (75-77.5)^2 + (80-
77.5)^2 + (85-77.5)^2) / 3 ≈ 29.17
Étape 2 : Calcul de la statistique de test t de Welch
La formule pour la statistique de test t de Welch est :
t = (moyenne1 - moyenne2) / √( (s1 ^2/n1 + s2 ^2/n2))
on a alors :
t = (85 – 77,5) / √( (50 /5 + 29,17/4))
t= 1,80

4)test t student sur deux echantillons appariés :

Le test t de Student pour échantillons appariés permet de comparer


les moyennes de deux series de mesures faites sur les mêmes unités
statistiques. Vous pouvez utiliser le test lorsque vos valeurs de données sont des
mesures appariées. Par exemple, vous pourriez avoir des mesures avant et après
pour un groupe de personnes. Par ailleurs, les différences entre les mesures
appariées doivent être distribuées normalement. Dans ce type de test,
notre intérêt porte sur les différences de moyennes qui
existent entre les deux variables mesurées pour le même
individu ou pour la paire d’observations.

Voici la formule du test t student sur deux echantillons


appariés :

où,
 m est la moyenne des différences
 n est la taille de l’échantillon (c.-à-d. la taille de d).
 s est l’écart-type de d

EXEMPLE : Supposons que les temps de course (en secondes)


d'un athlète sur une distance de 100 mètres avant et après
un programme d'entraînement sont les suivants : Avant : 13,
12, 14, 12, 12 Après : 12, 11, 13, 11, 11
Étapes pour le test t apparié :
1. Calcul des différences entre les temps après et avant
l'entraînement pour chaque essai : Différence 1 = 12 -
13 = -1 Différence 2 = 11 - 12 = -1 Différence 3 = 13 - 14
= -1 Différence 4 = 11 - 12 = -1 Différence 5 = 11 - 12 = -1
2. Calcul de la moyenne des différences : Moyenne des
différences = (-1 - 1 - 1 - 1 - 1) / 5 = -0.8
3. Calcul de l'écart-type des différences : Écart-type des
différences = √(((-1 -(-0.8))^2 + (-1 -(-0.8))^2 + (-1 -(-
0.8))^2 + (-1 -(-0.8))^2 + (-1 -(-0.8))^2) / 4) = √((0.04 + 0.04
+ 0.04 + 0.04 + 0.04) / 4) = √(0.04) = 0.2
4. Calcul du score t : Score t = (-0.8) / (0.2 / √5) = -0.8 / (0.2 /
2.236) = -0.8 / 0.178 ≈ -4.49.
Dans cet exemple, le score t pour le test t apparié est
d'environ -4.49.
Le score t peut être négatif dans un test t apparié si la
moyenne des différences est inférieure à zéro et l'effet du
traitement ou de l'intervention est de réduire la mesure
observée. Dans notre exemple, cela signifierait que, en
moyenne, les temps de course après l'entraînement sont
plus courts que ceux avant l'entraînement.
Cela peut indiquer un effet significatif du programme
d'entraînement sur les performances de l'athlète, en
réduisant les temps de course sur une distance donnée.
Il est important de noter que le signe du score t est corrélé à
la direction de l'effet du traitement ou de l'intervention, et
non à sa signification statistique.

B) test Z

a) Defintion,score Z

Un test z est un test statistique utilisé pour déterminer si deux


moyennes de population sont différentes lorsque les variances sont
connues et que la taille de l’échantillon est grande.

La statistique de test est supposée avoir une distribution normale, et


les paramètres de nuisance tels que l’écart type doivent être connus
pour qu’un test z précis soit effectué.

Points clés à retenir:


 Le test Z est un test statistique pour déterminer si deux moyennes de
population sont différentes lorsque les variances sont connues et que la taille
de l’échantillon est grande.
 Le test Z est un test d’hypothèse dans lequel la statistique z suit une
distribution normale.
 Une statistique z, ou score z, est un nombre représentant le résultat du test z.
 Les tests Z sont étroitement liés aux tests t, mais les tests t sont mieux
effectués lorsqu’une expérience a une petite taille d’échantillon.
 Les tests Z supposent que l’écart type est connu, tandis que les tests t
supposent qu’il est inconnu.

Un score z, ou statistique z, est un nombre représentant le nombre d’écarts types


au-dessus ou en dessous de la population moyenne du score dérivé d’un test z. Il
s’agit essentiellement d’une mesure numérique qui décrit la relation d’une valeur
avec la moyenne d’un groupe de valeurs. Si un score Z est de 0, cela indique que le
score du point de données est identique au score moyen. Un score Z de 1,0
indiquerait une valeur qui est un écart type de la moyenne. Les scores Z peuvent
être positifs ou négatifs, une valeur positive indiquant que le score est supérieur à
la moyenne et un score négatif indiquant qu’il est inférieur à la moyenne.

1) Test Z pour un echantillon

La formule pour calculer un test Z sur un échantillon est :

 Z est le score Z de la moyenne de l'échantillon


 M est la moyenne de l'échantillon
 µest la moyenne de la population
 sigma m est l'erreur standard de la moyenne de l'échantillon (il
s'agit d'une mesure de la répartition des moyennes de
l'échantillon dans la distribution de la population)

Pour trouver l'erreur type de la moyenne de l'échantillon, divisez l'écart


type de l'échantillon par la racine carrée de la taille de l'échantillon,
comme indiqué ci-dessous :

Exemple : équation de test Z avec une moyenne de


population unique
Calculez le score Z pour une distribution avec une taille d'échantillon de
n = 36, où la moyenne de la population est de 80 et l'écart type est de
12 :
Tout d’abord, calculez l’erreur type de la moyenne de l’échantillon :

Ensuite, insérez les valeurs dans l'équation du test Z pour trouver le


score Z de la moyenne de l'échantillon :
La valeur positive du score Z indique que la moyenne de l’échantillon se
situe au-dessus de la moyenne de la population. S’il était négatif, il
serait inférieur à la moyenne de la population. Si la valeur était 0, alors
elle serait égale à la moyenne de la population.
La valeur numérique du score Z lui-même indique dans quelle mesure la
moyenne de l'échantillon se situe par rapport à la moyenne de la
population en termes d'écart type. Une valeur de score Z de 1
indiquerait que la moyenne de l’échantillon est un écart type au-dessus
de la moyenne de la population. Alternativement, une valeur de score Z
de -1 indiquerait que la moyenne de l’échantillon est un écart
type inférieur à la moyenne de la population.
Pour déterminer si un score Z est significatif ou non, les chercheurs
utilisent la valeur p . La valeur p est la probabilité que l'hypothèse nulle
soit vraie. Plus la valeur p est faible, moins l’hypothèse nulle est
probable. Traditionnellement, 0,05 est le seuil de signification
statistique . Si la valeur p est inférieure à 0,05, un résultat est considéré
comme statistiquement significatif.

2) Test Z pour deux echantillons independant


Un test de moyenne sur deux échantillons compare les données de deux
échantillons, en recherchant une différence significative entre leurs moyennes (au
lieu de tester un échantillon par rapport à un ensemble de paramètres de population
supposés vrais). Nous avons besoin de tests sur deux échantillons car, dans le
monde réel, les véritables paramètres d’une population étudiée sont souvent soit
inconnus, soit impossibles à mesurer, soit coûteux en termes de temps et de
ressources à déterminer. Ou bien, il se pourrait que la meilleure analyse possible de
quelque chose nécessite une étude simultanée de deux groupes différents (afin que
les variables temporelles ou autres contingences ne biaisent pas les résultats, ce qui
exclut l'utilisation de données historiques sur la population). Dans de tels cas,
l’astuce consiste à comparer DEUX échantillons (aléatoires), de taille suffisante
pour parvenir à des conclusions statistiquement solides. Rappelons que dans les
tests sur un échantillon, nous utilisons un écart type supposé (ou une estimation
supposée) de la population pour calculer l'erreur type de la moyenne/proportion de
l'échantillon (en la divisant par la racine carrée de n). Cependant, dans un test à
deux échantillons, nous ne supposons pas qu’il existe une véritable population. Au
lieu de cela, nous supposons initialement que les deux échantillons sont tous deux
vrais et que la différence entre leurs centres est de 0. Ainsi, lorsque l'on teste deux
échantillons l'un par rapport à l'autre, ce qui est testé est de savoir si la
DIFFÉRENCE entre les deux moyennes est nulle ou non. L'hypothèse nulle
(hypothèse initiale) est que cette différence est nulle (c'est-à-dire que la variable
isolée n'a eu aucun effet, jusqu'à preuve du contraire).

Parce que nous supposons que les deux distributions d'échantillons sont vraies (ou
du moins nos meilleures estimations de la vérité), nous calculons une erreur type
avec laquelle évaluer la différence entre les moyennes de l'échantillon. Nous
supposons également que les deux variances sont égales. (Par exemple,
« l'exposition » n'a modifié que la moyenne, et non la variance, entre les deux
échantillons. C'est généralement une hypothèse correcte, mais il faut examiner les
données pour voir si les variances des deux ensembles de données sont
effectivement proches. )

Si nous supposons des variances égales, nous pouvons prendre une sorte de «
moyenne pondérée » des variances des échantillons dans le calcul de SE, comme le
montre le dénominateur de la formule pour un test Z à deux échantillons :

Formule de test Z à deux échantillons

La formule du test Z à deux échantillons est également un rapport.


Le numérateur est la différence entre les moyennes de vos deux
échantillons.

Le dénominateur calcule l’erreur type regroupée de la moyenne en


combinant les deux échantillons. Dans cette formule de test Z, entrez les
variances de population (σ 2) pour chaque échantillon.

Comme pour le test de moyenne sur un échantillon, un test Z sur deux échantillons
n'est conseillé que lorsque (a) les deux véritables écarts types (σ1 et σ2) sont connus,
ou (b) les deux échantillons sont suffisamment grands pour donner une bonne
estimation de leur véritable écart type (de manière conventionnelle, encore une fois,
lorsque les deux n >= 30).

EXEMPLE : Supposons que nous voulons comparer la


performance de deux groupes de étudiants, un groupe A et
un groupe B, dans un test de mathématiques.
Dans le groupe A, la moyenne des notes est de 80 avec un
écart-type de 10. Dans le groupe B, la moyenne des notes
est de 75 avec un écart-type de 8. Supposons que chaque
groupe comporte 25 étudiants

nous utilisons la formule suivante:

SCORE Z= (X bar1-X bar2)/( (σ 21/n1+ σ 22/n2)

SCORE Z= (80-75)/( (102/25+ 82/25)= 1.864.


Cela suggère une différence significative entre les
performances moyennes des deux groupes dans le test de
mathématiques.

lll)CONCLUSION
Dans l'ensemble, les tests statistiques paramétriques et non
paramétriques ont fourni des résultats significatifs sur les
différences entre les groupes étudiés, révélant des relations
importantes entre les variables analysées. Les tests
paramétriques ont souligné l'efficacité des hypothèses
basées sur la distribution normale des données, tandis que
les tests non paramétriques ont offert des conclusions
indépendantes de ces hypothèses, mettant en lumière des
relations significatives sans les contraintes de normalité
des données. Ces résultats offrent des perspectives
enrichissantes sur [domaine d'étude] et ouvrent la voie à
des analyses plus approfondies pour une meilleure
compréhension des phénomènes et des processus
impliqués."

Vous aimerez peut-être aussi