Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Statistiques Approfondies 20-21 Etudiants PDF

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 69

Pr M. MERZAQ,ENCG 20-21 Settat 21.12.

20

Chapitre 2:

Introduction à la théorie de l’échantillonnage


Introduction
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

L’étude des caractéristiques de tous les éléments d’une population


est souvent impossible à réaliser en raison de contraintes de coûts
et de temps. Cette impossibilité conduit à étudier un sous-
ensemble issu de la population mère: Echantillon
L’échantillonnage consiste à déduire de la connaissance supposée
connue des caractéristiques d’une population, les caractéristiques
des échantillons prélevés dans cette population.
L’estimation est le problème inverse. Il s’agit d’estimer, à partir des
caractéristiques calculées sur un ou plusieurs échantillons , la
valeur des caractéristiques de la population mère.
Vocabulaire
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Enquête: On appelle enquête l’ensemble des opérations qui


ont pour but la collection de façon organisée des informations
relatives à une population.
 Recensement: Lors d’une enquête, si toutes les unités
statistiques de la population considérée sont observées
individuellement, l’enquête est dite complète ou exhaustive, on
parle aussi d’un recensement.
 Sondage: Lorsqu’on cherche de collecter des données relatives
à une population infinie ou d’effectif très grand , elle est
évident qu’il n’est pas possible d’étudier chaque unité
statistique de la population.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Toutefois, on peut prendre une partie des unités statistiques de la


population qui sera réellement observée, dans ce cas l’enquête est
dite partielle ou par échantillonnage, on parle aussi de sondage.
 Echantillon: Lors d’un sondage, la partie des unités statistiques
de la population réellement étudiée est appelée échantillon. Pour
que les résultats obtenus à partir d’un échantillon puissent être
extrapolés à l’ensemble de la population considérée, l’échantillon
sélectionné doit être le plus représentatif possible de la
population étudiée.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Echantillonnage: L’ensemble des méthodes qui permettent de


choisir de façon organisée les unités statistiques de la
population qui constitueront l’échantillon. La méthode
d’échantillonnage la plus utilisée est la méthode aléatoire et
simple.
 Base de sondage: Enumération ou présentation ordonnée de
toutes les unités de base constituant la population.
 Erreur d’échantillonnage : Ecart entre les résultats obtenus
auprès d’un échantillon et ce que nous apprendrait un
recensement comparable de la population.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Plus la taille de l’échantillon est grande plus l’erreur


d’échantillonnage diminue.
Fraction ou taux de sondage: Proportion des unités de la
population qui font partie de l’échantillon. C’est le rapport
entre la taille de l’échantillon n, et la taille de la population N
n
f = x 100
N
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

I: Méthodes d’échantillonnage
 Notations:

Population mère: Ω Echantillon(s) : Ei


Effectif ou taille N n
Moyenne m ou µ Xi
Fréquence ou proportion p fi
Variance 𝝈2 𝜎i2
Ecart-type 𝜎 𝜎i
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Les méthodes probabilistes de constitution des échantillons


consistent à prélever au hasard des éléments de la population
et sont les seuls à respecter les lois statistiques.
Le prélèvement des éléments de l’échantillon peut être
effectué :
* Avec remise : l’élément prélevé est immédiatement remis
dans la population mère avant de prélever le suivant. Un
élément pouvant être éventuellement prélevé plusieurs fois,
les tirages sont indépendants et l’échantillon est dit non-
exhaustif.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Sans remise: L’échantillon est exhaustif, mais les tirages ne


sont pas indépendants puisque la composition de la
population mère est modifiée à chaque tirage.
N.B
Pour pouvoir appliquer les règles du calcul des probabilités, les
échantillons seront supposés être constitués avec remise, ou
être des échantillons sans remise dont la taille est négligeable
par rapport à celle de la population qui de grande taille ou
infinie ( le tirage est alors assimilable à un tirage avec remise)
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Remarque:
La théorie de l’échantillonnage nous propose une distinction
fondamentale entre échantillons basés sur la probabilité :
Echantillons probabilistes et échantillons non basés sur la
probabilité : Echantillons non probabilistes ou empiriques.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

1- Echantillonnage aléatoire et simple :


Un échantillonnage est aléatoire si tous les individus de la
population ont la même chance de faire partie de l’échantillon,
il est simple si les prélèvements des individus sont réalisés
indépendamment les uns des autres. En particulier, si la
population est finie, cette définition correspond au tirage
aléatoire avec remise, qui permet de traiter les populations
finies comme des populations infinies.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Pour prélever un échantillon aléatoire et simple il faut :

- Constituer la base de sondage qui correspond à la liste


complète et sans répétition des éléments de la population;
- Numéroter les éléments;
- Procéder, à l’aide d’un générateur de nombres aléatoires à la
sélection des unités différentes qui vont constituer
l’échantillon.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Utilisation de la table des nombres aléatoires:


- Les nombres figurent par groupe de 5 chiffres, répartis sur 8
colonnes, sur 50 lignes.
Pour utiliser cette table, il faut avant tout attribuer un numéro à
chaque individu de votre population mère.
1/ Définir un point d’entrée;
2/ Décider des chiffres que vous allez retenir pour choisir les
éléments de votre échantillon deux premiers, deux derniers…;
3/La direction à suivre pour trouver les autres: gauche à droite,
droite à gauche, haut en bat, bas en haut ou diagonale.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exemple1:
Par échantillonnage aléatoire simple, sans remise, on veut
choisir 7 salariés parmi un groupe de 70 autres. La sélection
de l’échantillon sera faite à l’aide de la table de nombres
aléatoires.
1ère étape: Attribuer un numéro à chaque salarié de 01 à 70.
2ème étape: choisir un point d’entrée.
3ème étape: Déterminer le sens de déplacement dans la table.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 L’échantillon sera alors constitué des sept premiers nombres


de deux chiffres n’excédant pas 70.
Si on choisit:
• Point de départ: 10ème ligne, 2ème colonne

• Chiffre à retenir: les 2 premiers chiffres

• Sens de lecture: de haut en bas à droite


Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Le tirage selon la table donnera le résultat suivant:


26 -- 37 -- 60 -- 51 -- 15 -- 01 --06 .
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exemple 2:
Sélectionner par échantillonnage aléatoire simple, sans
remise, 12 entreprises, parmi un groupe de 120. L’échantillon
sera faite à l’aide de la table de nombres aléatoires.
- Le point d’entrée: 11ème ligne, 1ère colonne.

- Chiffre à retenir: les trois premiers chiffres

- Sens de lecture: de haut en bas à droite


Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Réponse:
69 -- 55 -- 44 --14 -- 108 -- 33 -- 18 -- 66 -- 49 -- 103 --
10 -- 99.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Avantages et inconvénients de l’échantillonnage aléatoire simple:


 Avantages:
Puisque cette méthode donne à chaque individu de la population
une chance égale d’être choisi, elle permet d’espérer un
échantillon représentatif.
 Inconvénients:

La méthode peut poser certaines difficultés:


Elle n’est pas applicable que s’il existe une liste des individus
composant la population. Ensuite, elle peut être fastidieuse si
l’échantillon et la population sont tous les deux de grande taille
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

2- Echantillons Systématiques:
• L’échantillonnage systématique suppose l’existence d’une liste
de la population où chaque élément est numéroté de 1 jusqu’à
N.
• Notons n le nombre d’individus que doit comporter l’échantillon

N
• L’entier sera noté r et appelé la raison de sondage (Le pas de
n
sondage)
N
• Raison de sondage r= n
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

• Choisissons ensuite au hasard un entier d entre 1 et N:


Il sera le point de départ
Pour former l’échantillon, il s’agira de choisir le premier individu
comme point de départ, son numéro correspond à d
• Pour sélectionner les autres, il suffit d’ajouter à d le pas de
sondage r .
• Les individus choisis seront alors les individus dont les numéros
correspondants à:
• d ; d + r ; d + 2r ; d + 3r ;………; d+ (n-1)r
Remarque: Il faut reprendre au début lorsque la liste sera épuisée.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exemple:
On décide de choisir par échantillonnage systématique 8 entreprises
parmi un groupe de 80.
- Numéroter les entreprises de 1 à 80.

N
- Calculer la raison du sondage r = = 80/8 =10
n
- On tire le numéro d au hasard de 1 à 80.Supposons que d=3
alors l’entreprise qui porte le numéro 3 est sélectionnée.
- Pour avoir les 7 autres entreprises on ajoute à chaque fois la
raison de sondage.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Echantillon est donc: 3/13/23/33/43/53/63/73.

 Si par exemple d= 45ème entreprise


Echantillon: 45/55/65/75/85-80=5/15/25/35.

NB: Selon la raison du sondage et le point de départ choisi, il


peut arriver qu’un nombre obtenu se situe à l’extérieur de la
liste. Il faut revenir donc au début de la liste.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Avantages et inconvénients de l’échantillonnage systématique


 Avantages:
- L’échantillon est simple à sélectionner car un seul nombre est choisi
au hasard,
- Cette méthode tend à répartir l’échantillon sur l’ensemble de la liste
de la population, ce qui permet d’obtenir une bonne précision.
 Inconvénients:

On ne peut obtenir qu’un nombre limité d’échantillons différents à


partir de la même liste.
Par exemple : On ne peut y avoir que 10 échantillons de taille 8 dans l’exemple
précédent.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

3- Echantillons stratifiés:
Cette méthode consiste à subdiviser la population en
différentes strates selon certaines caractéristiques puis à
sélectionner aléatoirement des individus de chaque strate
pour former un échantillon qui devra contenir la même
proportion d’individus de chacune de strates que la population.
Cette méthode permet d’obtenir un échantillon représentatif.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Les étapes à suivre:


- On procure une liste de toutes les unités statistiques de la population
- On sépare la population en différentes strates. Chaque strate regroupe les
individus possédant des caractéristiques communes, puis on numérote les
individus dans chaque strate.
- On détermine la proportion de chaque strate dans la population
- On détermine l’échantillon de taille n
- On détermine le nombre d’individus qu’il faudra dans chaque strate en
respectant les proportions.
- On sélectionne le nombre d’individu voulu dans chaque strate par
échantillonnage aléatoire simple ou systématique.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exemple:
Soit une population de 10.000 entreprises, réparties en 5000 PE,3000
ME et 2000 GE, on souhaite avoir un échantillon de 500 entreprises.

Strate Effectif de la strate Taille de l’échantillon


Petite 5000 0,5*500 = 250
Moyenne 3000 0,3*500 = 150
Grande 2000 0,2*500 = 100
Total 10.000 500
IL ne reste plus qu’à sélectionner un échantillon dans chaque strate, ce
qui pourrait être fait par échantillonnage aléatoire simple ou
systématique.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Avantages et inconvénients de l’échantillonnage stratifié


 Avantages:
- L’échantillon a bien des chances d’être représentatif puisqu’on
s’assure la présence proportionnelle des divers sous-groupes
composant la population.
 Inconvénients:

Tout comme l’échantillonnage simple ou systématique,


l’échantillonnage par strates suppose l’existence d’une liste de la
population au niveau de chaque strate.
Pour utiliser cette méthode il faut savoir exactement comment la
population se répartit dans chacune des strates choisies.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

4- Echantillons par grappe:


Cette méthode consiste à choisir au hasard des groupes d’individus de
la population, appelés grappes, pour qu’ils fassent partie de
l’échantillon. Les grappes sont des sous-ensembles de la population.
Pour que cette méthode d’échantillonnage fournisse un échantillon
représentatif, il faut que chacune des grappes soit composé d’individus
ayant des caractéristiques diversifiées.
Cependant, il faudra que l’ensemble des grappes soient relativement
semblables, tant par la taille que par leur composition.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Les étapes à suivre:


1- On sépare la population en grappes hétérogènes de taille
semblable qu’on numérote.
2- On détermine la taille de l’échantillon « n »voulu.
3- On calcule le nombre de grappes qu’il faudra choisir pour
constituer l ’échantillon
𝑛
Nombre de grappes = 𝑛𝑜𝑚𝑏𝑟𝑒 𝑚𝑜𝑦𝑒𝑛 𝑑 ′ 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠 𝑝𝑎𝑟 𝑔𝑟𝑎𝑝𝑝𝑒
4- On choisit le nombre de grappes nécessaires par la
méthode d’échantillonnage aléatoire simple.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exemple:
On veut bien choisir 12 salariés dans un groupe de 60.
1- On demande de se regrouper par 6. On aura alors 10
grappes de 6 salariés.
2- La taille de l’échantillon est n = 12.
3- Nombre de grappe à choisir = 12/6 = 2.
4- On choisit au hasard deux regroupements, par exemple les
grappes numéro 4 et 7 en retenant tous les individus de ces
deux grappes, on constitue un échantillon donc de 12 salariés.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Avantages et inconvénients de l’échantillonnage par grappes


 Avantages:
- La méthode permet de limiter l’échantillon à des groupes proches
géographiquement par exemple, ce qui permet de réduire les frais de
déplacement et de supervision..
 Inconvénients:

L’échantillonnage par grappes peut entrainer des résultats imprécis.


Les éléments voisins ont en effet tendance à se ressembler. Ainsi, les
caractéristiques socioéconomiques des habitants d’un quartier
présentent en général plus de similitudes que celles de toute la
population d’une ville.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Méthodes d’échantillonnage empiriques

Des techniques où les éléments de l’échantillon sont choisis sur le


terrain en fonction de jugements sur les caractéristiques de la
population. Elles ne nécessitent pas de base de sondage.
Elles sont rapides, et pas très chères.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 L’échantillonnage par quotas ou proportionnel:


C’est l’une des techniques les plus répandues, Elle repose sur le
principe: reproduire le plus fidèlement possible les caractéristiques
de la population étudiée grâce à l’application de règles très
précises. Par ce procédé, on va chercher à construire un
échantillon qui ressemble à la population mère.
Méthode par laquelle on sélectionne les individus qui feront partie
de l’échantillon en s’assurant que l’échantillon sera représentatif
des différents groupes de la population. Toutefois les individus de
l’échantillon ne sont pas choisi au hasard.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exemple:
Dans une population de salariés, il y a 52% d’hommes et 48%
de femmes. Pour n = 200 on retiendra alors 104 hommes et
96 femmes.
Cette méthode consiste à choisir arbitrairement des individus
de chaque strate de la population en respectant la proportion
des strates dans la population

Méthode des quotas = construire un échantillon qui soit réduit


de la population étudiée.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Les inconvénients de la méthode sont ceux des méthodes non


aléatoire :
- Existence de biais, la qualité des enquêtes repose sur celle
du travail de l’enquêteur
- Impossibilité de calculer des marges d’erreur

Les avantages:
- Des coûts et des délais de réalisation plus faible que ceux
d’une enquête aléatoire
- Des résultats que l’on peut qualifier de fidèles
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Echantillonnage boule de neige:


Méthode par laquelle on constitue un échantillon en
choisissant d’abord arbitrairement un petit groupe d’individus
ayant les caractéristiques recherchées pour l’étude. Par la
suite, on demande à ces individus de sélectionner d’autres
personnes de leur entourage qui présentent les mêmes
caractéristiques pour qu’ils prennent partie à l’échantillon.
Cette méthode est particulièrement utile lorsqu’on veut
atteindre une population difficile à rejoindre.(voir leurs
réseaux)
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Echantillons « accidentels » ou à l’aveuglette:


Il s’agit d’un échantillon constitué d’individus qui se trouvaient
accidentellement à l’endroit et au moment où l’information a
été collectée.

Exemple:
Enquêtes réalisés dans la rue, les lieux publics, en sortie des
grandes surfaces……..
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Echantillons de volontaires:
Dans le cas d’expériences psychologiques ou médicales,
d’enquêtes sur les habitudes de consommation, il ne serait
pas pratique de choisir au hasard des individus dans toute la
population.
Comme l’enquête sera longue, exigeante, quelques fois même
désagréable, on préfère réunir des volontaires, d’où le nom
d’échantillonnage de volontaires. Néanmoins , il faut toujours
craindre un écart entre les caractéristiques des volontaires et
celle de la population.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Comparaison entre les différentes méthodes

 Le deuxième type de méthode d’échantillonnage empirique est


privilégiée par les instituts de sondage et de marketing tandis que la
première est utilisée par les statisticiens professionnels .

 Chacune de ses méthodes a des avantages et des inconvénients


mais les études comparatives entre sondages probabilistes et
sondages par quotas ont montré l’équivalence des performances des
deux méthodes.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 En conclusion sur ces techniques d’échantillonnage, l’utilisation de


ces techniques permet de reproduire fidèlement la population cible
que vous étudiez et de ce fait vous garantir la représentativité de
votre échantillon. Mais en matière de sondage, il n’existe pas de
certitude même si l’échantillon a été obtenu par utilisation d’une
méthode rigoureuse. Les pourcentages obtenus, résultats du
sondage, ont donc toujours une marge d’erreur liée au fait qu’on
interroge qu’une fraction de la population.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

II Distributions d’échantillonnage

Soit dans une population mère Ω de taille N, une variable aléatoire X


pour laquelle l’espérance mathématique m, la proportion p et l’écart
type 𝜎 sont connus.
De cette population sont issu p échantillons E1, E2 ,E3….., Ep de taille n
qui auront des moyennes et des écarts types différents.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

La notion de distribution d’échantillonnage peut être résumée et schématisée :

Population mère Ω Echantillon 1 Echantillon 2 Echantillon p


Taille N Taille n Taille n Taille n
Moyenne: m connue Espérance: x1 Espérance: x2 Espérance: xp
Proportion: p connue Proportion: f1 Proportion: f2 Proportion: fp
Ecart type: 𝜎 connue Ecart type: 𝜎1 Ecart type: 𝜎2 Ecart type: 𝜎p

Objectif: Déduire les caractéristiques d’un échantillon


de la connaissance des caractéristiques de la population mère
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 A/ Distribution d’échantillonnage des moyennes


Les moyennes de chaque échantillon varient d’un échantillon à l’autre et
représentent la distribution des moyennes de la variable aléatoire Xn qui
associe à tout échantillon de taille n la moyenne de cet échantillon. La
variable aléatoire Xn prend donc les valeurs x1, x2……. xp
• Valeurs caractéristiques Xn :

 L’espérance mathématique de la variable Xn est égale à celle de la


population mère:
E(Xn) = m
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 La variance de la variable aléatoire Xn est égale à celle de la


population mère rapportée à la taille de l’échantillon:
𝜎𝟐
V(Xn) =
𝒏
L’écart type de la variable aléatoire Xn se déduit de la variance:
𝜎
𝜎(Xn) =
√𝒏
Remarque: Si les échantillons sont issus d’une population mère finie et
sont constitués sans remise, l’espérance mathématique de Xn est
toujours égale à m, mais l’écart type est corrigé par le facteur ou
𝑵−𝒏
(coefficient) d’exhaustivité :
𝑵−𝟏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

𝜎 𝑵−𝒏
𝜎(Xn) =
√𝒏 𝑵−𝟏

 Loi de probabilité de Xn :
Quelle que soit la taille de l’échantillon, si la variable X suit une loi
normale, la variable aléatoire Xn suit une loi normale.
De même ,d’après le théorème de la limite centrale, quelle que soit la
loi suivie par la variable aléatoire X, si n ≥ 30, la variable aléatoire Xn suit
une normale.
Si n ≥ 30 ou si X suit une loi 𝑁(𝑚,𝜎)
𝜎
Xn suit une loi 𝑁(𝑚, )
√𝒏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Intervalles d’acceptation :
Des intervalles d’acceptation centrés sur la moyenne d’un échantillon
de taille n peuvent être calculés au seuil de confiance α
( compris entre 0 et 1):
𝑋−𝑚
P(m-k < Xn < m+k) = α on pose T = 𝜎 qui suit N(0,1)
√𝒏

(m−k) − m (m+k) − m 𝑘 𝜎
P( 𝜎 < 𝑇< 𝜎 ) =α t= 𝜎 t =𝑘
√𝒏
√𝒏 √𝒏 √𝒏
P(−𝑡 < 𝑇 < t) = α
α+1
2𝜋(t) – 1 = α 𝜋(t) = 2
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 La lecture d’une table normale N(0,1) donne:


t= 1,96 pour α = 0,95
t= 2,575 pour α = 0,99
La moyenne d’un échantillon est donc comprise dans un
intervalle d’acceptation :
𝜎 𝜎
𝑚 − 1,96 ; 𝑚 + 1,96 dans 95% des cas
𝒏 𝒏
𝜎 𝜎
𝑚 − 2,575 ; 𝑚 + 2,575 dans 99% des cas
𝒏 𝒏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exercice: Contrôle de qualité


Une machine remplit en grande série des bidons dont la contenance est une variable
aléatoire X d’espérance mathématique égale 15 litres et d’écart type 0,1 litre. Des
échantillons de 100 bidons prélevés au hasard sont constitués pour contrôler leur
contenance.
Soit X100 la variable aléatoire qui à chaque échantillon de taille 100 associé la moyenne de
contenance des bidons de cet échantillon.
1- Déterminer la moyenne et l’écart type de X100 .
2- Déterminer la loi de probabilité de X100 .
3- Calculer la probabilité que la moyenne d’un échantillon de taille 100 tiré au hasard soit :
a) Inférieure à 14,98 litres
b) Comprise entre 15 et 15,02 litres
4- Déterminer un intervalle de confiance, centré autour de la moyenne, dans lequel la
moyenne d’un échantillon de taille 100 tiré au hasard se situera à 95% des cas.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Correction:
1- E(X100) = E(X) = 15 litres
𝜎(X) 0,1
𝜎 (X100) = = = 0,01
𝒏 𝟏𝟎𝟎
2- La taille des échantillons étant supérieur à 30, le théorème de la limite
centrale s’applique, et la loi de probabilité X100 , distribution
d’échantillonnage des moyennes, est la loi normale s’applique N(15;0,01)
14,98 −15
3- a) P(X100 < 14,98) = P(T < ) = P(T < −𝟐) = 1- 𝜋(2)
𝟎,𝟎𝟏
= 1- 0,9772= 0,0228
15−15 15,02−15
b) P(15 < X100 < 15,02) = P( < T100 < ) = P(0 < T100 < 2)
𝟎,𝟎𝟏 𝟎,𝟎𝟏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 P(0 < T100 < 2) = 𝜋 2 − 𝜋(0) = 0,9772 – 0,5 = 0,4772


4- La moyenne d’un échantillon de taille 100 appartient dans 95% des
cas à l’intervalle:
0,1 𝟎,𝟏
15 − 1,96 ; 15 + 1,96 = 14,9804 ; 15,0196
𝟏𝟎𝟎 𝟏𝟎𝟎
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

B/ Distribution d’échantillonnage des proportions(ou des fréquences)


Soit une population mère Ω, dont une proportion p connue (ou non avec la
proportion q= 1-p ) le caractère étudié.
De cette population sont issus des échantillons de taille n qui auront des
fréquences différentes.
Les fréquences fi de chaque échantillon varient d’un échantillon à l’autre
et représentent la distribution des fréquences de la variable aléatoire Fn
qui associe à tout échantillon de taille n la fréquence de cet échantillon.
La variable aléatoire Fn prend donc la valeurs f1 ; f2 ; f3 ; f4 ……. fp
B-1Valeurs caractéristiques de Fn:
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

L’espérance mathématique de la variable Fn est égale à celle de la
population mère:
E(Fn) = p
En effet, la constitution d’un échantillon quelconque de taille n consiste
à répéter n fois de façons indépendantes une épreuve de Bernoulli de
probabilité p.
Le nombre de personnes de l’échantillon de taille n qui présente le
caractère étudié est donc une variable aléatoire P qui suit une loi
binomiale B(n , p) d’espérance np et d’écart type 𝑛𝑝𝑞
𝑃
La fréquence Fn étant le rapport l’espérance Fn est:
𝑛
𝑃 1 1
E(Fn) = E( ) = E(P) = np = p
𝑛 𝑛 𝑛
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

La variance de la variable aléatoire Fn:


La variance de la variable aléatoire Fn est égale
𝑃 1 1 𝑝𝑞
V( )
𝑛
=
𝑛2
V(P) = 𝑛2
npq =
𝑛
𝑝𝑞
V(Fn) =
𝑛
L’écart type de la variable Fn se déduit de la variance :
𝒑𝒒
𝜎(Fn) = 𝒏
Remarque: Si les échantillons sont issus d’une population mère finie et sont
constitués sans remise, l’espérance mathématique de Fn est toujours égale à p,
𝑵−𝒏
mais l’écart type est corrigé par le facteur d’exhaustivité 𝑵−𝟏

𝒑𝒒 𝑵−𝒏
𝜎(Fn) = 𝒏 𝑵−𝟏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 B-2 Loi de probabilité de Fn :


La variable P suit une loi binomiale B( n, p )
D’après le théorème de la limite centrale, si n ≥ 30, la variable aléatoire
P
Fn= suit une loi normale
n
Si n ≥ 30
𝒑𝒒
Fn suit une loi 𝑁(𝑝 , )
𝒏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Remarques:
 Si les conditions sont vérifiés, une approximation de Fn par une loi de
Poisson est envisageable.
P
 P étant une variable aléatoire discrète, Fn = est également une
n
variable aléatoire discrète.
Il est donc souhaitable d’effectuer une correction de continuité pour
obtenir une meilleure approximation des résultats.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 B-3 Intervalles d’acceptation de Fn :


Des intervalles d’acceptation centrés sur la proportion ou fréquence
d’un échantillon de taille n peuvent être calculés au seuil de confiance
α compris entre 0 et 1.
La proportion d’un échantillon est comprise dans un intervalle
d’acceptation :
𝒑𝒒 𝒑𝒒
𝒑 − 1,96 ;𝒑 + 1,96 dans 95% des cas
𝒏 𝒏
𝑝𝑞 𝑝𝑞
𝒑 − 2,575 ; 𝒑 + 2,575 dans 99% des cas
𝑛 𝑛
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Exercice: Soit un fichier clients Marjane de ventes par correspondance


dont 75% passent une commande par an. Des échantillons de 500 clients
sélectionnés au hasard sont constitués.
Soit F500 la variable aléatoire qui à chaque échantillon de taille 500 associé
la proportion des clients de cet échantillon ayant passé une commande.
1- Déterminer l’espérance mathématique et l’écart type de F500 .
2- Calculer la probabilité que la proportion de clients ayant commandé d’un
échantillon de taille 500 doit:
a) Strictement supérieur à 76%.

b) Comprise entre 74% et 77%.

3- Déterminer un intervalle centré autour de la proportion dans lequel la proportion


d’un échantillon de taille 500 tiré au hasard sera située dans 99%des cas.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 Eléments de réponse:
1- E ( F500) = 0,75 𝜎(F500) = 𝟎,𝟕𝟓 𝐱 𝟎,𝟐𝟓
𝟓𝟎𝟎
≈ 0,019365
2- les conditions d’approximation de F500 par une loi normale
N = ( 0,75 , 0,01936) sont réunis .Des corrections de continuité seront
effectuées.
𝟎,𝟕𝟔−𝟎,𝟕𝟓
a) P(F500 > 0,76) = 1- P(T ≤ ) = 0,3015
𝟎,𝟎𝟏𝟗𝟑𝟔𝟓
𝟎,𝟕𝟒−𝟎,𝟕𝟓 𝟎,𝟕𝟕−𝟎,𝟕𝟓
b) P( 0,74 ≤ F500 ≤ 0,77) = P( 𝟎,𝟎𝟏𝟗𝟑𝟔𝟓
≤ T≤ 𝟎,𝟎𝟏𝟗𝟑𝟔𝟓
) = 0,547
3- Dans 99% des cas la proportion d’un échantillon de taille 500
appartiendra à l’intervalle:
𝟎, 𝟕𝟓 − 2,575x 0,019365; 𝟎, 𝟕𝟓 + 2,575x0,019365
𝟎, 𝟕𝟎𝟎𝟏 ; 𝟎, 𝟕𝟗𝟗𝟗
II: EstimationsPr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Soit une population population Ω de taille N, une variable X pour


laquelle l’espérance mathématique m, la population p et l’écart type 𝜎
sont inconnus.
Il s’agit d’estimer, à partir des caractéristiques calculées sur un
échantillon, la valeur des caractéristiques de la population mère.

Population mère Ω Echantillon représentatif

Taille N Taille: n
Moyenne m (inconnu) Espérance : X (connue)

Proportion : p (inconnu) Proportion: f (connue)

Ecart type : 𝜎(inconnu) Ecart type : 𝜎’ (connu)

Déduire les caractéristiques de la population mère


De la connaissance des caractéristiques d’un échantillon
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Plus l’échantillon est grand , plus on arrive à une meilleure estimation. Par
ailleurs, pour diminuer le risque de se tromper, plutôt que donner un nombre
appelé estimation ponctuel , il est possible de donner une fourchette appelée
intervalle de confiance, dans laquelle se trouve le paramètre à estimer.
A- Estimations ponctuelles:
• Estimation ponctuelle d’une moyenne : Soit m la moyenne inconnue de la
variable X définie sur la population mère, et X la moyenne calculée sur un
échantillon de taille n. La moyenne X variant d’un échantillon à l’autre est
une estimation ponctuelle de m.
Le nombre X est une estimation ponctuelle de m
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

• Estimation ponctuelle d’une proportion:


Soit p la proportion inconnue de la variable X définie sur la population
mère, et f la proportion calculée sur un échantillon de taille n. La
proportion f variant d’un échantillon à l’autre est une estimation
ponctuelle de p:
le nombre f est une estimation ponctuelle de p
• Estimation ponctuelle d’une variance et d’un écart type
Soit 𝜎2 la variance et 𝜎 l’écart type inconnus de la variable X définie
sur la population mère et 𝜎′2 la variance calculée sur un échantillon de
taille n.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Contrairement aux estimations précédentes, 𝜎′2 n’est pas une bonne


estimation de la variance de la population mère car 𝜎′2 mesure la
dispersion autour de la moyenne x de l’échantillon et non pas autour de
la moyenne m de la population mère.
Prendre 𝜎′2 sous-estimerait la variance de la population mère, et ce
d’autant plus que la taille n de l’échantillon est petite.
En revanche, le nombre S2 est une estimation ponctuelle de la
variance:
𝒏
Le nombre S2 = 𝜎′2 est une estimation ponctuelle de 𝜎2
𝒏−𝟏

𝒏
Le nombre S= 𝜎′ est une estimation ponctuelle de 𝜎
𝒏−𝟏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Exemple: Durée de traitement de dossiers de crédit


Pour mieux gérer les demandes de crédit de ses clients, le directeur
d’une agence bancaire réalise une étude relative à la durée de
traitement des dossiers. Un échantillon aléatoire non exhaustif de 30
dossiers traités a donné:
Durée en minutes 0 , 10 10, 20 20, 30 30, 40 40, 50 50, 60
Nombre
3 6 10 7 3 1
1- calculer la moyenne et l’écart type des durées de traitement de cet échantillon
2-En déduire des estimations ponctuelles de la moyenne et de l’écart type 𝜎 de la
population totale des dossiers traités.
3- Donner une estimation ponctuelle de la proportion des demandes de la
population totale dont la durée de traitement est de plus de 40 minutes.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Correction:
1- Prendre les centres des classes; x = 26,33 minutes
𝜎′ = 12,31 minutes
2- Une estimation ponctuelle de la moyenne de la population est :
m = 26,33 minutes
Une estimation ponctuelle de l’écart type
𝒏 𝟑𝟎
S= 𝜎′ = 𝟏𝟐, 𝟑𝟏 = 12,52 minutes
𝒏−𝟏 𝟑𝟎−𝟏
3- Une estimation ponctuelle de la proportion p des demandes de la
population totale dont la durée de traitement est de plus de 40 minutes est
4
: = 0,1333
30
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

 B- Estimations par intervalles de confiance:


L’objectif est de déterminer un intervalle symétrique 𝑎 , 𝑏 qui
contiendra le paramètre 𝜃 à estimer avec une probabilité 𝛼 appelée le
seuil de confiance ( le nombre 1- 𝛼 étant appelé seuil ou coefficient de
risque):
P 𝜃 ∈ 𝑎 , 𝑏 =𝛼
1-Estimation par intervalle de confiance d’une moyenne:
Soit m la moyenne inconnue de la variable X définie sur la population
mère, et xn la variable aléatoire qui associe à tout échantillon de taille n la
moyenne de cet échantillon.
Deux cas à envisager, suivant que l’écart type 𝜎 de la variable aléatoire X
est connu ou non.
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Premier cas: L’écart type 𝜎 de la population est connu


Quand les conditions sont réunies (si n ≥ 30 𝑜𝑢 𝑠𝑖 X suit une loi
𝜎
normale), la variable aléatoire xn suit une loi normale N (m , ).
√𝒏
Avant d’avoir prélever un échantillon n, la valeur de x que prendra la
variable aléatoire Xn n’est pas connue, mais il est possible de l’encadrer
dans un intervalle symétrique centré autour de m, au seuil de confiance
α
𝜎 𝜎
P(𝑚 − 𝑡α < 𝑋𝑛 < 𝑚 + 𝑡α ) = α
𝒏 𝒏
La valeur de m étant inconnue, l’égalité précédente va être transformée
pour l’encadrer ,
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

𝜎 𝜎
La partie de l’égalité 𝑚 − 𝑡α < 𝑋n peut s’écrire 𝑚 < 𝑋𝑛 +𝑡α
𝒏 𝒏
𝜎 𝜎
La partie de l’égalité 𝑋𝑛 < 𝑚 + 𝑡α peut s’écrire 𝑚 > 𝑋𝑛 − 𝑡α
𝒏 𝒏
L’égalité équivaut donc à:
𝜎 𝜎
P(𝑋𝑛 − 𝑡α < 𝑚 < 𝑋𝑛 + 𝑡α )=α
𝒏 𝒏
Après avoir prélevé un échantillon de taille n, la valeur x est connue, et
une des réalisations de l’intervalle de confiance I est:

𝜎 𝜎
I = 𝑋 − 𝑡α ; 𝑋 + 𝑡α
𝒏 𝒏
Pr M. MERZAQ,ENCG 20-21 Settat 21.12.20

Remarques :
 Avec 𝑡α = 1,96 pour α = 0,95 et 𝑡α = 2,575 pour α = 0,99.
 La moyenne m de la population appartient à l’intervalle calculé dans
α% des cas, ce qui signifie également qu’elle ne peut pas appartenir
à l’intervalle de confiance dans 100 - α% des cas.
 Si elle appartient à l’intervalle, la moyenne m peut être située
n’importe où dans l’intervalle et n’a plus de raison d’être près du
centre.
 Plus le coefficient de confiance α augmente, plus l’amplitude de
l’intervalle augmente: ce qui est gagné en certitude est perdu en
précision.

Vous aimerez peut-être aussi