Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

02 Echantillonnage

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 20

ECOLE DES HAUTES ETUDES COMMERCIALES

Module : Statistique de Gestion


Niveau : 1re anne Master (TC)
Groupes : 1, 2, 7 et 8

Anne Acadmique : 2013/2014


Enseignant : KHERRI Abdenacer
Site web : www.sg-ehec.jimdo.com

Support pdagogique de cours N 02 :

Echantillonnage
Plan du cours :
1. Introduction.
2. Terminologie.
3. Echantillonnage.
3.1. Dfinition.
3.2. Mthodes dchantillonnage.
3.2.1. Mthodes probabilistes (Alatoires).
Echantillonnage alatoire simple.
Echantillonnage alatoire stratifi.
Echantillonnage alatoire par grappes.
Echantillonnage alatoire systmatique.
3.2.2. Mthodes non probabilistes (Raisonnes ou Empiriques)
Echantillonnage par quotas.
Echantillonnage de convenance (de commodit).
Echantillonnage selon le jugement.
Echantillonnage boule de neige.
4. Distribution dchantillonnage.
4.1. Distribution dchantillonnage de la moyenne.
4.2. Distribution dchantillonnage de la variance.
4.3. Distribution dchantillonnage de la frquence.
4.4. Distribution dchantillonnage de la diffrence des moyennes.
5. Synthse.

[ Page 1 sur 20 ]

1. Introduction :
L'tude de proprits caractristiques d'un ensemble, quand on ne dispose pas encore de
donnes, ncessite d'examiner, d'observer des lments de cet ensemble. La manire de
recueillir ces donnes fait l'objet d'une thorie mathmatique appele thorie des sondages ou
encore thorie de l'chantillonnage ( en anglais : sampling theory ), Cette thorie concerne
l'optimisation de la collecte des donnes selon divers critres et rpond certaines
interrogations sur la faon de procder cette collecte en rapport avec l'information disponible
et l'effort d'chantillonnage consenti.
2. Terminologie :
Terme

Dfinition

Cadre dchantillonnage

Une liste dlment partir desquels lchantillon est slectionn.

Distribution
dchantillonnage

Distribution de probabilit compose de toutes les valeurs possibles dune


statistique dchantillon.

Echantillon

Un sous ensemble de la population considre, le nombre d'individus dans


lchantillon est la taille de l'chantillon.

Echantillonnage

La slection dune partie dans un tout (la slection dune partie dans la
population), lchantillon slectionn doit tre reprsentatif de la population.

Mthodes
dchantillonnage

Ensemble des mthodes permettant de raliser un sondage (de prlever un


chantillon de donnes) au sein dune population, de manire reproduire un
chantillon aussi reprsentatif que possible de cette population.

Paramtre

Caractristique numrique dune population telle que la moyenne de la


population "", lcart type de la population "" et la proportion de la
population "p".

Population

Ensemble que l'on observe et qui sera soumis une analyse statistique, chaque
lment de cet ensemble est un individu ou unit statistique.

Population finie

Une population qui consiste en un nombre fini d'lments.

Population infinie

Une population est infinie sil n'y a pas de limite au nombre d'lments qu'il
contient.

Population homogne

Une population avec des lments qui possdent les mmes caractristiques.

Population non homogne

Une population avec des lments qui ne possdent pas les mmes
caractristiques.

Tirage exhaustif

Tirage sans remise.

Tirage non exhaustif

Tirage avec remise.

Population chantillonne

La population partir de laquelle lchantillon est constitu.

Thorie dchantillonnage

Etude des liaisons existant entre une population et les chantillons de cette
population.

[ Page 2 sur 20 ]

3. Echantillonnage :
Dfinition (1) : Lchantillonnage est le procd utilis pour choisir un chantillon et qui
est la base de l'enqute par sondage1.
Dfinition (2) : lchantillonnage est la phase qui consiste slectionner les individus que
lon souhaite interroger au sein de la population de base.2
Prenons tous les chantillons possibles de taille n tirs dune population donne. Pour
chaque chantillon, on peut calculer une statistique (moyenne, cart-type, variance, etc...) qui
variera avec lchantillon. Pour tous les chantillons, on obtient alors une distribution de la
statistique que lon nomme la distribution dchantillonnage. Pour la validit des rsultats, il
est important que les chantillons soient reprsentatifs de la population concerne.

Combien dchantillons de n lments peuvent tre isols dune population de N lments ?


On distingue entre deux cas de tirage :
Tirage exhaustif (sans remise) : nombre dchantillons est
Tirage non exhaustif (avec remise) : nombre dchantillons est

3.1.

Mthodes dchantillonnage :

Lchantillonnage peut se faire avec ou sans remise et une population peut tre considre
comme finie ou infinie. Une population finie dans laquelle on procde un chantillonnage
avec remise peut tre thoriquement considre comme infinie.
Dans la pratique, il en va de mme pour des populations finies mais de grandes tailles.
Pour chaque distribution dchantillonnage, on peut calculer une moyenne, un cart type, une
varianceetc.

1. http://www.larousse.fr/dictionnaires/francais/echantillonnage
2. http://www.definitions-marketing.com/Definition-Echantillonnage-etude

[ Page 3 sur 20 ]

Schma N 01 : Les mthodes dchantillonnage


Mthodes dchantillonnage

Mthode probabilistes
( Alatoires )

Mthode non probabilistes


( Raisonnes ou Empiriques )

Echantillonnage alatoire simple

Echantillonnage par quota

Echantillonnage stratifi

Echantillonnage de convenance

Echantillonnage par grappes

Echantillonnage selon le jugement

Echantillonnage systmatique

Echantillonnage de boule de neige

Source : labor par lenseignant

Schma N 02 : Les mthodes dchantillonnage

Population

Finie

Homogne

Alatoire
simple

Alatoire
stratifi

Infinie

Non homogne

Alatoire
par grappes

Alatoire
systmatique

Homogne

Jugement

Convenance

Non homogne

Boule
de neige

Quota

(SPSS) )( :
.28 2012

[ Page 4 sur 20 ]

3.1.1. Mthodes probabilistes (Alatoires) :


Lchantillonnage probabiliste repose sur un choix dunits dans la population fait au
hasard, ce nest pas lenquteur qui choisit les units, cest la mthode utilise pour la slection
qui le fait. Une des caractristiques de cette mthode est que chaque unit de la population a
une probabilit mesurable dtre choisie.
Lavantage de la mthode dchantillonnage probabiliste est quelle permet de gnraliser
les rsultats de lchantillon lensemble de la population en sappuyant sur une thorie
statistique reconnue.
Son seul inconvnient est quil faut possder une liste de toutes les units formant la
population avant de procder la slection de lchantillon.
Voici les quatre types dchantillonnage probabiliste que lon peut effectuer :
3.1.1.1.

Echantillonnage alatoire simple :

Un chantillon alatoire simple est un chantillon slectionne de manire ce que chaque


chantillon possible de taille "n" ait la mme probabilit dtre slectionn, On prlve dans la
population des individus au hasard, tous les individus ont la mme probabilit dtre prlevs,
et ils le sont indpendamment les uns des autres.
3.1.1.2.

Echantillonnage alatoire stratifi :

On suppose que la population soit stratifie, constitue de sous-populations homognes,


les strates. (ex : stratification par tranche dage). Dans chaque strate, on fait un chantillonnage
alatoire simple, de taille proportionnelle la taille de strate dans la population (chantillon
reprsentatif). Les individus de la population nont pas tous la mme probabilit dtre tirs.
Ncessite une homognit des strates.
Le chercheur divise la population en sous-groupes distincts et homognes (strates) partir
desquels il slectionnera un chantillon alatoire simple.
tapes :
1. choisir une variable de stratification (ex : tranche dage).
2. Slectionner un chantillon alatoire dans chaque strate.

[ Page 5 sur 20 ]

Population
(N)

Echantillon
(n)

Strate 1

n1

Strate 2

n2

Strate 3

n3

Strate 4

n4

Echantillon final (n) = n1 + n2 + n3 + n4

Exemple :
Supposons que 60% des tudiants de lcole HEC sont des filles et 40% des garons, pour
former un chantillon de 120 tudiants en respectant ces strates, on devrait choisir au hasard
60% x 120 = 72 filles et 40% x 120 = 48 garons.
Avantages et dsavantages de la mthode :
L'chantillonnage stratifi a l'avantage d'assurer une bonne reprsentation des diffrentes
strates de la population dans lchantillon. Il permet aussi dobtenir des estimations pour
chacune des strates de la population. Toutefois, pour utiliser cette mthode il faut avoir des
renseignements sur la rpartition des strates dans la population.

[ Page 6 sur 20 ]

3.1.1.3.

Echantillonnage alatoire par grappe :

On tire au hasard des grappes ou familles dindividus, et on examine tous les individus de
la grappe (ex: on tire des immeubles puis on interroge tous les habitants). La mthode est
dautant meilleure que les grappes se ressemblent et que les individus dune mme grappe sont
diffrents, contrairement aux strates.
Le chercheur divise la population en sous-groupes appels grappes . Les grappes ont le
mme profil, la variance dune grappe lautre tant faible. Il slectionne par la suite un
chantillon alatoire de grappes et non pas un chantillon alatoire lintrieur de chaque
grappe.

Population
(N)

Echantillon
(n)

Grappe
1Strate 4
Grappe 2

Grappe 2
n1

Grappe 3
Grappe 4

Grappe 5
n5

Grappe 5
Grappe 6

Grappe 8
n8

Grappe 7
Grappe 8

Echantillon final (n) = n1 + n5 + n8


Exemple :
Les tudiants de premire anne Master HEC sont rpartis en 11 groupes, les groupes
sont numrots de 1 11. Supposons que lon obtienne les nombres 2, 5, 7 et 10, tous les
tudiants de ces 4 groupes feront partie de lchantillon.
[ Page 7 sur 20 ]

Avantages et dsavantages de la mthode :


L'avantage de cette mthode par rapport aux prcdentes est qu'elle ne requiert pas au
pralable la liste de la population, seule la liste des units pour les grappes piges est
ncessaire. Un dsavantage de ce type d'chantillonnage est qu'il produit des estimations
habituellement moins prcises que lchantillonnage alatoire simple parce que des units
appartenant une mme grappe ont tendance prsenter des caractristiques semblables. Cette
perte de prcision peut tre compense par une augmentation de la taille de lchantillon.
3.1.1.4.

Echantillonnage alatoire systmatique :

Dans certaines situations, spcialement lorsque les populations sont importantes, il est
coteux (en temps) de slectionner un chantillon alatoire simple en trouvant tout dabord un
nombre alatoire et ensuite en cherchant dans la liste de la population llment correspondant.
Une alternative de lchantillonnage alatoire simple est lchantillonnage systmatique. Par
exemple, si lon souhaite slectionner un chantillon de taille 50 parmi une population
contenant 5000 lments, cela revient slectionner un lment tous les (5000/50) = 100
lments de la population. Constituer un chantillon systmatique dans ce cas consiste
slectionner alatoirement un lment parmi les 100 premiers de la liste de la population. Les
autres lments de lchantillon sont identifis de la faon suivante : le second lment
slectionn correspond au 100e lment qui suit le premier lment slectionn dans la liste de
la population, le troisime lment slectionn correspond au 100e lment qui suit le deuxime
lment slectionn dans la liste de la population, et ainsi de suite. En fait, lchantillon de taille
50 est identifi en se dplaant systmatiquement dans la population et en identifiant les 100e,
200e, 300e etc. lments qui suivent le premier lment choisi alatoirement. Lchantillon de
taille 50 est gnralement plus facile identifier de cette manire quen utilisant
lchantillonnage alatoire simple. Puisque le premier lment slectionn lest alatoirement,
un chantillon systmatique est gnralement suppos avoir les proprits dun chantillon
alatoire simple, cette hypothse est particulirement approprie lorsque la liste de la
population est une numration alatoire des lments de la population1.

1. Anderson, Sweeney et Williams, Statistique pour lconomie et la gestion, dition De Boeck, Bruxelles, Belgique, 2010, P364.

[ Page 8 sur 20 ]

3.1.2. Mthodes non probabilistes (Raisonnes ou empirique) :


L'chantillonnage non probabiliste repose sur un choix arbitraire des units, cest
lenquteur qui choisit les units et non le hasard. En ce sens, il serait donc aventureux de
gnraliser les rsultats obtenus pour lchantillon toute la population. Malgr cela, ces
mthodes sont souvent utilises dans certaines disciplines. En voici quelques-unes :
3.1.2.1. Echantillonnage par quota :
Lorsque le chercheur veut reproduire les caractristiques dune population (ex. ge, sexe,
revenus, etc.) dans son chantillon.
3.1.2.2. Echantillonnage de convenance (de commodit) :
Cas o les units dchantillonnage sont faciles rejoindre, disponibles et gnralement
facile convaincre.
3.1.2.3. Echantillonnage selon le jugement :
Le chercheur juge que lchantillon va lui permettre datteindre les objectifs de la
recherche.
3.1.2.4. Echantillonnage boule de neige :
Utile dans le cas de la raret des units dchantillonnage ou de labsence dun cadre
dchantillonnage valide. On demande un rpondant de nous rfrer un autre qui prsente
les mmes caractristiques que les siennes, et ainsi de suite

[ Page 9 sur 20 ]

4. Distribution dchantillonnage :
La distribution dchantillonnage est ltude de la de probabilit de lchantillon en
fonction de la distribution de la variable parente lorsque la taille de lchantillon augmente.
Pour rsoudre les problmes destimation de paramtres inconnus, il faut tout dabord
tudier les distributions dchantillonnage, cest dire la loi de probabilit suivie par
lestimateur.
Considrons tous les chantillons possibles de taille n extraits dune population de taille N,
de moyenne , de variance 2, etc. Pour chaque chantillon, il est possible de calculer les
paramtres statistiques

, ,

etc qui varient dun chantillon lautre. Chaque paramtre

possdera ainsi une distribution dchantillonnage au mme titre que la variable alatoire X.
On utilise souvent :

Taille
Moyenne
Ecart-type
Variance
Proportion

4.1.

Population

Echantillon

Distribution
Distribution
dchantillonnage dchantillonnage
des variances
des moyennes
/
/

Distribution dchantillonnage des moyennes :


Soit une population de taille N, on dsigne par et la moyenne et lcart-type de cette

population respectivement. On extrait de la population une srie dchantillons de taille n,


chacun de ces chantillons a une moyenne , les diffrentes moyennes obtenues constituent une
distribution dchantillonnage de moyenne

, on dsigne par

type de la distribution dchantillonnage de la moyenne.

[ Page 10 sur 20 ]

et

la moyenne et lcart-

On a :

Si le tirage est exhaustif (sans remise) :

Dans le cas o la population est infinie ou le tirage est non exhaustif (avec remise) :

Remarques1 :
Si n est petit devant N, la distinction entre exhaustivit et non exhaustivit est sans objet

car

Si la taille des chantillons est assez grande (en pratique

30), la distribution

dchantillonnage de la moyenne approche la distribution normale quelle que soit la


distribution de la population.
Si la population est normalement distribue, la distribution dchantillonnage de la
moyenne est une loi normale quelle que soit la valeur n de la taille des chantillons.

Exemple corrig : [ exemple pour but de confirmer les formules prcdentes ]


On a une population finie compose de 3 lments,
" = # , , %&

- Calculer la moyenne et lcart-type de cette population.


Rponse :
On sait que

()

Et on sait aussi que


Donc :
=1

()

=2

2
3

Rsultats finaux :

* *%
%

= =
+
%

et que

et

*/*0
%

/=

() ( (
/

/=

()

=%

1. KHALDI Khaled, Mthodes statistiques (rappel de cours et exercices corrigs), 6me dition, OPU, Alger, Algrie, 2010, P76.

[ Page 11 sur 20 ]

On va effectuer des prlvements des chantillons de taille ( =

), on fait le

prlvement dans les deux cas (tirage exhaustif et tirage non exhaustif).
Cas 1 (Tirage non exhaustif / tirage avec remise) :
- Quelle est le nombre des chantillons qui peuvent tre prlevs partir de cette
population ?
- Effectuez le prlvement de ces chantillons.
- Etablir une distribution dchantillonnage des moyennes.
- Calculez la moyenne de la distribution dchantillonnage des moyenne

- Calculez lcart-type de la distribution dchantillonnage des moyenne

= et

- Peut-on nous confirmer les deux formules suivantes

Rponse :
-

Parce que le tirage est avec remise donc le nombre des chantillons possible tre prlevs est une
= % = 0

liste n lments pris parmi N lments c--d


-

Les chantillons sont les suivants :

La distribution dchantillonnage des moyennes est la suivante :


78 9: ;<:=>;:? 9@ B8 ;:DD?

( , )( , )( , %)
4 = 5( , )( , )( , %)6
(%, )(%, )(%, %)

La moyenne de la distribution dchantillonnage des moyennes :


=

(=

Lcart-type de la distribution dchantillonnage des moyennes :


=

( )( , I)( )
F = 5( , I)( )( , I)6
( )( , I)(%)

8EF 9F G?HF

(K

%0
%0 %+ %
/=
= =
0
0
0 %

=1

1
=2
3

Confirmation :

formule confirme

2
3

1
3

formule confirme
[ Page 12 sur 20 ]

Cas 2 (Tirage exhaustif / tirage sans remise) :


- Quelle est le nombre des chantillons qui peuvent tre prlevs partir de cette
population ?
- Effectuez le prlvement de ces chantillons.
- Etablir une distribution dchantillonnage des moyennes.
- Calculez la moyenne de la distribution dchantillonnage des moyenne

- Calculez lcart-type de la distribution dchantillonnage des moyenne

= et

- Peut-on nous confirmer les deux formules suivantes

Rponse :
-

Parce que le tirage est sans remise donc le nombre des chantillons possible tre prlevs est une
combinaison de n lments pris parmi N lments c--d NO =

Les chantillons sont les suivants :

La distribution dchantillonnage des moyennes est la suivante :

La moyenne de la distribution dchantillonnage des moyennes :

78 9: ;<:=>;:? 9@ B8 ;:DD?

= =3
Q

F = #( , I)( )( , I)&

8EF 9F G?HF

(=

+
%

Lcart-type de la distribution dchantillonnage des moyennes :


=

)!

4 = #( , )( , %)( , %)&

=
-

O!

!(O

(K

,I
/=
%

=1

1
=2
6

,I
%

Confirmation :

formule confirme
=

2
3

1
3

1
6

formule confirm

[ Page 13 sur 20 ]

R, I
=
%
+

Exemples corriger :
Exemple (01) : [Distribution dchantillonnage de la moyenne]
On choisit au hasard sans remise six nombres parmi les nombres entiers de 1 9, chacun de
ces nombres a la mme probabilit dtre choisi1.
Quel est le type dchantillonnage dans ce cas ?
Quel est le type de tirage dans ce cas ?
Quel est le nombre des chantillons possible dtre prlever de la population mre ?
Calculer la moyenne et lcart-type de la distribution dchantillonnage des moyennes.
Rponse :

......
...

...
...
...

...
...
...

...
...
...
...
...

1. KHALDI Khaled, Mthodes statistiques (rappel de cours et exercices corrigs), op.cit, P84.

[ Page 14 sur 20 ]

Exemple (02) : [Distribution dchantillonnage de la moyenne]


On choisit au hasard avec remise six nombres parmi les nombres entiers de 1 9, chacun de
ces nombres a la mme probabilit dtre choisi1.
Quel est le type dchantillonnage dans ce cas ?
Quel est le type de tirage dans ce cas ?
Quel est le nombre des chantillons possible dtre prlever de la population mre ?
Calculer la moyenne et lcart-type de la distribution dchantillonnage des moyennes.
Rponse :

......
...

...
...
...

...
...
...

...
...
...
...
...
...

1. KHALDI Khaled, Mthodes statistiques (rappel de cours et exercices corrigs), op.cit, P76.

[ Page 15 sur 20 ]

Exemple (03) : [Distribution dchantillonnage de la moyenne]


La moyenne des notes dune preuve de statistique de 300 tudiants est gale 9,8 et lcarttype est de 3,68. Trouver la probabilit quun chantillon alatoire de notes de 40 tudiants
extrait de lensemble ait une moyenne :
1. Comprise entre 10 et 13.
2. Infrieure 10.
NB : Trouver la probabilit dans les deux cas (tirage exhaustif et non exhaustif)
Rponse :

......
...

...
...
...

...
...
...

...
...
...
...
...
...

[ Page 16 sur 20 ]

Distribution dchantillonnage des variances :

4.2.

Chaque chantillon de taille n de la population une variance T = VWKU(


U

variances sont des valeurs observes dune mme variable alatoire.

) , ces

T = VWKU(LW L) On a :
U

X(T ) =
Y(T ) =

V U
V

1
O

Z( 1)

( 3)

[\

Distribution dchantillonnage des frquences :

4.3.

La probabilit de la ralisation dun vnement est suppose tre gale p. on considre


les chantillons de taille n extraits, avec remise, dune population de taille N. a chaque
chantillon extrait correspond une frquence ]V de ralisation de lvnement considr.

On a :

Si le tirage est avec remise :


X(]V ) =

Y(]V ) =

(1 )

Si le tirage est sans remise :


X(]V ) =

Y(]V ) =

(1 ) _
.
_1

Exemples :
Exemple (01) : [Distribution dchantillonnage de la frquence]
Un fabricant de clous a dtermin que 3% des clous produits sont dfectueux. On tudie
un chantillon alatoire de 300 clous. Quelle est la probabilit que la proportion de clous
dfectueux dans lchantillon soit comprise entre 2% et 3,5% ?

[ Page 17 sur 20 ]

Rponse :

......
...

...
...
...

...
...
...

...
...
...

4.4.

Distribution dchantillonnage des diffrences des moyennes :

On considre 2 populations P1 et P2 de moyennes


sintresse la diffrence
on a :
`a `
` a `
` a `

=
=

`a

` a

[ Page 18 sur 20 ]

et

et de variances

et

. On

Exemple (01) : [Distribution dchantillonnage des diffrences des moyennes]


La rsistance la rupture du htre et du bouleau sont respectivement de 4500 kg et de
4000 kg avec des carts-type respectifs de 200 kg et 300 kg. Si lon teste des chantillons de
100 bouleaux et 50 htres :
Calculez

`a `

et

` a `

Rponse :

......
...

...
...
...

...
...
...

...
...
...
...
...
...

[ Page 19 sur 20 ]

5. Synthse :
Echantillonnage alatoire simple
Avec remise

Sans remise

_V

Nombre dchantillons

Distribution dchantillonnage
de la moyenne

NcV

Distribution dchantillonnage
de la variance
2

Distribution dchantillonnage
de lcart-type

Distribution dchantillonnage
de la frquence

_
2
_1

X(]V ) =

Y(]V ) =

X(]V ) =

(1 )

Y(]V ) =

(1 )

Le tableau ci-dessous envisage tous les cas auxquels vous pouvez tre confronts1 :
Paramtre d'chantillon

Loi de la

contrler

population

Moyenne L

Normale ou
quelconque
avec n > 30

Variance T

Normale

Proportion ]

n > 50

. http://www.iutbayonne.univ-pau.fr/~grau/2A/stat/cadre2.html

[ Page 20 sur 20 ]

Statistique

L
d
e

( 1)T

1 (1 )

Loi
N(0,1)
ou
~ N(0,1)
f

n-1 d.d.l.
~ N(0,1)

Vous aimerez peut-être aussi