Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Statistique

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 71

Comptabilit dentreprise

Prsentation du module
RESUME DE THEORIE
SOMMAIRE
9
10
Chapitre I- Les statistiques descriptives : 11
I- Terminologie : 11
II- Tableaux statistiques : 12
A- Cas dune seule variable 12
B- Cas de deux variables 13
III- Reprsentations graphiques : 14
A- Variable qualitative 14
B- Variable quantitative 16
1) Variable discrte 16
2) Variable classe 17
IV- Caractristiques de tendance centrale et de position : 19
A- Mode 19
B- Mdiane 20
C- Moyenne arithmtique 21
D- Moyenne gomtrique 22
E- Moyenne harmonique 22
F- Moyenne quadratique 22
G- Quantiles 23
V- Caractristiques de dispersion : 23
A- tendue 23
B- Intervalle inter-quartile 23
C- Variance et cart-type 24
D- Coefficient de variation 24
VI- La concentration : 25
A- Valeurs globales 25
B- Mdiale 25
C- Courbe de concentration (ou de LORENZ) 26
D- Indice de GINI 26
VII- Les indices : 27
A- Indices lmentaires 27
B- Indices de LASPEYRES et de PAASCHE 28
1) Indice de Laspeyres des prix 29
2) Indice de Laspeyres des quantits 29
3) Indice de Paasche des prix 29
4) Indice de Paasche des quantits 29
4
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
VIII- Rgression et corrlation : 30
A- Ajustement dun nuage de points une fonction une fonction 30
mathmatique
B- Mesure de lintensit de la relation linaire entre deux variables 31
1) Covariance 31
2) Coefficient de corrlation linaire 32
3) Droites de rgression 32
IX- Sries chronologiques : 33
A- Dcomposition des chroniques 33
B- La dtermination du trend 34
C- Analyse de la composante alatoire 35
D- Dsaisonnalisation 35
E- Srie ajuste 35
F- Prvisions court terme 35
Chapitre II. Ralisation des enqutes 37
I. Dtermination optimale dun chantillon 37
II. Elaboration du questionnaire 38
Chapitre III. Ralisation des sondages 40
I- Estimateur dune moyenne ou dune proportion 40
II- Variance de ces estimateurs 43
III- Estimation par intervalle de confiance 44
Contrle continu 46
GUIDE DES TRAVAUX PRATIQUES 47
TP1 : reprsentation graphique, paramtres de tendance centrale, de dispersion. 48
TP2 : reprsentation graphique 49
TP3 : paramtres de tendance centrale 50
TP4 : reprsentation graphique, la corrlation 52
TP5 : reprsentation graphique, paramtres de tendance centrale et de dispersion 53
TP6 : ajustement linaire, prvisions et corrlation 55
TP7 : QCM 56
Evaluation de fin de module 76
Liste bibliographique 77
5
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Module : Statistiques Descriptives
RESUME THEORIQUE
11
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Chapitre I- Les statistiques descriptives :
I- Terminologie :
1. Statistique :
La statistique est une mthode scientifique dont lobjet est de recueillir, dorganiser, de
rsumer et danalyser les donnes dune enqute, dune tude o dune exprience, aussi bien
que de tirer les conclusions logiques et de prendre les dcisions qui simposent partir des
analyses effectues.
2. Population :
Ensemble d'individus dfinis par une proprit commune donne.
Exp : si lon veut tudier la dure de vie des ampoules lectriques fabriques par une
compagnie, la population considre est lensemble de toutes les ampoules fabriques par
cette compagnie.
3. Echantillon :
Sous-ensemble de la population.
Exp : pour tablir la dure de vie des ampoules lectriques produites par une machine, on peut
prlever au hasard un certain nombre dampoules - un chantillon- parmi toutes les celles
produites par cette machine.
4. Individu ou unit statistique :
Chaque lment de la population ou de lchantillon.
Exp : dans lexemple prcdant, chaque ampoule constitue un individu ou une unit
statistique.
5. La taille :
Reprsente le nombre dindividus dun chantillon ou dune population. Elle est symbolise
par n dans le cas dun chantillon et par N dans le cas dune population.
6. Le caractre :
Cest laspect particulier que lon dsire tudier.
Exp : concernant un groupe de personnes, on peut sintresser leur age, leur sexe leur
taille
7. Les modalits :
Les diffrentes manires dtre que peut prsenter un caractre.
Exp 1 : le sexe est un caractere qui presente deux modalits : feminin ou masculin
Exp 2 : quant au nombre denfants par famille, les modalits de ce caractere peuvent etre 0,1
2,3,20.
8. Caractre qualitatif :
Ses modalits ne sexpriment pas par un nombre
Exp : la religion, le sexe, lopinion
9. Caractre quantitatif :
Ses modalits sont numriques.
Exp : lage, la taille, le poids
12
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
10. Caractre quantitatif discret
Lensemble des valeurs que peut prendre le caractre est fini ou dnombrable. Le plus
souvent, ces valeurs sont entires.
Exp :le nombre denfant dans une famille, le nombre de tlviseurs par foyer et la pointure
des souliers.
11. Caractre quantitatif continu :
Le caractre peut prendre thoriquement nimporte quelle valeur dans un intervalle donn de
nombres rels.
Exp : la taille dun individu, le poids
12. Srie statistique :
Lensemble des diffrentes donnes associes un certain nombre dindividus.
Exp : la srie suivante rsulte dune courte enqute auprs de quelques personnes pour
connatre leur age :
18 21 19 19 17 22 27 18 18 17 20 20 23
II- Tableaux statistiques :
A- Cas d`une seule variable :
Le tableau brut se prsente sous la forme suivante:
Le nombre d'individus observ tant en gnral important, le tableau prcdant ne permet pas
d'analyser l'information obtenue. Il est donc ncessaire de crer un tableau plus synthtique o
les observations identiques (possdant la mme modalit) ont t regroupes.
Pour une variable qualitative, les modalits ne sont pas mesurables.
Pour une variable quantitative, les modalits sont mesurables. Ce sont
des valeurs numriques ponctuelles lorsque la variable est discrte
des intervalles lorsque la variable est continue ou lorsque la variable est discrte et
qu'elle comporte beaucoup de modalits.
13
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Nous tudions une population de 1000 entreprises selon le caractre modalit forme
juridique .
Les modalits retenues : S.A (Socit Anonyme), SARL (Socit A Responsabilit Limite), EI
(Entreprise Individuelle), SNC ( Socit en Nom Collectif).
Leurs effectifs respectifs : 200, 400, 340, 60.
T.A.F :
Prsentez cette srie dans un tableau.
B- Cas de deux variables :
Le tableau brut se prsente sous la forme suivante:
On dsire crer un tableau appel tableau de contingence donnant le nombre d'individus
possdant simultanment la modalit i de variable1 et la modalit j de variable2 qui se
prsentera sous la forme suivante:
14
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application:
Dans une entreprise, une enqute statistique a t faite sur 300 employs, et portant sur deux
caractres, l`age et la rmunration. Les rsultats de l`enqute sont prsents dans les deux
tableaux suivants :
Age n
20 25
25 30
30 35
35 40
150
100
200
50
Rmunration en dhs n
Moins de 1500
1500 2000
2000 2500
plus de 2500
TAF :
200
150
100
50
Prsentez dans un mme tableau la distribution de ces deux caractres.
III- Reprsentations graphiques :
Lorsqu'on observe un caractre sur des individus, on aboutit un tableau de chiffres peu
parlant. L'objectif est de donner une reprsentation graphique de ce tableau qui permette d'un
seul coup d'il d'avoir une ide de la manire dont se rpartissent les individus.
A- Variable qualitative :
A chaque modalit i est associ un effectif ni.
La seule reprsentation qui nous intresse est celle des effectifs ni (ou des frquences ni/n).
Suivant la variable observe, de nombreuses reprsentations plus ou moins informatives
peuvent tre utilises. Cependant les 2 plus classiques sont:
Les tuyaux d'orgue (ou diagramme en barre ou diagramme bandes)
- les modalits de la variable sont places sur une droite horizontale (attention: ne pas
orienter cette droite car les modalits ne sont pas mesurables et il n'y a donc pas de
relation d'ordre entre elles).
- les effectifs (ou les frquences) sont placs sur un axe vertical. La hauteur du tuyau est
proportionnelle l'effectif.
15
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
les diagrammes secteurs (ou camemberts)
- L'effectif total est reprsent par un disque.
- Chaque modalit est reprsente par un secteur circulaire dont la surface (pratiquement :
l'angle au centre) est proportionnelle l'effectif correspondant.
Application :
La rpartition des candidats convoqus pour participer au Test d`Admissibilit la Formation
en Management (TAFEM 1998) pour l`accession L`Ecole Nationale de Commerce et de
Gestion d`Agadir , selon la srie du baccalaurat se prsente comme suit :
Srie du Bac xi Nombre de candidats ni
Sciences conomiques
Sciences mathmatiques
Sciences exprimentales
T.G.A
T.G.C
250
200
400
50
100
Total 1000
TAF: reprsentez cette distribution en Tuyaux d`orgues et Diagramme circulaire.
16
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
B- Variable quantitative :
Avant toute tentative de reprsentation, il y a lieu de distinguer entre variable discrte et
variable classe (regroupements en classes).
Deux types de graphiques sont intressants de reprsenter:
a) les diagrammes diffrentiels qui mettent en vidence les diffrences d'effectifs (ou de
frquences) entre les diffrentes modalits ou classes.
b) les diagrammes cumulatifs qui permettent de rpondre aux questions du style "combien
d'individus ont pris une valeur infrieure (ou suprieure) tant?".
1) Variable discrte
Diagramme diffrentiel : le diagramme en btons
Les valeurs discrtes xi prises par les variables sont places sur l'axe des
abscisses, et les effectifs (ou les frquences) sur l'axe des ordonnes. La
hauteur du bton est proportionnelle l'effectif.
Diagrammes cumulatifs : ils permettent de visualiser l'volution des effectifs
(frquences) cumuls croissants ou dcroissants.
Remarque: les deux courbes sont symtriques par rapport un axe horizontal d'ordonne n/2
pour les effectifs, pour les frquences.
On utilise l'effectif (frquence) cumul croissant pour rpondre aux questions du style :
Quel est le nombre (%) d'individus dont la valeur du caractre est infrieure ou gale x ?
On utilise l'effectif (frquence) cumul dcroissant pour rpondre aux questions du style :
Quel est le nombre (%) d'individus dont la valeur du caractre est strictement suprieure x ?
17
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Se souvenir:
(au plus x) quivalent ( < x) donc utiliser N(x) ou F(x)
(plus que x) quivalent ( > x) donc utiliser N '(x) ou F '(x)
Exemple:
- (au plus 6) quivalent ( < 6) donc on pourra lire la frquence cumule croissante en 6, c--
d. F(6) = 0,3
- (plus de 6) quivalent ( > 6) donc on pourra lire la frquence cumule dcroissante en 6,
c..d. F '(6) = 0,7
- (moins de 6) quivalent (< 6) quivalent ( < 6- ) o est une trs faible valeur
positive, donc on pourra lire la frquence cumule croissante en 6- , c..d. F(6- ) = 0,2
- (au moins 6) quivalent ( > 6) quivalent ( > 6- ) o est une trs faible valeur positive,
donc on pourra lire la frquence cumule dcroissante en 6- , c..d. F '(6- ) = 0,8
Application :
Reprsentez graphiquement la distribution des 50 tudiants en fonction du nombre de personnes
par mnage suivante :
Nombre de personnes par mnage xi Nombre d`tudiants ni
3 5
4 15
6 15
7 10
8 5
Total 50
2) Variable classe
Diagramme diffrentiel : l'histogramme
C'est un ensemble de rectangles contigus, chaque rectangle associ chaque classe ayant une
surface proportionnelle l'effectif (frquence) de cette classe.
Attention: Avant toute construction d'histogramme, il y a lieu de regarder si les classes sont
d'amplitudes gales ou ingales.
18
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Le cas des classes d'amplitudes gales ne pose aucune difficult car il suffit de reporter en
ordonne l'effectif (la frquence).
Dans le cas d'amplitudes ingales on reporte en ordonne la densit di (effectif divis par
l'amplitude de la classe)
Diagrammes cumulatifs
L'utilisation des courbes est identique au cas discret.
Exemple:
19
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Reprsentez graphiquement la distribution de 50 tudiants en fonction de leur taille suivante :
Taille en cm xi Nombre d`tudiants
150-160 16
160-165 6
165-170 12
170-175 14
175-180 2
Total 50
IV- Caractristiques de tendance centrale et de position :
Les caractristiques de tendance centrale essayent de donner la valeur la plus
reprsentative d'un ensemble de valeurs numriques.
A- Mode :
C'est la valeur observe d'effectif maximum.
Variable discrte: classer les donnes par ordre croissant. Celle d'effectif maximum donne le
mode.
Il est fortement conseill d'utiliser le diagramme en btons pour dterminer le mode. En effet,
deux valeurs conscutives xi , xi+1 peuvent avoir le mme effectif maximum; on parlera
d'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mlange de deux populations qui
conduit un diagramme en btons o apparaissent deux bosses; on considrera deux modes.
Il est dconseill, sauf raison explicite, d'envisager plus de deux modes.
Variable classe: la classe modale correspond la classe ayant l'effectif maximum. Il est
fortement conseill d'utiliser l'histogramme pour dterminer le mode. Comme pour le cas
discret, on peut avoir deux classes modales. Toutes les valeurs de la classe pouvant priori se
raliser, on ne se contentera pas de dterminer la classe modale. Une des valeurs de cette
classe sera le mode. Certains auteurs prconisent par simplicit de prendre le centre de la
classe modale. Il est prfrable cependant de tenir compte des classes adjacentes de la manire
suivante:
20
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Dterminez la valeur modale de la distribution suivante, de 50 tudiants selon leur taille :
Taille en cm : xi Nombre d`tudiants : ni
150-160 15
160-170 6
170-175 10
175-180 16
185-200 3
Total 50
Elments de rponse :
Mo = 173.77 cm
B- Mdiane :
Les valeurs tant ranges par ordre croissant, c'est la valeur de la variable qui spare
les observations en deux groupes d'effectifs gaux.
Variable discrte: la dtermination peut s'obtenir partir du tableau statistique en
recherchant la valeur de la variable correspondant une fonction cumule gale n/2 (effectif
cumul) ou (frquence cumule). Il est encore plus facile de lire sur les graphiques
cumulatifs les abscisses des points d'ordonne n/2 (effectif cumul) ou (frquence
cumule). Si tout un intervalle a pour image n/2 ( pour la frquence), on parlera d'intervalle
mdian (on peut prendre le milieu de l'intervalle comme mdiane)
Application :
Soit la srie statistique suivante :
19 17 20 18 17 17 20 19 15 16 20 23 22 14 15 24
TAF : Calculez la mdiane de cette srie
Elments de rponse :
Me=18.5
Variable classe: l'abscisse du point d'ordonne n/2 ( pour la frquence)se situe en gnral
l'intrieur d'une classe. Pour obtenir une valeur plus prcise de la mdiane, on procde une
interpolation linaire. La valeur de la mdiane peut tre lue sur le graphique ou calcule
analytiquement.
21
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
d'o la valeur de la mdiane.
De manire gnrale, si a et b sont les bornes de la classe contenant la mdiane, F(a) et F(b)
les valeurs de la frquence cumule croissante en a et b, alors
Application :
Dterminez la valeur mdiane de la distribution des tailles suivantes :
Taille en cm xi Nombre d`tudiants ni N N
150-160 15
160-165 5
165-170 10
170-175 18
175-180 2
15 50
20 35
30 30
48 20
50 2
Total 50 # #
Elments de rponse : Me = 167.5
C- Moyenne arithmtique :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable
classe,
La moyenne arithmtique est un paramtre de tendance centrale plus utilis que les autres de
par ses proprits algbriques:
a) Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes
respectives
moyenne globale = moyenne des moyennes
b) La moyenne arithmtique conserve les changements d'chelle et d'origine
22
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Dterminez la taille moyenne des 50 tudiants dont la distribution par taille se prsente comme
suit :
Taille en cm xi Nombre d`tudiants
150-160 16
160-165 6
165-170 12
170-175 14
175-180 2
Total 50
Elments de rponse :
x = 168.3 cm
D- Moyenne gomtrique :
Si xi sont les observations d'une variable quantitative, la moyenne gomtrique est gale
Ce type de moyenne est surtout utilis pour calculer des pourcentages moyens.
r tant un taux d'accroissement, 1+r est appel coefficient multiplicateur; et le coefficient
multiplicateur moyen est alors gal la moyenne gomtrique des coefficients
multiplicateurs.
E- Moyenne harmonique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale
Il n'est pas vident d'utiliser ce type de moyenne.
Elle intervient lorsqu'on demande une moyenne de valeurs se prsentant sous forme de
quotient de deux variables x/y (km/h, km/litre,...). Attention, il faut cependant bien
dcortiquer le problme car il peut aussi s'agir d'une moyenne arithmtique.
Application :
Un cycliste effectue une travers de 50 kms. Pendant les 20 premiers kms il roulait avec une
vitesse constance de km/h, les 15 kms suivants une vitesse constante de 30 km/h. Du point
kilomtrique 35 au 55 la vitesse de notre cycliste n`est que de 10 km/h et au-del du point
kilomtrique sa vitesse n`est que de 5 km/h.
TAF :
Quelle est la vitesse de ce cycliste sur l`ensemble du parcours ?
Elments de rponse :
H = 16.67
F- Moyenne quadratique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale
23
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
G- Quantiles :
Ce sont des caractristiques de position.
Il y a 1 mdiane Me qui spare les observations en 2 groupes d'effectifs gaux
3 quartiles Q1, Q2, Q3 qui sparent les observations en 4 groupes d'effectifs gaux
9 dciles D1, D2, ..., D9 qui sparent les observations en 10 groupes d'effectifs gaux
99 centiles C1, C2, ..., C99 qui sparent les observations en 100 groupes d'effectifs gaux
La dtermination de ces caractristiques est identique celle de la mdiane.
Les quartiles sont obtenus lorsqu'on a cumul 25, 50, 75% de la population
Les dciles sont obtenus lorsqu'on a cumul 10, 20,...., 90% de la population
Les centiles sont obtenus lorsqu'on a cumul 1, 2,...., 99% de la population
Remarque: la notion de dciles et de centiles n'a de sens que s'il y a beaucoup d'observations
et donc essentiellement pour une variable classe.
Application :
Soit la population de 80 salaris classs d`aprs le niveau de leur salaire journalier.
Classes en dhs ni ni cumuls
1 90 100 5 5
2 100 110 9 14
3 110 120 16 30
4 120 130 25 55
5 130 140 13 68
6 140 150 7 75
7 150 160 3 78
8 160 170 2 80
Total 80
TAF : calculez la mdiane et les deux quartiles
Elments de rponse :
Me = 124
Q1= 110+ (10x6)/16 = 113.7
Q3= 130+(10x5)/13 = 133.8
V- Caractristiques de dispersion :
Comme leur nom l'indique, ces caractristiques essayent de synthtiser par une seule valeur
numrique la dispersion de toutes les valeurs observes.
A- tendue :
C'est la diffrence entre la plus grande et la plus petite observation
Application :
Quelle est l`tendue de la srie statistique suivante :
10 390 395 405 410 1000
Elments de rponse :
Etendue = 990
B- Intervalle inter-quartile :
C'est la diffrence entre le troisime et le premier quartile
Application :
Reprenez les donnes de l`application sur les quartiles et calculez l`intervalle inter-quartile.
Elments de rponse :
Q3-Q1=20
24
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
C- Variance et cart-type :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable
classe, la variance
On utilise plus couramment l'cart type qui est la racine carre de la variance et qui a
l'avantage d'tre un nombre de mme dimension que les donnes (contrairement la variance
qui en est le carr)
La variance est un paramtre de dispersion plus utilis que les autres de par ses proprits
algbriques:
D- Coefficient de variation :
C'est un coefficient qui permet de relativiser l'cart type en fonction de la taille des valeurs. Il
permet ainsi de comparer la dispersion de sries de mesures exprimes dans des units
diffrentes
Applications :
App.1- Les sries suivantes reprsentent la mesure d`un caractre auprs des individus d`une
population :
a. 6 1 8 10 5 4 11 3 2 9 7 12 13
b. 19 17 7 1 4 24 15 22 10 13
c. 15 12 17 15 20 15 20 15 15 9 7
d. 21 25 34 10 20 27 14 20 34
Dans chacun de ces cas calculez : la moyenne, la mdiane, le mode,la variance, l`cart type et le
coefficient de variation.
Elments de rponse :
a. x=7, Me=7, pas de mode, o=14, o=3.74, V=53.4%
b. x=13.2, Me=14, pas de mode, o=52.76, o=7.26, V=55%
c. x=14.5, Me=15, Mo=15, o=14.61, o=3.82, V=26.3%
d. x=22.8, Me=21, deux modes :20 et 34, o=59.28, o=7.70, V=33.8%
25
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
App.2- La distribution suivante reprsente la rpartition de la longueur de pinces d`crevisse
provenant d`une rivire :
Limites ni
1.02---1.23 5
1.24---1.45 7
1.46---1.67 4
1.68---1.89 1
1.90---2.11 4
2.12---2.33 6
2.34---2.55 3
2.56---2.77 1
TAF : calculez : la moyenne, la mdiane, le mode,la variance, l`cart type et le coefficient de
variation.
Elments de rponse :
x=1.757, Mo=1.345 (le centre de la classe modale), Me=1.648, o=0.238, o=0.488, V=27.8%
VI- La concentration :
L'objectif est de mesurer les ingalits dans la rpartition d'une variable l'intrieur d'une
population. Cette notion n'a d'intrt que dans la mesure o les valeurs globales suivantes ont
une signification concrte
A- Valeurs globales :
xi reprsentent les valeurs ponctuelles ou les centres des classes, ni les effectifs
correspondants.
Les valeurs globales de la srie (xi , ni) sont les quantits gi = ni xi
B- Mdiale :
La mdiale de la srie (xi , ni) est la mdiane de la srie (xi , gi)
Application :
L`importance quantitative des portefeuilles de titres dposs dans une socit de portefeuille
Maroc Invest en Kdh en 1996.
Importance du portefeuille en kdh f% f cumul f`% f`cumul
Moins de 10.000
10.000 50.000
50.000 100.000
100.000 200.000
200.000 500.000
500.000 plus
41 41
37 78
10 88
6 94
4 98
2 100
2 2
15 17
11 28
13 41
19 60
40 100
Total 100 - 100 -
f reprsentent les pourcentages du nombre total des portefeuilles.
f` reprsentent les pourcentages de la valeur totale des portefeuilles.
TAF : calculez la mdiane et la mdiale de cette distribution
Elments de rponse :
Me = 19730, Ml= 342105 kdh
26
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
C- Courbe de concentration (ou de LORENZ)
C'est la courbe obtenue en reprsentant
L'allure de la courbe permet d'avoir une ide de la
concentration
D- Indice de GINI
Proprits:
Exercice synthtique : (voir TP N1)
27
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
VII- Les indices :
Permettent de mesurer l'volution d'un phnomne au cours du temps
A- Indices lmentaires :
L'indice d'volution d'une variable lmentaire y entre la date t0, dite date de rfrence ou
date de base, et la date t, dite date courante est
L'indice base 100, c..d. exprim en pourcentage est
Remarque: Il est toujours prfrable d'effectuer les calculs avec i et de donner le rsultat en
base 100 la fin des calculs.
On utilise essentiellement l'indice des prix (P), l'indice des quantits ou volumes (Q), et
l'indice des valeurs ou dpenses (V = P Q)
Proprits:
- identit
- rversibilit
- circularit
- L'indice est troitement li au taux de croissance
i = r +1 est aussi appel coefficient multiplicateur par les conomistes
28
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Applications :
App.1- Le prix de la tomate au Maroc a t de 1.5 dhs en moyenne en 1980 et de 2.3 dhs en 1995.
TAF : calculez l`indice lmentaire du prix de la tomate en 1995, base 100 en 1980 et interprtez-
le.
Elments de rponse :
I95/80= G95 =(2.3/1.5) x 100 = 153.33
G80
Le prix de la tomate au Maroc a augment de 53.33% entre 1980 et 1995
App.2- On savait que le prix du sucre dans un pays X a augment de 2.5% entre 1960 et 1975 et
de 7.5% entre 1960 et 1995.
TAF : dterminez l`indice lmentaire du prix du sucre en 1995 base 100 en 1975, pour le pays
en question.
Elments de rponse :
I95/75= I95/75 = 107.5x100 -104.88
I75/60 102.5
Exercice de synthse :
Les donnes concernant l`volution des prix de plusieurs articles entre les priodes 1995 et 1985,
ainsi que leur poids sont groups dans le tableau suivant :
Prix
Articles
P`85 P`95 o
i
A 36
B 12
C 40
D 15
E 42
F 5
G 30
H 8
40 0.15
15 0.10
45 0.25
13 0.05
50 0.15
8 0.10
40 0.05
10 0.15
TAF: calculez les indices lmentaires des prix des diffrents articles, puis dterminez l`indice
gnral des prix.
Elments de rponse :
I95/85 ( PA) = 40/36 x 100 = 111.11
I95/85 ( PB) = 15/12 x 100 = 125
I95/85 ( PC) = 45/40 x 100 = 112.5
I95/85 ( PD) = 13/15 x 100 = 86.67
I95/85 ( PE) = 50/42 x 100 = 119.05
I95/85 ( PF) = 8/5 x 100 = 160
I95/85 ( PG) = 40/30 x 100 = 133.33
I95/85 ( PH) = 10/8 x 100 = 125
- L`indice des moyennes: I95/85 = P95 = 31.2/26.85 x 100 = 116.2
P85
i
=120.9
- La moyenne des indices : I95/85 (P) = _ o
i
I95/85
B- Indices de LASPEYRES et de PAASCHE
Ce sont des indices synthtiques qui sont des rsums numriques des indices lmentaires
lorsqu'on cherche mesurer l'volution d'un ensemble de plusieurs produits.
coefficient de pondration ou budgtaire du produit j par rapport la date t :
29
Rsum de Thorie et
Guide des travaux pratiques
a) Indice de Laspeyres des prix
Statistiques
b) Indice de Laspeyres des quantits
c) Indice de Paasche des prix
d) Indice de Paasche des quantits
30
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Les donnes concernant l`volution des prix et des quantits de plusieurs articles entre les
priodes 1995 et 1985 :
Prix
Articles
P`85 P`95 Q`85 Q`95
A 36
B 12
C 40
D 15
E 42
F 5
G 30
H 8
40 6 7
15 20 20
45 13 11
13 15 15
50 9 18
8 25 25
40 10 9
10 30 30
TAF : calculez les diffrents indices synthtiques des prix, des quantits et des valeurs.
Elments de rponse :
- Indice de Laspeyrs des prix :
L95/85 (P) = 125
- Indice de Paasche des prix :
P (P) = 119
- Indice de Laspeyrs des quantits:
L95/85 (Q) = 119
- Indice de Paasche des quantits :
P (P) = 134
- indice des valeurs (indice des dpenses totales) :
D 95/85 = _ P`95 Q`95 = 3030/2136 x 100 =142
_ P`85 Q`85
VIII- Rgression et corrlation :
Lorsqu'on observe deux variables quantitatives sur les mmes individus, on peut s'intresser
une liaison ventuelle entre ces deux variables.
La rgression fournit une expression de cette liaison sous la forme d'une fonction
mathmatique.
La corrlation renseigne sur l'intensit de cette liaison.
A- Ajustement d`un nuage de points une fonction mathmatique :
a) Ajustement linaire par la mthode des moindres carrs
Lorsque le nuage de points (xi , yi) est peu prs rectiligne, on peut envisager d'exprimer la
liaison entre x et y sous forme de fonction affine y = ax + b
31
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
b) Ajustement une fonction exponentielle
Pour ajuster un nuage de points une courbe exponentielle , il suffit de faire le
changement de variable Y = ln y , X = x , A = ln a , B = ln b , pour obtenir l'quation Y = AX
+ B, et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points
(Xi , Yi).
c) Ajustement une fonction puissance
Pour ajuster un nuage de points une courbe puissance , il suffit de faire le
changement de variable Y = ln y , X = ln x , A = a , B = ln b , pour obtenir l'quation Y = AX
+ B , et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les
points (Xi , Yi).
B- Mesure de l`intensit de la relation linaire entre deux variables :
1) Covariance
x et y varient dans le mme sens
x et y varient en sens contraire
32
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
2) Coefficient de corrlation linaire
relation fonctionnelle linaire
indpendance linaire
dpendance linaire d'autant plus forte que est grand
Attention:
Une forte causalit entre x et y implique une forte relation entre x et y qui n'est
pas forcment linaire; on n'a donc pas obligatoirement une forte corrlation
linaire.
Une forte corrlation linaire n'implique pas forcment une forte causalit.
3) Droites de rgression
Dy/x : y = ax + b avec
Dx/y : x = a'y + b' avec
La position des deux droites de rgression l'une par rapport l'autre donne un renseignement
sur l'intensit de la relation linaire:
* droites de rgression confondues relation fonctionnelle linaire
* droites de rgression perpendiculaires dont une de pente nulle
indpendance linaire
* Plus les droites sont proches, plus la relation linaire est importante
Relations intressantes:
r = aa'
33
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Les sries statistiques simples de deux variables continues X et Y se prsentent comme suit :
Individus 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X 2 12 13 7 6 3 12 10 9 7 4 2 10 6 3
Y 22 2 4 14 15 19 7 8 10 11 16 18 11 12 21
TAF : aprs avoir labor un tableau de contingence, en adoptant des classes d`amplitudes
gales 4 units pour la variable X et des amplitudes 5 units pour la variable Y, il vous est
demand d`apprcier la liaison qui existe entre ces deux variables.
Elments de rponse :
Y 2 - 7 7 - 12 12 - 17 17 - 22 n.j
X
2 - 6 0 0 2 3 5
6 - 10 0 3 2 0 5
10 - 14 3 2 0 0 5
ni. 3 5 4 3 15
Les quations des droites d`ajustement linaire :
-l`ajustement linaire de Y X : Y= a.X + b = -1.37 X+ 22.79
-l`ajustement linaire de X Y : X = a.Y + b = -0.56 Y+14.62
- coefficient de corrlation r : r = -0.87 Forte liaison linaire ngative entre les deux variables.
IX- Sries chronologiques :
Ce sont des sries d'observations chelonnes dans le temps. L'objectif de l'tude des sries
chronologiques est double:
analyse d'un phnomne temporel en mettant en vidence essentiellement la tendance
gnrale et les fluctuations saisonnires
laboration d'un modle permettant de faire de la prvision court terme
A- Dcomposition des chroniques :
Lvolution dans le temps dun phnomne rsulte de plusieurs facteurs :
- le Trend ou Tendance : T. Cest le mouvement de longue priode que lon considre le plus
souvent comme une droite (tendance linaire)
- les cycles : C. Cest une alternance de mouvements croissants et dcroissants de moyen
terme.
- les variations saisonnires : S. On estime quil y a une composante saisonnire dans une
srie, si, chaque anne, la mme priode, il se produit une variation du phnomne dau
moins 25% par rapport la valeur moyenne.
- le rsidu ou ala : . Cest un vnement exceptionnel impossible ou difficile estimer.
Lvolution dune variable X peut alors sexprimer comme suit :
(1) X= T+C+S+ ou (2) X= T.C.S.
Le modle additif (1) suppose que chaque composante apporte une contribution pure
lvolution observe.
Le modle multiplicatif (2) montre que chaque composante amplifie les autres et traduit
linterdpendance entre les composantes.
34
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
B- La dtermination du Trend :
1) Ajustement linaire par la mthode des moindres carrs
La droite de rgression de Y par rapport au temps t donne pour chaque t une valeur Tt
2) Lissage par moyennes mobiles d'ordre k (k = nombre d'observations dans un cycle)
temps variable moyennes mobiles d'ordre 3 moyennes mobiles d'ordre 4
1 y1
2 y2 (y1 + y2 + y3)/3
3 y3 (y2 + y3 + y4)/3 (y1/2 + y2 + y3 + y4 + y5/2)/4
4 y4 (y3 + y4 + y5)/3 (y2/2 + y3 + y4 + y5 + y6/2)/4
5 y5 (y4 + y5 + y6)/3 (y3/2 + y4 + y5 + y6 + y7/2)/4
6 y6 (y5 + y6 + y7)/3
7 y7
les moyennes mobiles donnent pour chaque t (mis part les valeurs extrmes) une valeur Tt
Application :
La socit BMT a pour activit la vente de systme d`alarme. Le caractre porteur de ce march
lui a permis sur les cinq dernires annes d`enregistrer les ventes suivantes en KDH :
Annes N -4 N -3 N -2 N -1 N
Chiffre
d`affaires
71697 90574 94550 125257 138150
TAF :estimez la prvision des ventes pour l`anne N+1 en utilisant la mthode des moindres
carrs.
Elments de rponse :
soit x le rang de l`anne et y le chiffre d`affaires
xi yi xiyi xi
1 71697
2 90574
3 94550
4 125257
5 138150
71697 1
181148 4
283650 9
501028 16
690750 25
Sommes 15 520228 1728272 55
Moyennes 3 104046
a=16759 et b=53769
le chiffre d`affaires y s`exprimerait donc en fonction du rang x de l`anne :
y=16759x + 53769
Pour l`anne N+1 (rang 6), la prevision serait la suivante : y=16759 x 6+53769 = 154323 kdh
35
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
C- Analyse de la composante saisonnire :
1) modle additif
- calcul des diffrences Yt - Tt = St + At
- calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne des
diffrences de la saison j
- calcul des coefficients saisonniers
2) modle multiplicatif
- calcul des rapports Yt / Tt = St . At
- calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne des
rapports de la saison j
- calcul des coefficients saisonniers
D- Analyse de la composante alatoire
1) modle additif
At = Yt - Tt - St
2) modle multiplicatif
At = Yt / (Tt . St)
E- Dsaisonnalisation :
Pour exprimer ce qu'aurait t le mouvement brut sans l'influence saisonnire, on utilise la
srie corrige des variations saisonnires Y* (ou Ycvs)
1) modle additif
Y*t = Yt - St
2) modle multiplicatif
Y*t = Yt / St
F- Srie Ajuste
Cette srie est utilise pour reprsenter ce qu'aurait t le phnomne en l'absence de phnomnes
alatoires
1) modle additif
= Tt + St
2) modle multiplicatif
= Tt . St
F- Prvision court terme:
Lorsque le trend est obtenu par la mthode des moindres carrs, il est possible d'obtenir
une prvision postrieure l'intervalle d'tude ( condition de rester dans des
limites raisonnables), en utilisant le modle prcdent. Pour une date x correspondant
un coefficient saisonnier Sx , la tendance vaut Tx , et la prvision est donc donne par
Tx + Sx en modle additif ou Tx . Sx en modle multiplicatif
36
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
La socit Jihane fabrique des jouets en plastique. Son activit a un caractre saisonnier trs
marqu. On dispose des donnes suivantes relatives aux annes N-2, N-1 et N :
N - 2 N - 1 N
Trimestre 1 18912 25052 27635
Trimestre 2 28362 37579 41440
Trimestre 3 33098 43837 48357
Trimestre 4 14178 18789 20718
Total 94550 125257 138150
TAF :
1. Reprsentez graphiquement cette srie statistique
2. Calculez les coefficients saisonniers de cette srie.
3. Dterminez la srie corrige des variations saisonniers
4. Quelles sont les prvisions pour les annes N+1, N+2, N+3 et N+4 ?
Elments de rponse :
60000
50000
40000
30000
20000
10000
0
1 2 3 4 5 6 7 8 9 10 11 12
trimestres
2.
Trimestr1 Timestre2 Trimestre3 Trimestre4
yt y`t yt/y`t yt y`t yt/y`t yt y`t yt/y`t yt y`t yt/y`t
N - 2 189
12
N-1 250
52
N 276
35
Coeff
saiso
nnier s
28362 33098 24405 1.36 14178 26325 0.54
28819 0.87 37579 30738 1.22 43837 31637 1.39 18789 32443 0.58
33490 0.83 27635 34296 1.21 48357 20718
0.85 1.215 1.375 0.56
Coefficient saisonnier 1
er
trimestre = (0.87+0.83)2 = 0.85
3.
Trimestre t 1 2 3 4 5 6 7 8 9 10 11 12
yt 18912 28362 33098 14178 25052 37579 43837 18789 27635 41440 48357 20718
Coeff.sais. 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56
Srie
corrige
21013 22690 25460 25778 27836 30063 33721 34162 30706 33152 37198 37669
37
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
4. la prvision de la tendance ncessite un ajustement de la srie corrige des variations
saisonniers (les moyennes mobiles).
Droite d`ajustement de y`t => y`t = 1391x + 21228
On obtient les prvisions suivantes pour la tendance :
Trimestre 13 14 15 16
Prvision 39311 40702 42093 43484
Prvisions des ventes des trimestres 13,14,15 et 16 ( N+1, N+2, N+3 et N+4)
Trimestre 13 14 15 16
Prvision de la
tendance
39311 40702 42093 43484
Coeff. Saisonn. 0.85 1.215 1.375 0.56
Prvisions des
ventes
33414 49453 57878 24351
Chapitre II. Ralisation des enqutes
Enqute : Investigation auprs dune population donne pour obtenir des rponses
prcises des questions sur un march (enqute par tlphone, enqute postale,
enqute par Internet..)
I- Dtermination
optimale d`un chantillon
Echantillon : fraction reprsentative dune population ou dun univers statistique sur lequel
porte une tude. Tous les membres de la population considrs doivent avoir la mme chance
dtre choisis.
A. Mthodes d`chantillonnage :
Il existe diffrentes manires dextraire un chantillon dune population. Nous ne verrons que
les deux pratiques les plus courantes :
1- Echantillon alatoire :
Tous les individus dune population possdent au dpart des chances gales de faire partie de
lchantillon. On effectue un choix au hasard.
2- Echantillon stratifi :
On divise en strates le population et on tire au hasard dans chaque strate homogne, les
lments obtenus dans chaque strate sont combins pour obtenir le rsultat final.
3- Tirage par quota :
Il consiste reconstituer une population mre miniaturise, au sein de lchantillon.
Lchantillon est considr comme reprsentatif de la population mre.
Exp : dans une population donne, il y a 49% de femmes et 51% dhommes ; on dfinit les
quotas qui permettront dobtenir un chantillon comprenant 49% de femmes et 51%
dhommes.
B. Dtermination optimale de la taille de l`chantillon :
38
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Exp : un calcul financier prvisionnel a un chef de produit que sa nouvelle marque doit
obtenir une part de march dau moins 15%, sil veut dgager un bnfice. Une tude est
mene auprs de s acheteurs potentiels. Le chef de produit fait pari quune part de march de
20% est tout fait probable. Il se donne une marge de fluctuation de 3 points autour de ce
chiffre. Il veut organiser un test qui simule un achat rel, en prsentant les principales
marques du march. Combien faudra-t-il interroger de consommateurs potentiels pour vrifier
la prvision,
Formule de calcul : n=zp q
e
avec :
n : taille de lchantillon ncessaire
z : valeur fournie par la table de la loi normale ; elle varie selon le risque derreur que lon
accepte pour gnraliser les rsultats. Lusage est de retenir 5% soit une valeur de z=1.96
p : pourcentage prvu de consommateurs qui achtent la nouvelle marque, soit ici 20%
q =1-p : pourcentage de consommateurs qui choisissent une autre marque , ici 80%.
e: marge de fluctuation (prcision) accepte pour gnraliser les rsultats : ici 3 points de
part de march, soit 0.03.
Rsultats :
n= (1.96)(0.2)(0.8)=683
(0.03)
II- Elaboration du questionnaire
A- Dfinition :
Instrument de collecte de l'information. Il est fond sur un recueil de rponses un ensemble
de questions poses gnralement un chantillon reprsentatif dune population.
B- Finalits :
Recueillir des informations auprs des personnes concernes par le sujet traiter
Dresser le portrait dune ralit un moment prcis dans le temps
Evaluer les effets d'une action
Raliser un sondage sur un chantillon important
C- Domaine d`application :
Tout type de sujet
Analyse de
l'existant
Critique de l'existant Diagnostic Elaboration et
choix de
solutions
Mise en
uvre
Suivi et
ajustement
D- Caractristiques :
39
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Le questionnaire implique gnralement le choix dun chantillon de la population
concerne
La standardisation du questionnaire est ncessaire : il est prsent tous les
interlocuteurs sous la mme forme, avec les mmes modalits
Le questionnaire est un instrument pr-test : il doit tre mis lessai avant dtre
utilis pour vrifier sa pertinence
Le questionnaire permet dobtenir trois catgories dinformations :
- Les faits, les attitudes, les attentes, les opinions
- Les caractristiques associes aux rpondants (sexe, ge, fonction)
- Les informations relies ladministration du questionnaire (date, lieu, groupe de
rpondants, etc)
Le questionnaire doit tre accompagn en amont par une communication sur les
objectifs et l'utilit du questionnaire, et en aval par une communication sur les rsultats
obtenus.
E- Mode d`emploi :
Dmarche en 8 tapes :
Dfinition de la problmatique
Dfinition de la population
choix du type de questionnaire. Il existe deux types de questionnaires : Le questionnaire
auto-administr o le sujet rpond lui mme et le questionnaire administr individuellement
complt par lenquteur lui mme lors dun entretien individuel.
Formulation des questions. Les questionnaires possdent en gnral la fois des questions
ouvertes et fermes :
conception du questionnaire
Pr-test du questionnaire : Il consiste vrifier si le questionnaire fonctionne ou si
certaines modifications simposent en termes de contenu et de forme
Codification des rsultats. Raliser une matrice de donnes double entre :
*Chaque ligne correspond un rpondant
*Chaque colonne correspond une variable ou information demande
Questions fermes : A laide dun code numrique ou alphanumrique, on transforme
linformation dans un format qui la rend exploitable
Questions ouvertes : Il faut posteriori dvelopper une liste de codes pour identifier les
diverses rponses des interlocuteurs
Exemple :
Questions 1 2 3 4 5 n
Rponses 1 2 3 O N 1 2 1 2 3 1 2 3
Question1
Question2
Question3

Question n
Analyse et interprtation des rsultats. Lanalyse a pour but de rsumer les donnes
recueillies de faon rpondre aux questions souleves par la problmatique aborde.
Dmarche en 3 tapes
- L`analyse quantitative
40
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Il sagit grce au calcul statistique danalyser les informations recueillies, en se
plaant du point de vue prcis des objectifs de lenqute.
Deux grandes catgories dapproche statistique sont gnralement utilises :
Les statistiques descriptives :
Utilisation des mesures de tendance centrales (moyenne, mdiane, mode), ainsi
que des indices de dispersion autour de ces mesures (cart type, interquartile)
Les statistiques dductives :
Utilises pour rechercher des rapports significatifs entre des variables
(corrlation). Elles permettent de faire ressortir des liaisons que lon n'avait pas
souponnes lors du lancement de lenqute
- L`analyse qualitative
Elle privilgie les aspects socio-conomiques et psychologiques des rsultats. Elle
vise l'interprtation des rponses fournies.
- Le rapport d'enqute
Il fournit une srie de tableaux accompagns de commentaires sur les points les
plus importants. ; il est structur de la manire suivante :
La prsentation de lenqute qui comprend ;
La prsentation des rsultats qui concerne ;
Les conclusions .
Chapitre III. Ralisation des sondages
Quelques dfinitions :
Sondage : Etude dune partie dune population considrs directement ou aprs redressement,
comme reprsentative de la population totale. Les rsultats obtenus sont rapports la totalit
de cette population.
Le sondage soppose au recensement qui est ltude exhaustive de toutes les units dun
ensemble .
Base de sondage : liste ou fichier regroupant lunivers tudi et permettant le tirage au sort
des units de lchantillon.
La statistique : toute mesure calcule partir des donnes chantillonnales
Paramtre : toute mesure calcule partir de lensemble des donnes de la population.
Estimation : le procd par lequel on cherche dterminer la valeur dun paramtre dune
population.
Estimateur : la statistique utilise pour effectuer lestimation ; cest une variable alatoire.
Valeur estime : la valeur que prend lestimateur une fois lchantillon tir ; cest une valeur
de la variable alatoire que constitue lestimateur.
I- Estimateur d`une moyenne ou d`une proportion
Problmatique : Quelle statistique de lchantillon constituera le meilleur estimateur dun
paramtre de la population ?
Exp : on dsire connatre la grandeur moyenne de toutes les femmes ges de 18 ans ou plus
vivant dans une certaine ville. Puisquil serait trop long dtudier toute la population, on
procde donc partir dun chantillon alatoire. Mais, puisque les individus de lchantillon
ont t choisis de faon ce quil reprsente le plus fidlement possible la population, on est
41
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
en droit de penser que la moyenne de lchantillon peut prendre une valeur proche de la
moyenne de la population. Mais la moyenne dun chantillon choisi alatoirement dans la
population rencontre-t-elle le critre dun estimateur sans biais ?
A- Esprance mathmatique d`une moyenne :
Lesprance mathmatique de la moyenne dun chantillon est un estimateur sans biais de la
moyenne de la population laquelle il appartient :
E (X) =
Exp : soit la population 2,3,6,8 . Considrons la variable X reprsentant la moyenne dun
chantillon de taille 2 tir avec remise. Lensemble de tous les chantillons possibles
auxquels on associe la moyenne est :
X
2 2.0
3 2.5
2
6 4.0
8 5.0
2 2.5
3 3.0
3
6 4.5
8 5.5
2 4.0
3 4.5
6
6 6.0
8 7.0
2 5.0
3 5.5
8
6 7.0
8 8.0
Do la distribution de probabilit suivante :
X 2.0 2.5 3.0 4.0 4.5 5.0 5.5 6.0 7.0 8.0
Fi (X) 1/16 2/16 1/16 2/16 2/16 2/16 2/16 1/16 2/16 1/16
On a donc : E(X) = (2.0) 1/16 + (2.5) 2/16 + . + (8.0) 1/16 = 4.75
De plus la moyenne de la population :
= 2+3+6+8 = 4.75
4
B- Esprance mathmatique d`une proportion :
La proportion dindividus prsentant un caractre particulier dans un chantillon est un
estimateur sans biais de la proportion de ces individus dans la population laquelle appartient
lchantillon.
Exp :
42
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Reprenons lexemple prcdant, considrons cette fois-ci la variable alatoire P reprsentant
la proportion de nombre impair dans un chantillon de taille 2 tir avec remise. Lensemble
des rsultats possibles est :
P
2
3
6
8
Do la distribution de probabilit suivante :
2 0/2
3 1 /2
6 0/2
8 0/2
2 1 /2
3 2/2
6 1 /2
8 1 /2
2 0/2
3 1 /2
6 0/2
8 0/2
2 0/2
3 1 /2
6 0/2
8 0/2
P 0 1 /2 1
Fi (P) 9/16 6/16 1/16
On a donc : E(P) = (0) 9/16 + (1/ 2) 6/16+ (1) 1/16 = 1/4
De plus la proportion de nombres impairs dans la population est :
= 1/ 4
Estimation ponctuelle d`un paramtre :
Lestimation ponctuelle dun paramtre consiste en lvaluation de la valeur du paramtre de
la population laide dune valeur unique prise dans un chantillon. La statistique utilise
comme estimateur doit rencontrer un certain nombre de critres, on a vu celui de lestimateur
sans biais. Dautres caractristiques existent mais ne font pas notre objectif.
Il importe davantage de connatre les rsultats qui suivent :
Signification des termes Paramtre (population) Statistique utilise (chantillon)
Moyenne X
Proportion P
43
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Application :
Soit la population 3,7,12,16,25 . Considrer tous les chantillons de taille 2 pris avec remise
dans celle-ci.
1. pour chacun des chantillons, calculez la valeur de la variable alatoire X
2. calculez E(x)
3. calculez , la moyenne de la population
4. comparez les rsultats obtenus en b et c
Elments de rponse :
1.
0.3 5.0 7.5 9.5 14.0 5.0 7.0 9.5 11.5 16.0 7.5 9.5 12.0 14.0 18.5 9.5 11.5 14.0
16.0 20.5 14.0 16.0 18.5 20.5 25.0
2. 12.6
3. 12.6
4. E(x) =
II- Variance des estimateurs
On peut sinterroger sur les chances que la valeur estime, partir de lchantillon, gale la
valeur du paramtre de l population. Il convient donc de pouvoir faire lestimation dun
paramtre tout en tant capable dvaluer les chances qu cette estimation de se raliser. Pour
ce faire nous effectuons ce quon appelle une estimation pat intervalle de confiance dun
paramtre de la population. Le problme consiste donc trouver les bornes de cet intervalle.
La moyenne de la variable alatoire X est : E( x ) = X = et lcart -type de X est
X = / n (sachant que var (x) = E(x) - [ E(x)] )
Si lchantillon est tir sans remise dans une population infinie ou trs grande avec n< 0.05N
ou encore avec remise dan,s la population, quelle que soit la taille de celle-ci, et
X =
N-n
n
N-1
Si lchantillon est tir sans remise dans une population finie.
Exp : reprenons lexemple prcdant :
X 2.0 2.5 3.0 4.0 4.5 5.0 5.5 6.0 7.0 8.0
Fi (X) 1/16 2/16 1/16 2/16 2/16 2/16 2/16 1/16 2/16 1/16
On sait que var (x) = E(x) - [ E(x)]
Or, on a :
E(x) = (2.0) 1/16 + (2.5) 2/16 + + ( 8.0) 1/16 = 25.40
44
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Do : var (x) = 25.40 (4.75)
De plus = (2-4.75) + ( 3-4.75)+ ( 6-4.75) + ( 8-4.75) = 5.69
4
et /n = 5.69/2 = 2.84 o n reprsente la taille de lchantillon.
Application :
Un chantillon de taille n est tir, sans remise, d`une population de taille 350 dont la moyenne et
la variance sont respectivement 115 et 169. pour chacune des valeurs suivantes de n, valuer la
variance et l`cart_ type de la variable alatoire X :
1. 5
2. 15
3. 30
4. 50
Elments de rponse :
1. 33.5 et 5.8
2. 11.3 et 3.4
3. 5.2 et 2.3
4. 2.9 et 1.7
III- Estimation par intervalle de confiance de :
On appelle INTERVALLE DE CONFIANCE un intervalle de la forme [L1,L2] , ayant une
certaine probabilit de contenir la valeur dun paramtre.
L1= X - z/2 x et L2= X - z/2 x
O : z/2 est la valeur de la variable z telle que P(z z/2) = 1- /2, le risque derreur et x
lcart- type de la distribution dchantillonnage de X appele aussi ERREUR TYPE.
Il convient dutiliser :
z/2 =2.58 si = 1%
z/2 =1.96 si = 5%
z/2 =1.65 si = 10%
On appelle NIVEAU DE CONFIANCE, not 1 - , la probabilit qua lintervalle de
confiance de contenir la valeur du paramtre.
On appelle RISQUE DERREUR , not , la probabilit qua lintervalle de confiance de ne
pas contenir la valeur du paramtre.
Exp :
La moyenne et lcart -type du rsultat cumulatif dun chantillon de 36 tudiants dune
universit sont 2.6 et 0.3 respectivement. Trouvons un intervalle de confiance 99% pour la
moyenne des rsultats cumulatifs de tous les tudiants de cette universit. On a donc :
X = 2.6, z/2= z1/2%=2.58
Et x= 0.3/ 36 = 0.05
Do : L1 = 2.6 (2.58)0.05 = 2.47
Et L2 = 2.6 + (2.58)0.05 = 2.73
45
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Donc : [2.47 ; 2..73]
Avec un niveau de confiance de 99% , cest dire que l intervalle [2.47 ; 2..73]
Possde 99% des chances de contenir la moyenne du rsultat cumulatif des tudiants de
cette universit.
Application :
Dans une rgion, on s`intresse au temps moyen , inconnu , que prennent les individus d`un
groupe pour se rendre leur travail. A partir d`un chantillon alatoire de taille 100, on a
obtenu un temps moyen de 12 minutes. Construisez un intervalle de confiance 90% pour , si
l`on sait que = 9.
Elments de rponse :
[11.505 ; 12.495] minutes
46
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Contrle continu
Dure : 2h
Un professeur dEPS en charge de deux groupes de filles nayant jamais pratiqu le saut la
perche dcide de les initier ce sport en utilisant deux mthodes dinitiation diffrentes. Les
performances ralises la fin du cycle dapprentissage sont les suivantes :
Groupe 1(mthode A) :
2.20 2.35 2.40 1.15 2.35 2.00 2.55 2.05 1.85 2.85
2.65 2.35 1.90 2.70 2.05 1.95 2.15 2.05 2.80 2.45
Groupe 2(mthode B) :
1.80 2.00 1.45 2.05 2.00 1.65
2.05 1.65 1.50 1.60 2.15 2.10
1- construire les histogrammes des deux sries de valeurs en utilisant des classes de largeur
0.2m du type : [1.00-1.20[
2- laquelle de ces deux mthodes semble donner les meilleurs rsultats ? rpondre la
question tout dabord daprs les histogrammes puis selon que le critre est :
moyenne la plus leve
mdiane la plus leve
classe modale la plus leve
maximum le plus leve
minimum le plus lev
cart type le plus faible
tendue la plus faible
autres critres ?
3- construire un nouvel histogramme, cette fois uniquement pour le groupe 1, en utilisant des
classes de largeur 0.5. le comparer celui de la question 1. Lequel apporte linformation la
plus pertinente ?
47
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Module : Statistiques
GUIDE DES TRAVAUX PRATIQUES
Objectifs viss :
TP 1
48
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
- reprsenter graphiquement une distribution statistique
- tudier la tendance centrale de cette distribution
- tudier la dispersion de cette distribution
- apprcier la forme de cette distribution
Dure du TP :
2h
Description du TP :
Cet exercice permet au stagiaire de matriser la reprsentation graphique dune distribution
caractre quantitatif continu, de sentraner sur le calcul des paramtres de la tendance
centrale et de dispersion et galement de faire un commentaire en se basant sur la forme de la
reprsentation graphique de la distribution.
Droulement du TP :
Dans une commune rurale, o aucune exploitation agricole natteint 123 Ha. La distribution
des 100 exploitants en fonction de la superficie se prsente comme suit :
Superficie en Ha : xi Le pourcentage des propritaires fonciers :fi
Moins de 5 15
5 10 20
10 15 15
15 20 10
20 30 10
30 50 12
50 et plus 18
Questions :
Total 100
1- quelle est la population cible ?
quel est le caractre tudi ?
quel est le nombre de modalits ?
2- reprsentez graphiquement la distribution tudie (simple et cumulative)
3- dterminez les diffrentes caractristiques de tendance centrale
4- quen est-il de la dispersion ?
5- est-ce que la rpartition des terres au sein de cette commune est quitable ?
Elments de rponse :
1- population cible : les 100 exploitations
caractre tudi : la superficie ; sa nature : quantitatif continu
nombre de modalits : 7
3-
X=28.55 Ha
Me = 15 Ha
Mo= 7.5 Ha
4- Etendue = 125 Ha
intervalle interquartile : [Q1 ;Q3] = [7.5 ;38.33]
coefficient de variation = 1.04
5- indice de GINI : IG=0.613
lindice tend vers 1 plus que vers 0, on dira que la distribution des terres dans cette commune
est assez concentre donc cette distribution est non quitable.
TP 2
49
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Objectifs viss :
- raliser des reprsentations graphiques pour des variables quantitatives continues.
Dure du TP :
1h30
Description du TP :
Ce TP permettra au stagiaire de matriser la lecture dun tableau reprsentant la distribution
dune variable quantitative continue. Il lui permettra galement de reprsenter graphiquement
ce genre de variable.
Droulement du TP :
On considre la distribution dfinie par le tableau ci-dessus :
Loyer mensuel en DH Nombre dappartements
150-179 3
180-209 8
210-239 10
240-269 13
270-299 33
300-329 40
330-359 35
360-389 30
Total 172
Questions :
a- quelles sont les bornes infrieures et suprieures de la 1ere classe ?
b- quelles sont les vraies limites de la 1ere classe ?
c- lintervalle de classe utilise est identique pour chaque classe ? quelle est sa taille ?
d- quel est le centre de la 1ere classe ?
e- quels sont les vraies limites de la classe correspondant leffectif le plus lev ?
f- quelles sont les bornes de la classe lintrieur de laquelle sest trouv recens un loyer
mensuel de 239.50 DH ?
g- construisez un histogramme exprimant les donnes du tableau.
h- construisez une courbe deffectifs pour les donnes du tableau.
Elments de rponse :
a- 150dh et 179dh
b- 149.50dh et 179.50dh
c- 179.50 149.5 = 30
d- 149.5 + 30/2 = 164.50 dh
e- 299.5 dh et 329.50 dh
f- 240 dh et 269 dh
TP 3
50
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Objectifs viss :
- calculer les paramtres de tendance centrale
- interprter les paramtres de tendance centrale
Dure du TP :
1h30
Description du TP :
Cet exercice permet au stagiaire de matriser lutilisation des formules de calcul des
paramtres de tendance centrale.
Droulement du TP :
Une agence durbanisme a effectu une tude sur la structure des familles susceptibles de
venir habiter une ville nouvelle dont elle est charge dtablir le projet. Trois types de familles
ont t dfinis selon la prsence et lactivit du conjoint. Daprs cette tude, les distributions
de frquences de ces familles selon le nombre denfants sont les suivantes :
Nombre denfants Chef de famille
sans conjoint avec femme active avec femme
inactive
0 33.3
1 39.3
2 16.6
3 6.4
4 2.5
5 1.1
6 0.8
7 0.0
16.2
26.6
26.6
15.6
9.3
4.5
1.2
0.0
8.4
16.4
25.2
20.6
15.3
12.2
1.9
0.0
Total 100.0 100.0 100.0
Les trois types de familles considrs se repartissent en pourcentage comme ci-aprs :
Total Chef de famille
sans conjoint avec femme active avec femme
inactive
100 5.8 52.9 41.2
Questions :
1- dterminez pour chaque type de famille et pour lensemble, le mode de la distribution selon
le nombre denfants.
2- dterminez pour chaque type de famille et pour lensemble, la mdiane de la distribution
selon le nombre denfants.
3- calculez pour chaque type de famille et pour lensemble, le nombre moyen denfants .
Elments de rponse :
51
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
1-
Ensemble Chef de famille
sans conjoint avec femme
active
avec femme
inactive
Valeur du
mode
2 enfants 1 enfant Intervalle
modale : 1
enfants
2 enfants
2- On retient pour la mdiane la valeur M pour laquelle la frquence cumule est gale .
3-
Ensemble Chef de famille
sans conjoint avec femme
active
avec femme
inactive
Nombre moyen
denfants
2.171 1.120 1.935 2.622
TP 4
52
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Objectifs viss :
- traiter le lien entre variables caractre quantitatif
- choisir la reprsentation graphique adquate pour chaque distribution statistique
- interprter les reprsentations graphiques
Dure du TP :
2h30
Description du TP :
Cet exercice permet au stagiaire dtudier le lien existant entre deux variables caractre
quantitatifs en se basant sur la lecture dune reprsentation graphique.
Droulement du TP :
Au cours de la dcennie 1990-2000, les effectifs employs au fond dune houillre et la
production nette de charbon ont volu de faon suivante :
Anne Effectifs du fond (milliers de
personnes
Production nette de charbon
(millions de tonnes)
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
71.3
65.3
57.6
50.4
47.1
45.8
42.4
38.6
35.9
32.7
30.8
40.1
35.8
32.7
28.4
25.7
25.6
25.1
24.4
22.4
21.1
20.7
1- reprsentez lvolution de ces deux sries sur deux graphiques coordonnes arithmtiques
prsents lun au dessous de lautre faon mettre en vidence lexistence de covariations
ventuelles dans le temps.
2- quels sont les inconvnients de cette prsentation ?
3- quel type de graphique permettrait dy remdier ?
4- tracer le graphique de corrlation correspondant au tableau prcdant.
5- comment interprtez-vous ce graphique ?
TP 5
53
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Objectifs viss :
- construire des reprsentations graphiques adaptes aux variables qualitatives et quantitatives
discrtes
- calculer les paramtres de la tendance centrale
- calculer les paramtres de dispersion
Dure du TP :
2h
Description du TP :
Ce TP permet au stagiaire de sentraner sur la reprsentation graphique des variables
qualitatives et quantitatives discrtes. Il lui permet galement de matriser le calcul des
paramtres de la tendance centrale et ceux de la dispersion.
Un sondage sur la capacit pulmonaire des individus nous a donn les rsultats suivants :
Age Sexe Capacit pulmonaire (litre)
54
19
18
26
19
22
18
20
20
18
17
29
17
43
30
18
25
38
19
26
20
18
16
19
20
21
19
19
19
30
24
17
Questions:
F 2.94
M 4.03
F 3.75
M 6.04
F 4.92
M 6.57
M 5.28
M 5.19
F 4.08
M 4.68
M 5.38
M 4.71
M 5.20
M 4.50
M 4.93
F 3.92
M 6.54
M 5.35
F 4.21
M 5.40
M 6.66
M 5.14
F 3.49
M 5.82
M 5.25
M 4.89
M 6.07
F 3.82
M 6.71
M 5.93
M 6.22
F 3.86
54
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
1- Construisez une distribution deffectifs pour chacune des variables
2- donner une reprsentation graphique pour chacun des cas
3- donnez la mesure de tendance centrale la plus approprie, pour chacune des variables
4- calculez lcart type de la distribution de la capacit pulmonaire
Elments de rponse :
3-
Age : x= 23.4 ans, sexe: Mo=M, capacit pulmonaire : x= 4.98 litres
4- 0.93 litres
TP 6
55
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
Objectifs viss :
- tracer un nuage statistique
- trouver lquation de la droite dajustement linaire
- faire des prvisions en se basant sur la droite dajustement linaire
- tudier la corrlation entre deux variables
Dure du TP :
2h30
Description du TP :
Cet exercice permet au stagiaire de faire des prvisions en trouvant la droite dajustement
linaire par la mthode des moindre carrs. Il permet galement dtudier la corrlation entre
deux variables.
Droulement du TP :
Des tudiants de 1ere anne TCE ont eu les rsultats en statistiques et en mathmatiques
financires (/100):
x (notes de
statistiques)
Y(notes de
math.fin.)
66 64 69 93 80 71 87 73 79 56 47
72 70 60 94 82 68 86 82 90 55 64
Questions :
1- tracez le nuage statistique
2- ajustez la droite des moindres carrs
3- quelle note de mathmatiques financires pouvez-vous prdire un tudiant de ce niveau
qui a eu 75 en statistiques ?
4- calculez le coefficient de corrlation ?
Elments de rponse :
2- y= 16.82+0.81x
3- 77.8
4- 0.845
56
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
TP 7
Objectifs viss :
- connatre la terminologie principale des statistiques
- tablir des tableaux statistiques
- construire des reprsentations graphiques
- calculer et interprter les diffrents paramtres des distributions
Dure du TP :
18h
Description du TP :
Ce TP est prsent sous forme de QCM. Il couvre presque la totalit des points traits dans ce
module. Il pourrait tre utilis comme test de connaissances la fin de chaque section.
Droulement du TP :
TERMINOLOGIE ET TABLEAUX STATISTIQUES
1-
Les caractres suivants sont qualitatifs quantitatifs
- Le tour de ceinture d'une personne
- Le code postal de l'habitation d'un foyer franais
- La superficie d'une exploitation agricole
- Le groupe sanguin d'un individu
2-
Les classes suivantes sont-elles bien dfinies?
oui non
oui non
oui non
oui non
3- La frquence d'une classe s'obtient en divisant l'effectif de la classe par
57
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
L'effectif total
Le nombre de classes
L'amplitude de la classe
4- Le caractre quantitatif discret x admet le tableau de distribution suivant
valeurs 1 2 3 4 5 total
frquences 10,5% 22,3% 30,4% 23,6% 13,2% 100%
5- Quelle est la frquence cumule croissante pour x = 3
67,2% 63,2% 32,8% 30,4%
6- Pour une distribution continue, l'effectif total s'obtient en multipliant l'effectif de chaque
classe par le centre de la classe et en ajoutant les nombres ainsi obtenus
vrai faux
7- Le tableau ci-dessous (notes obtenues par 40 tudiants un examen de statistique) est un
tableau
12 9 7 1 13 18 12 3
4 6 9 14 5 0 6 15
7 10 3 5 9 5 6 9
0 7 13 8 4 4 11 3
10 12 6 5 8 0 1 7
De donnes ponctuelles De distribution
8- Les caractres quantitatifs suivants peuvent-ils tre considrs comme des variables
statistiques continues
58
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
le nombre d'accidents du travail survenus dans une PME en 1
an
oui non
la teneur en aluminium d'un alliage
oui non
9- Les tudiants de formation continue sont rpartis selon leur ge dans le tableau suivant
ge [20 ; 25[ [25 ; 30[ [30 ; 35[ [35 ; 40[ [40 ; 45[ + de 45 total
effectifs 38 59 47 24 12 2 182
Quelle limite doit-on donner la dernire classe si l'on veut que toutes les classes aient la
mme amplitude
50 55 34
Quel est le centre de la classe [30 ; 35[
33 35 37,5 autre rponse
Quelle est la proportion d'tudiants gs de moins de 35 ans
53,3% 79,12% 92,31% 25,82%
10- La frquence cumule croissante est dfinie par
- proportion d'individus dont la valeur du caractre est infrieure x
- proportion d'individus dont la valeur du caractre est suprieure x
- ensemble des modalits que peut prendre le caractre
- autre rponse
11- On a pu regrouper les individus dune population par classes dont les centres sont les
suivants : 52, 60, 68, 76, 84, 92. Quelle est lamplitude des classes
2 4 6 8 16
59
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
REPRSENTATIONS GRAPHIQUES
1- A partir du tableau ci-dessous, 3 graphiques ont t tablis. Indiquez celui (unique) de ces
graphiques qui ne constitue pas une reprsentation correcte du phnomne
1 2
60
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
3
2- Lequel des graphiques ci-dessous correspond l'histogramme des donnes suivantes
1 2
61
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
3 4
3- Le caractre quantitatif X admet la distribution suivante:
classes [0 ; 1[ [1 ; 2[ [2 ; 4[
effectifs 40 30 30
Quelle est la reprsentation graphique des frquences qui convient?
1 2 3
une autre reprsentation
4- Le caractre quantitatif X admet la distribution suivante:
classes [0 ; 1[ [1 ; 2[ [2 ; 4[
effectifs 40 30 30
Quelle reprsentation graphique des frquences cumules croissantes convient?
62
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
1 2 3
une autre reprsentation
5- La reprsentation graphique ci-dessous est un diagramme
en btons
secteurs
bandes
6- Un histogramme est une reprsentation graphique de la distribution des frquences d'une
variable statistique continue
VRAI
FAUX
7- Dans un diagramme secteurs, la modalit n 2 du tableau ci-dessous serait reprsente par
un secteur d'angle
63
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
modalits effectifs
1 30
2 15
3 25
4 30
15 degrs
54 degrs
60 degrs
8- Le tableau suivant donne la rpartition des mnages d'une population selon le nombre de
vhicules possds
nombre
d'automobiles
nombre de
mnages
0 1 2 3 4 et plus
528 2463 906 156 12
9- La reprsentation graphique qui convient le mieux est
un diagramme en btons un histogramme une autre reprsentation
CARACTRISTIQUES DE TENDANCE CENTRALE ET DE POSITION
1- Quelle est la moyenne des valeurs ci-dessous
xi ni
20 58
30 188
40 54
82,89
29,87
30
30,54
2- La mdiane d'une distribution est toujours gale au second quartile
OUI NON
3- Dans une srie statistique, il est possible de dterminer dix dciles
OUI NON
64
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
4- On observe pendant 79 jours ouvrables, le nombre de lettres recommandes mises au
cours de la journe, par le service des approvisionnements. L'volution de ces envois au cours
de cette priode est fournie dans le tableau suivant. Dterminer le premier et le troisime
quartile de cette srie d'expditions quotidiennes de lettres recommandes.
rang nbre
lettres
rang nbre
lettres
rang nbre
lettres
rang nbre
lettres
rang nbre
lettres
1 1 17 6 33 7 49 8 65 11
2 3 18 6 34 7 50 8 66 11
3 3 19 6 35 7 51 9 67 11
4 4 20 6 36 7 52 9 68 11
5 4 21 6 37 7 53 9 69 11
6 5 22 6 38 7 54 9 70 11
7 5 23 6 39 8 55 9 71 11
8 5 24 6 40 8 56 9 72 12
9 5 25 7 41 8 57 9 73 12
10 5 26 7 42 8 58 9 74 12
11 5 27 7 43 8 59 10 75 12
Q1=7 Q3=12
Q1=6 Q3=11
Q1=7 Q3=10
Q1=3,75 Q3=11,25
autre rponse
12 6 28 7 44 8 60 10 76 13
13 6 29 7 45 8 61 10 77 13
14 6 30 7 46 8 62 10 78 14
15 6 31 7 47 8 63 10 79 15
16 6 32 7 48 8 64 10
5- Cocher la nature des indicateurs numriques suivants
effectif total
3 dcile
moyenne gomtrique
Paramtre de
position
Paramtre de
dispersion
ni l'un ni l'autre
65
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
6- Soit le tableau suivant
modalits effectifs
employs de service 2
manoeuvres 3
ouvriers 12
Sachant que la moyenne arithmtique
est 12,5 le nombre de cadres suprieurs
est
ouvriers spcialiss 22
agents de matrise 15
7
10
5
autre rponse
employs 28
cadres 13
cadres suprieurs ?
7- Il existe 100 centiles qui partagent une srie statistique
OUI NON
8- On donne la srie statistique suivante : 14, 16, 12, 9, 11, 18, 7, 8, 9, 16, 7, 9, 18. La
mdiane est gale
9 11 14 16 18 [9;18[ [11;18[
autre
rponse
9- La moyenne gomtrique d'une srie statistique est
La racine carre du produit des valeurs observes
la racine cubique du produit des valeurs observes
la racine n-ime du produit des valeurs observes
le produit des racines n-ime des valeurs observes
le quotient des racines n-ime des valeurs observes
autre rponse
66
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
10- Quand les classes d'une srie statistique sont d'amplitudes ingales, il faut obligatoirement
corriger les effectifs ou les frquences pour calculer la mdiane
OUI NON
11- La moyenne harmonique d'une srie statistique est gale l'inverse de la moyenne
arithmtique des inverses des valeurs
OUI NON
12- La mdiane partage l'histogramme en deux surfaces gales
OUI NON
13- Soit la srie suivante
xi ni
1 20
2 30
3 15
4 10
5 5
6 2
la moyenne quadratique est
gale
la moyenne gomtrique est
gale
la moyenne harmonique est
gale
1,92 2,78 357
4,86 5,04 15
1,87 2,15 3,57
6,25 autre rponse
6,25 215 1,92
1,87 autre rponse
14- La rpartition des clibataires selon leur ge est fournie par le tableau suivant
ge [15 ; 30[ [30 ; 40[ [40 ; 50[ [50 ; 60[ [60 ; 70[ [70 ; 80[ [80 ; 90[
effectifs 4500 450 400 230 200 ? 20
Sachant que l'ge moyen est gal 28,8 ans, la valeur manquante est
65 97 102
150 165 autre rponse
l'ge mdian est
20,4 22,6 24,8
26,7 autre rponse
67
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
CARACTRISTIQUES DE DISPERSION
1- Compltez le tableau suivant pour calculer la
variance
la variance vaut
6,293 7,69 4341,73 59,08
2- Calculez le coefficient de variation des donnes suivantes:
xi ni
70 91
80 189
90 70
0,085 45,64
0,546 6,76
3- La synthse d'un ensemble d'observations relatives une variable quantitative peut
s'effectuer par des paramtres de tendance centrale et de dispersion.
L'une des quatre rponses suivantes n'a rien voir avec ce type de synthse:
moyenne
et cart-type
mdiane
et cart-type
frquence moyenne par unit d'amplitude
et mode
variance
et mode
4- On observe sur un tronon d'autoroute, pendant 51 jours, le nombre x de dpannages
effectus au cours de la journe. Calculer l'intervalle inter-quartile des observations
68
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
ran
g
nbre
dpannages
rang nbre
dpannages
rang nbre
dpannages
rang nbre
dpannages
rang nbre
dpannage
s
1 1 11 3 21 4 31 4 41 6
2 1 12 3 22 4 32 4 42 6
3 1 13 3 23 4 33 5 43 6
4 1 14 3 24 4 34 5 44 6
5 1 15 3 25 4 35 5 45 6
6 2 16 3 26 4 36 5 46 6
7 2 17 3 27 4 37 5 47 7
8 2 18 3 28 4 38 5 48 8
9 2 19 3 29 4 39 5 49 9
10 3 20 4 30 4 40 5 50 10
51 11
L'intervalle inter-quartile vaut
3 4 5 6 autre rponse
5- La variance est toujours positive ou nulle
OUI NON
6- Une entreprise E possde 3 tablissements A, B, C. Les effectifs et les salaires moyens
pour les ouvriers , les employs , et les cadres , sont donns dans le tableau suivant
A B C E
effectifs
salaire
moyen
effectifs
salaire
moyen
effectifs
salaire
moyen
effectifs
salaire
moyen
Ouvriers 60 10 180 8 5 10 245 8,5306
Employs 30 20 10 16 30 25 70 21,571
Cadres 10 100 10 90 15 100 35 97,143
Total 100 22 200 12,5 50 46 350 20
La variance intra-tablissements est gale
129,86 478,28 562,51
69
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
LA CONCENTRATION
1- Si, pour un caractre quantitatif continu et positif, la mdiane est trs peu diffrente de la
mdiale, alors l'indice de concentration de Gini est peu diffrent de
0 0,5 1
2- Dans un diagramme de concentration on porte gnralement en ordonnes les valeurs des
frquences cumules des valeurs globales. Comment s'crivent ces valeurs
autre rponse
INDICES
1- Le chiffre d'affaires d'une entreprise a augment de 2% par an pendant 2 ans, puis a
diminu de 9% par an pendant 4 ans, et a augment de 8% par an pendant 3 ans. Quelle est
l'augmentation moyenne sur la priode
1% 9% 10% autre rponse
2- tant donn une population de 50 millions qui a cr au taux de 20% par an, quelle tait
cette population il y a 12 ans
38 486 689 39 424 659 1 555 318 5 607 832 autre rponse
3- Une hausse de 80% suivie d'une baisse de 50% revient
une baisse de 10% une baisse de 20% une baisse de 30%
une hausse de 10% une hausse de 30% autre rponse
4- Une hausse de 60% suivie d'une baisse de 40% revient
une hausse de 20% une baisse de 10% une hausse de 10%
une baisse de 20% une baisse de 4% autre rponse
70
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
5- Une grandeur augmente de 10% par an. Au bout de combien d'annes aura-t-elle doubl
11 ans 11,1 ans 10 ans 7,27 ans 6,23 ans
1 an 12,45 ans 8,27 ans autre rponse
6- Le calcul de l'indice de Laspeyres ncessite de pondrer les indices lmentaires par des
coefficients budgtaires relatifs
la priode de base la priode courante
7- Calculez l'indice de Laspeyres des prix de 1998 par rapport 1990 partir des donnes du
tableau suivant
Modle
Quantits Prix Ventes
1990 1998 1990 1998 1990 1998
Produit A 50 55 18 22 900 1210
Produit B 69 62 23 25 1587 1550
108,91 100,97
107,85 99,98
Produit C 96 115 28 25 2688 2875
Total 5175 5635
8- Calculez l'indice de Paasche des quantits de 1998 par rapport 1990 partir des donnes
du tableau suivant
Modle Quantits Prix Ventes
1990 1998 1990 1998 1990 1998
Produit A 90 99 13 16 1170 1584
Produit B 56 50 18 20 1008 1000
Produit C 78 94 23 21 1794 1974
109,53 108,58
104,81 105,69
Total 3972 4558
71
Rsum de Thorie et
Guide des travaux pratiques
Statistiques
RGRESSION LINAIRE
1- Pour justifier un ajustement affine (y = ax + b) , on a calcul le coefficient de corrlation
linaire r. Dans les cas suivants, le rsultat est
r = 1,22
mdiocre bon idiot
r = -0,89
mdiocre bon idiot
2- Quand on ajuste linairement x et y par la mthode des moindres carrs, on obtient deux
droites de rgression. L'quation de la droite D de y par rapport x est
3- Dans le cas d'indpendance totale, le coefficient de corrlation linaire est gal
0 1 -1 autre rponse
4- Une valeur leve du coefficient de corrlation linaire est signe d'une relle relation
causale, dans le cas
du revenu national et de la consommation finale
OUI NON
du prix d'un produit et du prix d'un produit substituable
OUI NON
du nombre d'abonns au tlphone et des ventes de mdicaments
contre le stress
OUI NON
des heures travailles par les tudiants pour rviser leurs examens et
leurs taux de russite ces examens
OUI NON
de la taille des salaris et de leurs salaires
OUI NON
de la taille des salaris et de leurs poids
OUI NON
de la temprature et de l'allongement d'une barre d'acier
OUI NON
OFPPT/DRIF 72
Statistiques
5- Utiliser les calculs effectus dans le tableau ci-dessous pour calculer la covariance entre
les variables x et y
i xi yi xiyi xi yi
1 50 7 350 2500 49
2 60 5 300 3600 25
3 70 6 420 4900 36
4 80 3 240 6400 9
5 90 1 90 8100 1
SOMME 350 22 1400 255000 120
-
6300
-28 28 308 autre rponse
6- D'aprs les donnes et le graphique du tableau ci-dessous, indiquer laquelle des
propositions s'applique correctement ces informations
xi yi
19 12
52 17
38 25
81 43
109 55
75 73
66 42
100 75
La covariance entre x et y est
positive
La covariance entre x et y est ngative
on ne peut rien dire priori sur le
signe de la covariance entre x et y
aucune proposition ne convient
Le concept de la covariance n'est pas
pertinent pour analyser statistiquement le
phnomne tudi
73
Statistiques
7- Calculer la pente a de l'quation de rgression y = ax + b , pour les donnes du tableau
suivant
i 1 2 3 4 5
xi 10 12 14 16 18
yi 957 939 971 1006 1012
853,1 977 0,09 8,85 autre rponse
8- Calculer l'ordonne l'origine b de l'quation de rgression y = ax + b , pour les donnes
du tableau suivant
i 1 2 3 4 5
xi 16 18 20 22 24
yi 462 449 458 378 365
422,4 -13,25 756,14 687,4 autre rponse
SRIES CHRONOLOGIQUES
1-On considre la srie chronologique
Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
1995 10 12 13 14
1996 11 15 16 13
1997 12 17 18 15
1998 13 17 19 16
2- Si une srie suit un modle multiplicatif et qu'on divise les valeurs de la srie brute par les
valeurs des coefficients saisonniers, on obtient
la srie des variations alatoires ou accidentelles
la srie ajuste
la srie dsaisonnalise (C.V.S.)
autre rponse
3- Soit la srie chronologique suivante, qui suit un modle multiplicatif
t 1 2 3 4 5 6 7 8 9 10 11 12
yt 47 30 39 14 62 40 50 16 69 50 62 15
Le trend, la date t = 3, calcul par les moyennes mobiles d'ordre 4 est gal
39 22 34,38 68,75 28,51
OFPPT/DRIF 74
Statistiques
La valeur la mme date de la srie CVS est
41,46 0,98 37,5 38,4 33,9
4- Soit la srie chronologique
Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
Anne 1 20 18 20 22
Anne 2 24 22 24 26
Anne 3 28,8 26,8 28,8 30,8
Anne 4 34,6 32,6 34,6 36,6
Anne 5 41,5 39,5 41,5 43,5
La srie suit un modle de type
additif multiplicatif
5- Soit Yt la srie du chiffre d'affaires mensuel d'une entreprise de janvier 1987 dcembre
1991. L'quation du trend est Tt = 3,76 t + 700 ; (t = 1,....,60)
Les coefficients saisonniers sont :
janvier S1 = -16 mai S5 = 11 septembre S9 = - 60
fvrier S2 = -51 juin S6 = 64 octobre S10 = -1
mars S3 = -80 juillet S7 = 0,09 novembre S11 = 62
avril S4 = -81 aot S8 = -69 dcembre S12 = 222
Sachant qu'on a un modle additif, une estimation de la valeur future de juin 1993 est
940,64 1057,3 764
1038,48 831,7 autre rponse
6- Soit la srie chronologique ci-aprs qui suit un modle de type additif
1996 1997 1998
1 trimestre 420 515 500
2 trimestre 615 685 835
3 trimestre 825 1000 980
4 trimestre 540 620 700
- La moyenne mobile d'ordre 4 du 3 trimestre 1997 est
768 772 703 733 680
- La valeur du coefficient saisonnier brut S' du 1 trimestre est
OFPPT/DRIF 75
Statistiques
5,15 48 - 65 - 192 - 109
- Le coefficient saisonnier S du 1 trimestre est
- 109 - 179 -194 - 13
- La valeur de la srie CVS au 2 trimestre de l'anne 1996 est
609 679 576 642
7

Vous aimerez peut-être aussi