Module Statistiques
Module Statistiques
Module Statistiques
OFPPT
Office de la Formation Professionnelle et de la Promotion du Travail DIRECTION RECHERCHE ET INGENIERIE DE FORMATION
MODULE : STATISTIQUES
Le Portail http://www.ista.ma Que vous soyez tudiants, stagiaires, professionnels de terrain, formateurs, ou que vous soyez tout ue simplement intress(e) par les questions relatives aux formations professionnelle aux mtiers, professionnelle, http://www.ista.ma vous propose un contenu mis jour en permanence et richement illustr avec un suivi
quotidien de lactualit, et une varit de ressources documentaires, de supports de formation ,et de documents en ligne ( supports de cours, mmoires, exposs, rapports de stage ) .
Le site propose aussi une multitude de conseils et des renseignements trs utiles sur tout ce qui concerne la recherche d'un emploi ou d'un stage : offres demploi, offres de stage comment rdiger stage, sa lettre de motivation, comment faire son CV, comment se prparer l'entretien dembauche etc. dembauche, Les forums http://forum.ista.ma sont mis votre disposition, pour faire part de vos expriences, ragir l'actualit, poser des question questionnements, susciter des rponses.N'hsitez pas interagir avec 'hsitez tout ceci et apporter votre pierre l'difice. r Notre Concept
Le portail http://www.ista.ma est bas sur un concept de gratuit intgrale du contenu & un modle collaboratif qui favorise la culture dchange et le sens du partage entre les membres de la communaut ista.
Notre Mission
Diffusion du savoir & capitalisation des expriences.
Notre Devise
Partageons notre savoir
Notre Ambition
Devenir la plate-forme leader dans le domaine de la Formation Professionnelle.
Notre Dfi
Convaincre de plus en plus de personnes pour rejoindre notre communaut et accepter de partager leur lus savoir avec les autres membres.
Statistiques
Document labor par : Mlle Nadia BENHADDOU BAKKIOUI ISTA Taroudant DR SMD
OFPPT/DRIF
Statistiques
OFPPT/DRIF
Statistiques
SOMMAIRE
Prsentation du module RESUME DE THEORIE Chapitre I- Les statistiques descriptives : ITerminologie : 9 10 11 11 12 12 13 14 14 16 16 17 19 19 20 21 22 22 22 23 23 23 23 24 24 25 25 25 26 26 27 27 28 29 29 29 29
IITableaux statistiques : A- Cas dune seule variable B- Cas de deux variables IIIReprsentations graphiques : A- Variable qualitative B- Variable quantitative 1) Variable discrte 2) Variable classe IVCaractristiques de tendance centrale et de position : A- Mode B- Mdiane C- Moyenne arithmtique D- Moyenne gomtrique E- Moyenne harmonique F- Moyenne quadratique G- Quantiles VCaractristiques de dispersion : A- tendue B- Intervalle inter-quartile C- Variance et cart-type D- Coefficient de variation VILa concentration : A- Valeurs globales B- Mdiale C- Courbe de concentration (ou de LORENZ) D- Indice de GINI VII- Les indices : A- Indices lmentaires B- Indices de LASPEYRES et de PAASCHE 1) Indice de Laspeyres des prix 2) Indice de Laspeyres des quantits 3) Indice de Paasche des prix 4) Indice de Paasche des quantits
OFPPT/DRIF
Rsum de Thorie et Guide des travaux pratiques VIII- Rgression et corrlation : A- Ajustement dun nuage de points une fonction une fonction mathmatique B- Mesure de lintensit de la relation linaire entre deux variables 1) Covariance 2) Coefficient de corrlation linaire 3) Droites de rgression IXSries chronologiques : A- Dcomposition des chroniques B- La dtermination du trend C- Analyse de la composante alatoire D- Dsaisonnalisation E- Srie ajuste F- Prvisions court terme
Statistiques 30 30 31 31 32 32 33 33 34 35 35 35 35 37 37 38 40 40 43 44 46 47 48 49 50 52 53 55 56 76 77
Chapitre II. Ralisation des enqutes I. Dtermination optimale dun chantillon II. Elaboration du questionnaire Chapitre III. Ralisation des sondages IEstimateur dune moyenne ou dune proportion IIVariance de ces estimateurs IIIEstimation par intervalle de confiance Contrle continu GUIDE DES TRAVAUX PRATIQUES TP1 : reprsentation graphique, paramtres de tendance centrale, de dispersion. TP2 : reprsentation graphique TP3 : paramtres de tendance centrale TP4 : reprsentation graphique, la corrlation TP5 : reprsentation graphique, paramtres de tendance centrale et de dispersion TP6 : ajustement linaire, prvisions et corrlation TP7 : QCM Evaluation de fin de module Liste bibliographique
OFPPT/DRIF
Statistiques
Module : Statistiques
Dure : 50 H 40% : Thorique 60% : Pratique
OBJECTIF OPERATIONNEL DE PREMIER NIVEAU DE COMPORTEMENT
COMPORTEMENT ATTENDU Pour dmontrer sa comptence, le stagiaire doit appliquer les mthodes statistiques. Selon les conditions, les critres et les prcisions qui suivent : CONDITIONS DEVALUATION A partir des tudes de cas, mise en situation, consignes du formateur, toute documentation ncessaire ; A laide de : calculatrice, tableur et logiciel de statistiques.
CRITERES GENERAUX DE PERFORMANCE o Respect de la dmarche de calcul o Respect des principes de gestion de temps o Respect des pratiques courantes et des rgles tablies par lentreprise o Exactitude des calculs o Vrification approprie du travail.
OFPPT/DRIF
Statistiques
OBJECTIF OPERATIONNEL DE PREMIER NIVEAU DE COMPORTEMENT CRITERES PARTICULIERS DE PRECISION SUR LE PERFORMANCE COMPORTEMENT ATTENDU o Qualification dune variable A. Comprendre les variables statistiques qualitative o Qualification dune variable quantitative discrte o Qualification dune variable quantitative continue B. Raliser des reprsentations o Reprsentation correcte des graphiques variables quantitatives discrtes o Reprsentation correcte des variables quantitatives continues C. Calculer les caractristiques des distributions Calcul et interprtation juste des paramtres de tendance centrale Mode Mdiane Quartiles Moyennes Calcul et interprtation correcte des paramtres de dispersion Etendue Ecart absolu moyen et cart quantile Variance, cart-type et coefficient de variation Traitement du cas de deux caractres quantitatifs (coefficient de corrlation linaire, ajustement par la droite des moindres carrs, rapport de corrlation) Traitement du cas dun caractre quantitatif et dun caractre qualitatif (rapport de corrlation) Traitement du cas de deux caractres qualitatifs 7
o OFPPT/DRIF
Statistiques
Ralisation de sondage simple avec : estimateur dune moyenne ou dune proportion variance de ces estimateurs estimateurs de ces variances algorithmes de tirages
o o o o o o o
Dtermination optimale de lchantillon Elaboration du questionnaire Recueil des donnes Dpouillement, codage et saisie Validation des donnes Traitement statistique Analyse des rsultats
OFPPT/DRIF
Statistiques
Avant dapprendre comprendre les variables statistiques, le stagiaire doit : 1- Comprendre la notion des statistique 2- Comprendre les objectifs des statistiques Avant dapprendre raliser les reprsentations graphiques, le stagiaire doit : 3- Distinguer entre les variables qualitatives et les variables quantitatives 4- Distinguer entre les variables quantitatives discrtes et les variables quantitatives continues 5- Prsenter les sries statistiques dans des tableaux Avant dapprendre calculer les caractristiques des distributions, le stagiaire doit : 6- Raliser des reprsentations graphiques 7- Interprter ces reprsentations graphiques Avant dapprendre dterminer les liens entre deux variables, le stagiaire doit : 8- reprsentez les distributions deux variables dans des tableaux 9- reprsentez graphiquement ces distributions 10- calculer les caractristiques des distributions 11- Interprter ces caractristiques des distributions Avant dapprendre raliser des sondages, le stagiaire doit : 12- dfinir le sondage 13- comprendre les objectifs de la ralisation des sondages 14- calculer les caractristiques des distributions Avant dapprendre raliser des enqutes, le stagiaire doit : 15- dfinir lenqute 16- comprendre les objectifs de la ralisation des enqutes
OFPPT/DRIF
Statistiques
PRESENTATION DU MODULE
Ce module sadresse en priorit aux techniciens comptables des entreprises et aux techniciens spcialiss en gestion des entreprises. Il rpond trois objectifs fondamentaux : 1) Lacquisition des connaissances : chaque chapitre comprend ainsi une partie Cours dtaille : les formules mathmatiques fondamentales, mais aussi les points dlicats du cours sont abords. 2) Lutilisation des connaissances : chaque chapitre comprend des applications nombreuses et varies qui permettent aux stagiaires dutiliser leurs connaissances. La plupart de ces applications sont accompagnes dindications de rsultats ou lments de rponse. 3) Ladaptation des connaissances : des Travaux Pratiques proposs, devront permettre aux stagiaires de mettre en application leurs qualits de raisonnement et dadaptation face des problmes plus longs o de nombreuses connaissances sont exiges. La masse horaire affecte ce module est de 50 heures dont 30 heures consacres aux travaux pratiques.
OFPPT/DRIF
10
Statistiques
OFPPT/DRIF
11
Statistiques
1. Statistique : La statistique est une mthode scientifique dont lobjet est de recueillir, dorganiser, de rsumer et danalyser les donnes dune enqute, dune tude o dune exprience, aussi bien que de tirer les conclusions logiques et de prendre les dcisions qui simposent partir des analyses effectues. 2. Population : Ensemble d'individus dfinis par une proprit commune donne. Exp : si lon veut tudier la dure de vie des ampoules lectriques fabriques par une compagnie, la population considre est lensemble de toutes les ampoules fabriques par cette compagnie. 3. Echantillon : Sous-ensemble de la population. Exp : pour tablir la dure de vie des ampoules lectriques produites par une machine, on peut prlever au hasard un certain nombre dampoules - un chantillon- parmi toutes les celles produites par cette machine. 4. Individu ou unit statistique : Chaque lment de la population ou de lchantillon. Exp : dans lexemple prcdant, chaque ampoule constitue un individu ou une unit statistique. 5. La taille : Reprsente le nombre dindividus dun chantillon ou dune population. Elle est symbolise par n dans le cas dun chantillon et par N dans le cas dune population. 6. Le caractre : Cest laspect particulier que lon dsire tudier. Exp : concernant un groupe de personnes, on peut sintresser leur age, leur sexe leur taille 7. Les modalits : Les diffrentes manires dtre que peut prsenter un caractre. Exp 1 : le sexe est un caractere qui presente deux modalits : feminin ou masculin Exp 2 : quant au nombre denfants par famille, les modalits de ce caractere peuvent etre 0,1 2,3,20. 8. Caractre qualitatif : Ses modalits ne sexpriment pas par un nombre Exp : la religion, le sexe, lopinion 9. Caractre quantitatif : Ses modalits sont numriques. Exp : lage, la taille, le poids
OFPPT/DRIF
12
Statistiques
10. Caractre quantitatif discret Lensemble des valeurs que peut prendre le caractre est fini ou dnombrable. Le plus souvent, ces valeurs sont entires. Exp :le nombre denfant dans une famille, le nombre de tlviseurs par foyer et la pointure des souliers. 11. Caractre quantitatif continu : Le caractre peut prendre thoriquement nimporte quelle valeur dans un intervalle donn de nombres rels. Exp : la taille dun individu, le poids 12. Srie statistique : Lensemble des diffrentes donnes associes un certain nombre dindividus. Exp : la srie suivante rsulte dune courte enqute auprs de quelques personnes pour connatre leur age : 18 21 19 19 17 22 27 18 18 17 20 20 23
II-
Tableaux statistiques :
Le nombre d'individus observ tant en gnral important, le tableau prcdant ne permet pas d'analyser l'information obtenue. Il est donc ncessaire de crer un tableau plus synthtique o les observations identiques (possdant la mme modalit) ont t regroupes.
Pour une variable qualitative, les modalits ne sont pas mesurables. Pour une variable quantitative, les modalits sont mesurables. Ce sont des valeurs numriques ponctuelles lorsque la variable est discrte des intervalles lorsque la variable est continue ou lorsque la variable est discrte et qu'elle comporte beaucoup de modalits. OFPPT/DRIF 13
Statistiques
Application : Nous tudions une population de 1000 entreprises selon le caractre modalit forme juridique . Les modalits retenues : S.A (Socit Anonyme), SARL (Socit A Responsabilit Limite), EI (Entreprise Individuelle), SNC ( Socit en Nom Collectif). Leurs effectifs respectifs : 200, 400, 340, 60. T.A.F : Prsentez cette srie dans un tableau.
On dsire crer un tableau appel tableau de contingence donnant le nombre d'individus possdant simultanment la modalit i de variable1 et la modalit j de variable2 qui se prsentera sous la forme suivante:
OFPPT/DRIF
14
Statistiques
Application: Dans une entreprise, une enqute statistique a t faite sur 300 employs, et portant sur deux caractres, lage et la rmunration. Les rsultats de lenqute sont prsents dans les deux tableaux suivants : Age n 150 20 25 100 25 30 200 30 35 50 35 40 Rmunration en dhs n 200 Moins de 1500 150 1500 2000 100 2000 2500 50 plus de 2500 TAF : Prsentez dans un mme tableau la distribution de ces deux caractres.
III-
Reprsentations graphiques :
Lorsqu'on observe un caractre sur des individus, on aboutit un tableau de chiffres peu parlant. L'objectif est de donner une reprsentation graphique de ce tableau qui permette d'un seul coup d'il d'avoir une ide de la manire dont se rpartissent les individus.
A- Variable qualitative :
A chaque modalit i est associ un effectif ni. La seule reprsentation qui nous intresse est celle des effectifs ni (ou des frquences ni/n). Suivant la variable observe, de nombreuses reprsentations plus ou moins informatives peuvent tre utilises. Cependant les 2 plus classiques sont:
- les modalits de la variable sont places sur une droite horizontale (attention: ne pas orienter cette droite car les modalits ne sont pas mesurables et il n'y a donc pas de relation d'ordre entre elles). - les effectifs (ou les frquences) sont placs sur un axe vertical. La hauteur du tuyau est proportionnelle l'effectif.
OFPPT/DRIF
15
Statistiques
les diagrammes secteurs (ou camemberts) - L'effectif total est reprsent par un disque. - Chaque modalit est reprsente par un secteur circulaire dont la surface (pratiquement : l'angle au centre) est proportionnelle l'effectif correspondant.
Application : La rpartition des candidats convoqus pour participer au Test dAdmissibilit la Formation en Management (TAFEM 1998) pour laccession LEcole Nationale de Commerce et de Gestion dAgadir , selon la srie du baccalaurat se prsente comme suit : Srie du Bac xi Nombre de candidats ni Sciences conomiques 250 Sciences mathmatiques 200 Sciences exprimentales 400 T.G.A 50 T.G.C 100 Total 1000 TAF: reprsentez cette distribution en Tuyaux dorgues et Diagramme circulaire.
OFPPT/DRIF
16
Statistiques
B- Variable quantitative :
Avant toute tentative de reprsentation, il y a lieu de distinguer entre variable discrte et variable classe (regroupements en classes). Deux types de graphiques sont intressants de reprsenter: a) les diagrammes diffrentiels qui mettent en vidence les diffrences d'effectifs (ou de frquences) entre les diffrentes modalits ou classes. b) les diagrammes cumulatifs qui permettent de rpondre aux questions du style "combien d'individus ont pris une valeur infrieure (ou suprieure) tant?". 1) Variable discrte
Diagramme diffrentiel : le diagramme en btons Les valeurs discrtes xi prises par les variables sont places sur l'axe des abscisses, et les effectifs (ou les frquences) sur l'axe des ordonnes. La hauteur du bton est proportionnelle l'effectif.
Diagrammes cumulatifs : ils permettent de visualiser l'volution des effectifs (frquences) cumuls croissants ou dcroissants.
Remarque: les deux courbes sont symtriques par rapport un axe horizontal d'ordonne n/2 pour les effectifs, pour les frquences. On utilise l'effectif (frquence) cumul croissant pour rpondre aux questions du style : Quel est le nombre (%) d'individus dont la valeur du caractre est infrieure ou gale x ? On utilise l'effectif (frquence) cumul dcroissant pour rpondre aux questions du style : Quel est le nombre (%) d'individus dont la valeur du caractre est strictement suprieure x ? OFPPT/DRIF 17
Rsum de Thorie et Guide des travaux pratiques Se souvenir: (au plus x) quivalent ( < x) donc utiliser N(x) ou F(x) (plus que x) quivalent ( > x) donc utiliser N '(x) ou F '(x) Exemple:
Statistiques
- (au plus 6) quivalent ( < 6) donc on pourra lire la frquence cumule croissante en 6, c-d. F(6) = 0,3 - (plus de 6) quivalent ( > 6) donc on pourra lire la frquence cumule dcroissante en 6, c..d. F '(6) = 0,7 - (moins de 6) quivalent (< 6) quivalent ( < 6- ) o est une trs faible valeur positive, donc on pourra lire la frquence cumule croissante en 6- , c..d. F(6- ) = 0,2 - (au moins 6) quivalent ( > 6) quivalent ( > 6- ) o est une trs faible valeur positive, donc on pourra lire la frquence cumule dcroissante en 6- , c..d. F '(6- ) = 0,8
Application : Reprsentez graphiquement la distribution des 50 tudiants en fonction du nombre de personnes par mnage suivante : Nombre de personnes par mnage xi Nombre dtudiants ni 5 3 15 4 15 6 10 7 5 8 Total 50
2) Variable classe
C'est un ensemble de rectangles contigus, chaque rectangle associ chaque classe ayant une surface proportionnelle l'effectif (frquence) de cette classe. Attention: Avant toute construction d'histogramme, il y a lieu de regarder si les classes sont d'amplitudes gales ou ingales. OFPPT/DRIF 18
Statistiques
Le cas des classes d'amplitudes gales ne pose aucune difficult car il suffit de reporter en ordonne l'effectif (la frquence). Dans le cas d'amplitudes ingales on reporte en ordonne la densit di (effectif divis par l'amplitude de la classe)
Diagrammes cumulatifs
OFPPT/DRIF
19
Statistiques
Application : Reprsentez graphiquement la distribution de 50 tudiants en fonction de leur taille suivante : Taille en cm xi Nombre dtudiants 16 150-160 6 160-165 12 165-170 14 170-175 2 175-180 Total 50
IV-
Les caractristiques de tendance centrale essayent de donner la valeur la plus reprsentative d'un ensemble de valeurs numriques.
A- Mode :
C'est la valeur observe d'effectif maximum. Variable discrte: classer les donnes par ordre croissant. Celle d'effectif maximum donne le mode. Il est fortement conseill d'utiliser le diagramme en btons pour dterminer le mode. En effet, deux valeurs conscutives xi , xi+1 peuvent avoir le mme effectif maximum; on parlera d'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mlange de deux populations qui conduit un diagramme en btons o apparaissent deux bosses; on considrera deux modes. Il est dconseill, sauf raison explicite, d'envisager plus de deux modes. Variable classe: la classe modale correspond la classe ayant l'effectif maximum. Il est fortement conseill d'utiliser l'histogramme pour dterminer le mode. Comme pour le cas discret, on peut avoir deux classes modales. Toutes les valeurs de la classe pouvant priori se raliser, on ne se contentera pas de dterminer la classe modale. Une des valeurs de cette classe sera le mode. Certains auteurs prconisent par simplicit de prendre le centre de la classe modale. Il est prfrable cependant de tenir compte des classes adjacentes de la manire suivante:
OFPPT/DRIF
20
Statistiques
Application : Dterminez la valeur modale de la distribution suivante, de 50 tudiants selon leur taille : Taille en cm : xi Nombre dtudiants : ni 150-160 15 160-170 6 170-175 10 175-180 16 185-200 3 Total 50 Elments de rponse : Mo = 173.77 cm
B- Mdiane :
Les valeurs tant ranges par ordre croissant, c'est la valeur de la variable qui spare les observations en deux groupes d'effectifs gaux. Variable discrte: la dtermination peut s'obtenir partir du tableau statistique en recherchant la valeur de la variable correspondant une fonction cumule gale n/2 (effectif cumul) ou (frquence cumule). Il est encore plus facile de lire sur les graphiques cumulatifs les abscisses des points d'ordonne n/2 (effectif cumul) ou (frquence cumule). Si tout un intervalle a pour image n/2 ( pour la frquence), on parlera d'intervalle mdian (on peut prendre le milieu de l'intervalle comme mdiane)
Application : Soit la srie statistique suivante : 19 17 20 18 17 17 20 19 15 16 20 23 22 14 15 24 TAF : Calculez la mdiane de cette srie Elments de rponse : Me=18.5
Variable classe: l'abscisse du point d'ordonne n/2 ( pour la frquence)se situe en gnral l'intrieur d'une classe. Pour obtenir une valeur plus prcise de la mdiane, on procde une interpolation linaire. La valeur de la mdiane peut tre lue sur le graphique ou calcule analytiquement.
OFPPT/DRIF
21
Statistiques
d'o la valeur de la mdiane. De manire gnrale, si a et b sont les bornes de la classe contenant la mdiane, F(a) et F(b) les valeurs de la frquence cumule croissante en a et b, alors
Application : Dterminez la valeur mdiane de la distribution des tailles suivantes : Taille en cm xi Nombre dtudiants ni N 150-160 15 15 160-165 5 20 165-170 10 30 170-175 18 48 175-180 2 50 Total 50 # Elments de rponse : Me = 167.5
N 50 35 30 20 2 #
C- Moyenne arithmtique :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable classe, La moyenne arithmtique est un paramtre de tendance centrale plus utilis que les autres de par ses proprits algbriques: a) Pour plusieurs populations d'effectifs n1, n2, ....., nk, de moyennes respectives moyenne globale = moyenne des moyennes
OFPPT/DRIF
22
Statistiques
Application : Dterminez la taille moyenne des 50 tudiants dont la distribution par taille se prsente comme suit : Taille en cm xi Nombre dtudiants 150-160 16 160-165 6 165-170 12 170-175 14 175-180 2 Total 50 Elments de rponse : x = 168.3 cm
D- Moyenne gomtrique :
Si xi sont les observations d'une variable quantitative, la moyenne gomtrique est gale Ce type de moyenne est surtout utilis pour calculer des pourcentages moyens. r tant un taux d'accroissement, 1+r est appel coefficient multiplicateur; et le coefficient multiplicateur moyen est alors gal la moyenne gomtrique des coefficients multiplicateurs.
E- Moyenne harmonique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale
Il n'est pas vident d'utiliser ce type de moyenne. Elle intervient lorsqu'on demande une moyenne de valeurs se prsentant sous forme de quotient de deux variables x/y (km/h, km/litre,...). Attention, il faut cependant bien dcortiquer le problme car il peut aussi s'agir d'une moyenne arithmtique.
Application : Un cycliste effectue une travers de 50 kms. Pendant les 20 premiers kms il roulait avec une vitesse constance de km/h, les 15 kms suivants une vitesse constante de 30 km/h. Du point kilomtrique 35 au 55 la vitesse de notre cycliste nest que de 10 km/h et au-del du point kilomtrique sa vitesse nest que de 5 km/h. TAF : Quelle est la vitesse de ce cycliste sur lensemble du parcours ? Elments de rponse : H = 16.67
F- Moyenne quadratique :
Si xi sont les observations d'une variable quantitative, la moyenne harmonique est gale
OFPPT/DRIF
23
Statistiques
G- Quantiles :
Ce sont des caractristiques de position. Il y a 1 mdiane Me qui spare les observations en 2 groupes d'effectifs gaux 3 quartiles Q1, Q2, Q3 qui sparent les observations en 4 groupes d'effectifs gaux 9 dciles D1, D2, ..., D9 qui sparent les observations en 10 groupes d'effectifs gaux 99 centiles C1, C2, ..., C99 qui sparent les observations en 100 groupes d'effectifs gaux La dtermination de ces caractristiques est identique celle de la mdiane. Les quartiles sont obtenus lorsqu'on a cumul 25, 50, 75% de la population Les dciles sont obtenus lorsqu'on a cumul 10, 20,...., 90% de la population Les centiles sont obtenus lorsqu'on a cumul 1, 2,...., 99% de la population Remarque: la notion de dciles et de centiles n'a de sens que s'il y a beaucoup d'observations et donc essentiellement pour une variable classe.
Application : Soit la population de 80 salaris classs daprs le niveau de leur salaire journalier. Classes en dhs ni ni cumuls 5 5 90 100 1 14 9 100 110 2 30 16 110 120 3 55 25 120 130 4 68 13 130 140 5 75 7 140 150 6 78 3 150 160 7 80 2 160 170 8 Total 80 TAF : calculez la mdiane et les deux quartiles Elments de rponse : Me = 124 Q1= 110+ (10x6)/16 = 113.7 Q3= 130+(10x5)/13 = 133.8
V-
Caractristiques de dispersion :
Comme leur nom l'indique, ces caractristiques essayent de synthtiser par une seule valeur numrique la dispersion de toutes les valeurs observes.
A- tendue :
C'est la diffrence entre la plus grande et la plus petite observation
Application : Quelle est ltendue de la srie statistique suivante : 10 390 395 405 410 1000 Elments de rponse : Etendue = 990
B- Intervalle inter-quartile :
C'est la diffrence entre le troisime et le premier quartile
Application : Reprenez les donnes de lapplication sur les quartiles et calculez lintervalle inter-quartile. Elments de rponse : Q3-Q1=20
OFPPT/DRIF
24
Statistiques
C- Variance et cart-type :
Si xi sont les observations d'une variable discrte ou les centres de classe d'une variable classe, la variance
On utilise plus couramment l'cart type qui est la racine carre de la variance et qui a l'avantage d'tre un nombre de mme dimension que les donnes (contrairement la variance qui en est le carr) La variance est un paramtre de dispersion plus utilis que les autres de par ses proprits algbriques:
D- Coefficient de variation :
C'est un coefficient qui permet de relativiser l'cart type en fonction de la taille des valeurs. Il permet ainsi de comparer la dispersion de sries de mesures exprimes dans des units diffrentes
Applications : App.1- Les sries suivantes reprsentent la mesure dun caractre auprs des individus dune population : a. 6 1 8 10 5 4 11 3 2 9 7 12 13 b. 19 17 7 1 4 24 15 22 10 13 c. 15 12 17 15 20 15 20 15 15 9 7 d. 21 25 34 10 20 27 14 20 34 Dans chacun de ces cas calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le coefficient de variation. Elments de rponse : a. x=7, Me=7, pas de mode, =14, =3.74, V=53.4% b. x=13.2, Me=14, pas de mode, =52.76, =7.26, V=55% c. x=14.5, Me=15, Mo=15, =14.61, =3.82, V=26.3% d. x=22.8, Me=21, deux modes :20 et 34, =59.28, =7.70, V=33.8%
OFPPT/DRIF
25
Statistiques
App.2- La distribution suivante reprsente la rpartition de la longueur de pinces dcrevisse provenant dune rivire : Limites ni 5 1.02---1.23 7 1.24---1.45 4 1.46---1.67 1 1.68---1.89 4 1.90---2.11 6 2.12---2.33 3 2.34---2.55 1 2.56---2.77 TAF : calculez : la moyenne, la mdiane, le mode,la variance, lcart type et le coefficient de variation. Elments de rponse : x=1.757, Mo=1.345 (le centre de la classe modale), Me=1.648, =0.238, =0.488, V=27.8%
VI-
La concentration :
L'objectif est de mesurer les ingalits dans la rpartition d'une variable l'intrieur d'une population. Cette notion n'a d'intrt que dans la mesure o les valeurs globales suivantes ont une signification concrte
A- Valeurs globales :
xi reprsentent les valeurs ponctuelles ou les centres des classes, ni les effectifs correspondants. Les valeurs globales de la srie (xi , ni) sont les quantits gi = ni xi
B- Mdiale :
La mdiale de la srie (xi , ni) est la mdiane de la srie (xi , gi)
Application : Limportance quantitative des portefeuilles de titres dposs dans une socit de portefeuille Maroc Invest en Kdh en 1996. Importance du portefeuille en kdh f% f cumul f% fcumul 2 2 41 41 Moins de 10.000 17 15 78 37 10.000 50.000 28 11 88 10 50.000 100.000 41 13 94 6 100.000 200.000 60 19 98 4 200.000 500.000 100 40 100 2 500.000 plus Total 100 100 f reprsentent les pourcentages du nombre total des portefeuilles. f reprsentent les pourcentages de la valeur totale des portefeuilles. TAF : calculez la mdiane et la mdiale de cette distribution Elments de rponse : Me = 19730, Ml= 342105 kdh
OFPPT/DRIF
26
Statistiques
D- Indice de GINI
Proprits:
OFPPT/DRIF
27
Statistiques
A- Indices lmentaires :
L'indice d'volution d'une variable lmentaire y entre la date t0, dite date de rfrence ou date de base, et la date t, dite date courante est
L'indice base 100, c..d. exprim en pourcentage est Remarque: Il est toujours prfrable d'effectuer les calculs avec i et de donner le rsultat en base 100 la fin des calculs. On utilise essentiellement l'indice des prix (P), l'indice des quantits ou volumes (Q), et l'indice des valeurs ou dpenses (V = P Q) Proprits: - identit - rversibilit - circularit - L'indice est troitement li au taux de croissance
OFPPT/DRIF
28
Statistiques
Applications : App.1- Le prix de la tomate au Maroc a t de 1.5 dhs en moyenne en 1980 et de 2.3 dhs en 1995. TAF : calculez lindice lmentaire du prix de la tomate en 1995, base 100 en 1980 et interprtezle. Elments de rponse : I95/80= G95 =(2.3/1.5) x 100 = 153.33 G80 Le prix de la tomate au Maroc a augment de 53.33% entre 1980 et 1995 App.2- On savait que le prix du sucre dans un pays X a augment de 2.5% entre 1960 et 1975 et de 7.5% entre 1960 et 1995. TAF : dterminez lindice lmentaire du prix du sucre en 1995 base 100 en 1975, pour le pays en question. Elments de rponse : I95/75= I95/75 = 107.5x100 104.88 I75/60 102.5 Exercice de synthse : Les donnes concernant lvolution des prix de plusieurs articles entre les priodes 1995 et 1985, ainsi que leur poids sont groups dans le tableau suivant : P85 Prix P95 i Articles 0.15 40 36 A 0.10 15 12 B 0.25 45 40 C 0.05 13 15 D 0.15 50 42 E 0.10 8 5 F 0.05 40 30 G 0.15 10 8 H TAF: calculez les indices lmentaires des prix des diffrents articles, puis dterminez lindice gnral des prix. Elments de rponse : I95/85 ( PA) = 40/36 x 100 = 111.11 I95/85 ( PB) = 15/12 x 100 = 125 I95/85 ( PC) = 45/40 x 100 = 112.5 I95/85 ( PD) = 13/15 x 100 = 86.67 I95/85 ( PE) = 50/42 x 100 = 119.05 I95/85 ( PF) = 8/5 x 100 = 160 I95/85 ( PG) = 40/30 x 100 = 133.33 I95/85 ( PH) = 10/8 x 100 = 125 - Lindice des moyennes: I95/85 = P95 = 31.2/26.85 x 100 = 116.2 P85 - La moyenne des indices : I95/85 (P) = i I95/85i =120.9
Statistiques
OFPPT/DRIF
30
Statistiques
Application : Les donnes concernant lvolution des prix et des quantits de plusieurs articles entre les priodes 1995 et 1985 : P85 P95 Q85 Q95 Prix Articles 7 6 40 36 A 20 20 15 12 B 11 13 45 40 C 15 15 13 15 D 18 9 50 42 E 25 25 8 5 F 9 10 40 30 G 30 30 10 8 H TAF : calculez les diffrents indices synthtiques des prix, des quantits et des valeurs. Elments de rponse : - Indice de Laspeyrs des prix : L95/85 (P) = 125 - Indice de Paasche des prix : P (P) = 119 - Indice de Laspeyrs des quantits: L95/85 (Q) = 119 - Indice de Paasche des quantits : P (P) = 134 - indice des valeurs (indice des dpenses totales) : D 95/85 = P95 Q95 = 3030/2136 x 100 =142 P85 Q85
Lorsque le nuage de points (xi , yi) est peu prs rectiligne, on peut envisager d'exprimer la liaison entre x et y sous forme de fonction affine y = ax + b
OFPPT/DRIF
31
Statistiques
Pour ajuster un nuage de points une courbe exponentielle , il suffit de faire le changement de variable Y = ln y , X = x , A = ln a , B = ln b , pour obtenir l'quation Y = AX + B, et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points (Xi , Yi).
c) Ajustement une fonction puissance
Pour ajuster un nuage de points une courbe puissance , il suffit de faire le changement de variable Y = ln y , X = ln x , A = a , B = ln b , pour obtenir l'quation Y = AX + B , et d'utiliser ensuite l'ajustement linaire par la mthode des moindres carrs sur les points (Xi , Yi).
OFPPT/DRIF
32
Statistiques
relation fonctionnelle linaire indpendance linaire dpendance linaire d'autant plus forte que Attention: Une forte causalit entre x et y implique une forte relation entre x et y qui n'est pas forcment linaire; on n'a donc pas obligatoirement une forte corrlation linaire. Une forte corrlation linaire n'implique pas forcment une forte causalit.
3) Droites de rgression
est grand
Dy/x : y = ax + b avec
La position des deux droites de rgression l'une par rapport l'autre donne un renseignement sur l'intensit de la relation linaire: * droites de rgression confondues relation fonctionnelle linaire
* droites de rgression perpendiculaires dont une de pente nulle indpendance linaire * Plus les droites sont proches, plus la relation linaire est importante
Relations intressantes: r = aa'
OFPPT/DRIF
33
Statistiques
Application : Les sries statistiques simples de deux variables continues X et Y se prsentent comme suit : Individus 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X 2 12 13 7 6 3 12 10 9 7 4 2 10 6 3 Y 22 2 4 14 15 19 7 8 10 11 16 18 11 12 21 TAF : aprs avoir labor un tableau de contingence, en adoptant des classes damplitudes gales 4 units pour la variable X et des amplitudes 5 units pour la variable Y, il vous est demand dapprcier la liaison qui existe entre ces deux variables. Elments de rponse : Y 27 7 12 12 17 17 22 n.j X 26 0 0 2 3 5 6 10 0 3 2 0 5 10 14 3 2 0 0 5 ni. 3 5 4 3 15 Les quations des droites dajustement linaire : -lajustement linaire de Y X : Y= a.X + b = -1.37 X+ 22.79 -lajustement linaire de X Y : X = a.Y + b = -0.56 Y+14.62 - coefficient de corrlation r : r = -0.87 Forte liaison linaire ngative entre les deux variables.
IX-
Sries chronologiques :
Ce sont des sries d'observations chelonnes dans le temps. L'objectif de l'tude des sries chronologiques est double: analyse d'un phnomne temporel en mettant en vidence essentiellement la tendance gnrale et les fluctuations saisonnires laboration d'un modle permettant de faire de la prvision court terme
OFPPT/DRIF
34
Statistiques
B- La dtermination du Trend :
1) Ajustement linaire par la mthode des moindres carrs
La droite de rgression de Y par rapport au temps t donne pour chaque t une valeur Tt
2) temps 1 2 3 4 5 6 7 Lissage par moyennes mobiles d'ordre k (k = nombre d'observations dans un cycle) variable y1 y2 y3 y4 y5 y6 y7 (y1 + y2 + y3)/3 (y2 + y3 + y4)/3 (y3 + y4 + y5)/3 (y4 + y5 + y6)/3 (y5 + y6 + y7)/3 (y1/2 + y2 + y3 + y4 + y5/2)/4 (y2/2 + y3 + y4 + y5 + y6/2)/4 (y3/2 + y4 + y5 + y6 + y7/2)/4 moyennes mobiles d'ordre 3 moyennes mobiles d'ordre 4
les moyennes mobiles donnent pour chaque t (mis part les valeurs extrmes) une valeur Tt
Application : La socit BMT a pour activit la vente de systme dalarme. Le caractre porteur de ce march lui a permis sur les cinq dernires annes denregistrer les ventes suivantes en KDH : Annes N 4 N 3 N 2 N 1 N Chiffre 71697 90574 94550 125257 138150 daffaires TAF :estimez la prvision des ventes pour lanne N+1 en utilisant la mthode des moindres carrs. Elments de rponse : soit x le rang de lanne et y le chiffre daffaires xi yi xiyi xi 1 71697 71697 1 4 181148 90574 2 9 283650 94550 3 16 501028 125257 4 25 690750 138150 5 Sommes 15 520228 1728272 55 Moyennes 3 104046 a=16759 et b=53769 le chiffre daffaires y sexprimerait donc en fonction du rang x de lanne : y=16759x + 53769 Pour lanne N+1 (rang 6), la prevision serait la suivante : y=16759 x 6+53769 = 154323 kdh
OFPPT/DRIF
35
Statistiques
- calcul des diffrences Yt - Tt = St + At - calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne des diffrences de la saison j - calcul des coefficients saisonniers
2) modle multiplicatif
- calcul des rapports Yt / Tt = St . At - calcul des coefficients saisonniers bruts S'j : pour chaque saison j, S'j = moyenne des rapports de la saison j - calcul des coefficients saisonniers
E- Dsaisonnalisation :
Pour exprimer ce qu'aurait t le mouvement brut sans l'influence saisonnire, on utilise la srie corrige des variations saisonnires Y* (ou Ycvs)
1) modle additif Y*t = Yt - St 2) modle multiplicatif Y*t = Yt / St
F- Srie Ajuste
Cette srie est utilise pour reprsenter ce qu'aurait t le phnomne en l'absence de phnomnes alatoires 1) modle additif = Tt + St 2) modle multiplicatif = Tt . St
F- Prvision court terme: Lorsque le trend est obtenu par la mthode des moindres carrs, il est possible d'obtenir une prvision postrieure l'intervalle d'tude ( condition de rester dans des limites raisonnables), en utilisant le modle prcdent. Pour une date x correspondant un coefficient saisonnier Sx , la tendance vaut Tx , et la prvision est donc donne par Tx + Sx en modle additif ou Tx . Sx en modle multiplicatif
OFPPT/DRIF
36
Statistiques
Application : La socit Jihane fabrique des jouets en plastique. Son activit a un caractre saisonnier trs marqu. On dispose des donnes suivantes relatives aux annes N-2, N-1 et N : N2 N1 N Trimestre 1 18912 25052 27635 Trimestre 2 28362 37579 41440 Trimestre 3 33098 43837 48357 Trimestre 4 14178 18789 20718 Total 94550 125257 138150 TAF : 1. Reprsentez graphiquement cette srie statistique 2. Calculez les coefficients saisonniers de cette srie. 3. Dterminez la srie corrige des variations saisonniers 4. Quelles sont les prvisions pour les annes N+1, N+2, N+3 et N+4 ? Elments de rponse :
60000 50000 40000 ventes 30000 20000 10000 0 1 2 3 4 5 6 7 8 9 10 11 12 trimestres
2. Trimestr1 Timestre2 Trimestre3 Trimestre4 yt yt yt/yt yt yt yt/yt yt yt yt/yt yt yt yt/yt N 2 189 28362 33098 24405 1.36 14178 26325 0.54 12 N-1 250 28819 0.87 37579 30738 1.22 43837 31637 1.39 18789 32443 0.58 52 N 276 33490 0.83 27635 34296 1.21 48357 20718 35 0.85 1.215 1.375 0.56 Coeff saiso nnier s Coefficient saisonnier 1er trimestre = (0.87+0.83)2 = 0.85 3. Trimestre 1 2 3 4 5 6 7 8 9 10 11 12 t yt 18912 28362 33098 14178 25052 37579 43837 18789 27635 41440 48357 20718 Coeff.sais. 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56 0.85 1.215 1.375 0.56 Srie 21013 22690 25460 25778 27836 30063 33721 34162 30706 33152 37198 37669 corrige
OFPPT/DRIF
37
Statistiques
4. la prvision de la tendance ncessite un ajustement de la srie corrige des variations saisonniers (les moyennes mobiles). Droite dajustement de yt => yt = 1391x + 21228 On obtient les prvisions suivantes pour la tendance : Trimestre 13 14 15 16 Prvision 39311 40702 42093 43484 Prvisions des ventes des trimestres 13,14,15 et 16 ( N+1, N+2, N+3 et N+4) Trimestre 13 14 15 16 Prvision de la 39311 40702 42093 43484 tendance Coeff. Saisonn. 0.85 1.215 1.375 0.56 Prvisions des 33414 49453 57878 24351 ventes
Dtermination
Echantillon : fraction reprsentative dune population ou dun univers statistique sur lequel porte une tude. Tous les membres de la population considrs doivent avoir la mme chance dtre choisis.
A.
Mthodes dchantillonnage :
Il existe diffrentes manires dextraire un chantillon dune population. Nous ne verrons que les deux pratiques les plus courantes : 1- Echantillon alatoire : Tous les individus dune population possdent au dpart des chances gales de faire partie de lchantillon. On effectue un choix au hasard. 2- Echantillon stratifi : On divise en strates le population et on tire au hasard dans chaque strate homogne, les lments obtenus dans chaque strate sont combins pour obtenir le rsultat final. 3- Tirage par quota : Il consiste reconstituer une population mre miniaturise, au sein de lchantillon. Lchantillon est considr comme reprsentatif de la population mre. Exp : dans une population donne, il y a 49% de femmes et 51% dhommes ; on dfinit les quotas qui permettront dobtenir un chantillon comprenant 49% de femmes et 51% dhommes.
B.
OFPPT/DRIF
Statistiques
Exp : un calcul financier prvisionnel a un chef de produit que sa nouvelle marque doit obtenir une part de march dau moins 15%, sil veut dgager un bnfice. Une tude est mene auprs de s acheteurs potentiels. Le chef de produit fait pari quune part de march de 20% est tout fait probable. Il se donne une marge de fluctuation de 3 points autour de ce chiffre. Il veut organiser un test qui simule un achat rel, en prsentant les principales marques du march. Combien faudra-t-il interroger de consommateurs potentiels pour vrifier la prvision, Formule de calcul : n=zp q e avec : n : taille de lchantillon ncessaire z : valeur fournie par la table de la loi normale ; elle varie selon le risque derreur que lon accepte pour gnraliser les rsultats. Lusage est de retenir 5% soit une valeur de z=1.96 p : pourcentage prvu de consommateurs qui achtent la nouvelle marque, soit ici 20% q =1-p : pourcentage de consommateurs qui choisissent une autre marque , ici 80%. e: marge de fluctuation (prcision) accepte pour gnraliser les rsultats : ici 3 points de part de march, soit 0.03. Rsultats : n= (1.96)(0.2)(0.8)=683 (0.03)
B- Finalits :
Recueillir des informations auprs des personnes concernes par le sujet traiter Dresser le portrait dune ralit un moment prcis dans le temps Evaluer les effets d'une action Raliser un sondage sur un chantillon important
C- Domaine dapplication :
Tout type de sujet Analyse de l'existant Critique de l'existant Diagnostic Elaboration et choix de solutions Mise en uvre Suivi et ajustement
D- Caractristiques :
OFPPT/DRIF
39
Statistiques
Le questionnaire implique gnralement le choix dun chantillon de la population concerne La standardisation du questionnaire est ncessaire : il est prsent tous les interlocuteurs sous la mme forme, avec les mmes modalits Le questionnaire est un instrument pr-test : il doit tre mis lessai avant dtre utilis pour vrifier sa pertinence Le questionnaire permet dobtenir trois catgories dinformations : - Les faits, les attitudes, les attentes, les opinions - Les caractristiques associes aux rpondants (sexe, ge, fonction) - Les informations relies ladministration du questionnaire (date, lieu, groupe de rpondants, etc) Le questionnaire doit tre accompagn en amont par une communication sur les objectifs et l'utilit du questionnaire, et en aval par une communication sur les rsultats obtenus.
E- Mode demploi :
Dmarche en 8 tapes : Dfinition de la problmatique Dfinition de la population choix du type de questionnaire. Il existe deux types de questionnaires : Le questionnaire auto-administr o le sujet rpond lui mme et le questionnaire administr individuellement complt par lenquteur lui mme lors dun entretien individuel. Formulation des questions. Les questionnaires possdent en gnral la fois des questions ouvertes et fermes : conception du questionnaire Pr-test du questionnaire : Il consiste vrifier si le questionnaire fonctionne ou si certaines modifications simposent en termes de contenu et de forme Codification des rsultats. Raliser une matrice de donnes double entre : *Chaque ligne correspond un rpondant *Chaque colonne correspond une variable ou information demande Questions fermes : A laide dun code numrique ou alphanumrique, on transforme linformation dans un format qui la rend exploitable Questions ouvertes : Il faut posteriori dvelopper une liste de codes pour identifier les diverses rponses des interlocuteurs Exemple : Questions 1 2 3 4 5 n Rponses 1 2 3 O N 1 2 1 2 3 1 2 3 Question1 Question2 Question3 Question n Analyse et interprtation des rsultats. Lanalyse a pour but de rsumer les donnes recueillies de faon rpondre aux questions souleves par la problmatique aborde. Dmarche en 3 tapes - Lanalyse quantitative
OFPPT/DRIF
40
Statistiques
Il sagit grce au calcul statistique danalyser les informations recueillies, en se plaant du point de vue prcis des objectifs de lenqute. Deux grandes catgories dapproche statistique sont gnralement utilises : Les statistiques descriptives : Utilisation des mesures de tendance centrales (moyenne, mdiane, mode), ainsi que des indices de dispersion autour de ces mesures (cart type, interquartile) Les statistiques dductives : Utilises pour rechercher des rapports significatifs entre des variables (corrlation). Elles permettent de faire ressortir des liaisons que lon n'avait pas souponnes lors du lancement de lenqute - Lanalyse qualitative Elle privilgie les aspects socio-conomiques et psychologiques des rsultats. Elle vise l'interprtation des rponses fournies. - Le rapport d'enqute Il fournit une srie de tableaux accompagns de commentaires sur les points les plus importants. ; il est structur de la manire suivante : La prsentation de lenqute qui comprend ; La prsentation des rsultats qui concerne ; Les conclusions .
Statistiques
en droit de penser que la moyenne de lchantillon peut prendre une valeur proche de la moyenne de la population. Mais la moyenne dun chantillon choisi alatoirement dans la population rencontre-t-elle le critre dun estimateur sans biais ?
Do la distribution de probabilit suivante : X Fi (X) 2.0 1/16 2.5 2/16 3.0 1/16 4.0 2/16 4.5 2/16 5.0 2/16 5.5 2/16 6.0 1/16 7.0 2/16 8.0 1/16
On a donc : E(X) = (2.0) 1/16 + (2.5) 2/16 + . + (8.0) 1/16 = 4.75 De plus la moyenne de la population : = 2+3+6+8 = 4.75 4
B-
La proportion dindividus prsentant un caractre particulier dans un chantillon est un estimateur sans biais de la proportion de ces individus dans la population laquelle appartient lchantillon. Exp : OFPPT/DRIF 42
Statistiques
Reprenons lexemple prcdant, considrons cette fois-ci la variable alatoire P reprsentant la proportion de nombre impair dans un chantillon de taille 2 tir avec remise. Lensemble des rsultats possibles est : P 2 3 6 8 2 3 6 8 2 3 6 8 2 3 6 8 P Fi (P) 0 9/16 1 /2 6/16 1 1/16 0/2 1 /2 0/2 0/2 1 /2 2/2 1 /2 1 /2 0/2 1 /2 0/2 0/2 0/2 1 /2 0/2 0/2
On a donc : E(P) = (0) 9/16 + (1/ 2) 6/16+ (1) 1/16 = 1/4 De plus la proportion de nombres impairs dans la population est : = 1/ 4
Statistiques
Application : Soit la population 3,7,12,16,25. Considrer tous les chantillons de taille 2 pris avec remise dans celle-ci. 1. pour chacun des chantillons, calculez la valeur de la variable alatoire X 2. calculez E(x) 3. calculez , la moyenne de la population 4. comparez les rsultats obtenus en b et c Elments de rponse : 1. 0.3 5.0 7.5 9.5 14.0 5.0 7.0 9.5 11.5 16.0 7.5 9.5 12.0 14.0 18.5 9.5 11.5 14.0 16.0 20.5 14.0 16.0 18.5 20.5 25.0 2. 12.6 3. 12.6 4. E(x) =
II-
On peut sinterroger sur les chances que la valeur estime, partir de lchantillon, gale la valeur du paramtre de l population. Il convient donc de pouvoir faire lestimation dun paramtre tout en tant capable dvaluer les chances qu cette estimation de se raliser. Pour ce faire nous effectuons ce quon appelle une estimation pat intervalle de confiance dun paramtre de la population. Le problme consiste donc trouver les bornes de cet intervalle. La moyenne de la variable alatoire X est : E( x ) = X = et lcart -type de X est X = / n (sachant que var (x) = E(x) - [ E(x)] ) Si lchantillon est tir sans remise dans une population infinie ou trs grande avec n< 0.05N ou encore avec remise dan,s la population, quelle que soit la taille de celle-ci, et X = N-n n N-1 Si lchantillon est tir sans remise dans une population finie. Exp : reprenons lexemple prcdant : X Fi (X) 2.0 1/16 2.5 2/16 3.0 1/16 4.0 2/16 4.5 2/16 5.0 2/16 5.5 2/16 6.0 1/16 7.0 2/16 8.0 1/16
On sait que var (x) = E(x) - [ E(x)] Or, on a : E(x) = (2.0) 1/16 + (2.5) 2/16 + + ( 8.0) 1/16 = 25.40 OFPPT/DRIF 44
Rsum de Thorie et Guide des travaux pratiques Do : var (x) = 25.40 (4.75) De plus = (2-4.75) + ( 3-4.75)+ ( 6-4.75) + ( 8-4.75) = 5.69 4 et /n = 5.69/2 = 2.84 o n reprsente la taille de lchantillon.
Application :
Statistiques
Un chantillon de taille n est tir, sans remise, dune population de taille 350 dont la moyenne et la variance sont respectivement 115 et 169. pour chacune des valeurs suivantes de n, valuer la variance et lcart_ type de la variable alatoire X : 1. 5 2. 15 3. 30 4. 50 Elments de rponse : 1. 33.5 et 5.8 2. 11.3 et 3.4 3. 5.2 et 2.3 4. 2.9 et 1.7
III-
On appelle INTERVALLE DE CONFIANCE un intervalle de la forme [L1,L2] , ayant une certaine probabilit de contenir la valeur dun paramtre. L1= X - z/2 x et L2= X - z/2 x O : z/2 est la valeur de la variable z telle que P(z z/2) = 1- /2, le risque derreur et x lcart- type de la distribution dchantillonnage de X appele aussi ERREUR TYPE. Il convient dutiliser : z/2 =2.58 si = 1% z/2 =1.96 si = 5% z/2 =1.65 si = 10% On appelle NIVEAU DE CONFIANCE, not 1 - , la probabilit qua lintervalle de confiance de contenir la valeur du paramtre. On appelle RISQUE DERREUR , not , la probabilit qua lintervalle de confiance de ne pas contenir la valeur du paramtre. Exp : La moyenne et lcart -type du rsultat cumulatif dun chantillon de 36 tudiants dune universit sont 2.6 et 0.3 respectivement. Trouvons un intervalle de confiance 99% pour la moyenne des rsultats cumulatifs de tous les tudiants de cette universit. On a donc : X = 2.6, z/2= z1/2%=2.58 Et x= 0.3/ 36 = 0.05 Do : L1 = 2.6 (2.58)0.05 = 2.47 Et L2 = 2.6 + (2.58)0.05 = 2.73 OFPPT/DRIF
45
Statistiques
Donc : [2.47 ; 2..73] Avec un niveau de confiance de 99% , cest dire que l intervalle [2.47 ; 2..73] Possde 99% des chances de contenir la moyenne du rsultat cumulatif des tudiants de cette universit.
Application : Dans une rgion, on sintresse au temps moyen , inconnu , que prennent les individus dun groupe pour se rendre leur travail. A partir dun chantillon alatoire de taille 100, on a obtenu un temps moyen de 12 minutes. Construisez un intervalle de confiance 90% pour , si lon sait que = 9. Elments de rponse : [11.505 ; 12.495] minutes
OFPPT/DRIF
46
Statistiques
Contrle continu
Dure : 2h Un professeur dEPS en charge de deux groupes de filles nayant jamais pratiqu le saut la perche dcide de les initier ce sport en utilisant deux mthodes dinitiation diffrentes. Les performances ralises la fin du cycle dapprentissage sont les suivantes : Groupe 1(mthode A) : 2.20 2.35 2.40 1.15 2.35 2.00 2.55 2.05 1.85 2.85 2.65 2.35 1.90 2.70 2.05 1.95 2.15 2.05 2.80 2.45 Groupe 2(mthode B) : 1.80 2.00 1.45 2.05 2.00 1.65 2.05 1.65 1.50 1.60 2.15 2.10 1- construire les histogrammes des deux sries de valeurs en utilisant des classes de largeur 0.2m du type : [1.00-1.20[ 2- laquelle de ces deux mthodes semble donner les meilleurs rsultats ? rpondre la question tout dabord daprs les histogrammes puis selon que le critre est : moyenne la plus leve mdiane la plus leve classe modale la plus leve maximum le plus leve minimum le plus lev cart type le plus faible tendue la plus faible autres critres ?
3- construire un nouvel histogramme, cette fois uniquement pour le groupe 1, en utilisant des classes de largeur 0.5. le comparer celui de la question 1. Lequel apporte linformation la plus pertinente ?
OFPPT/DRIF
47
Statistiques
Statistiques
- reprsenter graphiquement une distribution statistique - tudier la tendance centrale de cette distribution - tudier la dispersion de cette distribution - apprcier la forme de cette distribution Dure du TP : 2h Description du TP : Cet exercice permet au stagiaire de matriser la reprsentation graphique dune distribution caractre quantitatif continu, de sentraner sur le calcul des paramtres de la tendance centrale et de dispersion et galement de faire un commentaire en se basant sur la forme de la reprsentation graphique de la distribution. Droulement du TP : Dans une commune rurale, o aucune exploitation agricole natteint 123 Ha. La distribution des 100 exploitants en fonction de la superficie se prsente comme suit : Superficie en Ha : xi Le pourcentage des propritaires fonciers :fi Moins de 5 15 5 10 20 10 15 15 15 20 10 20 30 10 30 50 12 50 et plus 18 Total 100 Questions : 1- quelle est la population cible ? quel est le caractre tudi ? quel est le nombre de modalits ? 2- reprsentez graphiquement la distribution tudie (simple et cumulative) 3- dterminez les diffrentes caractristiques de tendance centrale 4- quen est-il de la dispersion ? 5- est-ce que la rpartition des terres au sein de cette commune est quitable ? Elments de rponse : 1- population cible : les 100 exploitations caractre tudi : la superficie ; sa nature : quantitatif continu nombre de modalits : 7 3X=28.55 Ha Me = 15 Ha Mo= 7.5 Ha 4- Etendue = 125 Ha intervalle interquartile : [Q1 ;Q3] = [7.5 ;38.33] coefficient de variation = 1.04 5- indice de GINI : IG=0.613 lindice tend vers 1 plus que vers 0, on dira que la distribution des terres dans cette commune est assez concentre donc cette distribution est non quitable.
TP 2
OFPPT/DRIF 49
Statistiques
Objectifs viss : - raliser des reprsentations graphiques pour des variables quantitatives continues. Dure du TP : 1h30 Description du TP : Ce TP permettra au stagiaire de matriser la lecture dun tableau reprsentant la distribution dune variable quantitative continue. Il lui permettra galement de reprsenter graphiquement ce genre de variable. Droulement du TP : On considre la distribution dfinie par le tableau ci-dessus : Loyer mensuel en DH Nombre dappartements 150-179 3 180-209 8 210-239 10 240-269 13 270-299 33 300-329 40 330-359 35 360-389 30 Total 172 Questions : a- quelles sont les bornes infrieures et suprieures de la 1ere classe ? b- quelles sont les vraies limites de la 1ere classe ? c- lintervalle de classe utilise est identique pour chaque classe ? quelle est sa taille ? d- quel est le centre de la 1ere classe ? e- quels sont les vraies limites de la classe correspondant leffectif le plus lev ? f- quelles sont les bornes de la classe lintrieur de laquelle sest trouv recens un loyer mensuel de 239.50 DH ? g- construisez un histogramme exprimant les donnes du tableau. h- construisez une courbe deffectifs pour les donnes du tableau. Elments de rponse : a- 150dh et 179dh b- 149.50dh et 179.50dh c- 179.50 149.5 = 30 d- 149.5 + 30/2 = 164.50 dh e- 299.5 dh et 329.50 dh f- 240 dh et 269 dh
TP 3
OFPPT/DRIF 50
Rsum de Thorie et Guide des travaux pratiques Objectifs viss : - calculer les paramtres de tendance centrale - interprter les paramtres de tendance centrale Dure du TP : 1h30
Statistiques
Description du TP : Cet exercice permet au stagiaire de matriser lutilisation des formules de calcul des paramtres de tendance centrale. Droulement du TP : Une agence durbanisme a effectu une tude sur la structure des familles susceptibles de venir habiter une ville nouvelle dont elle est charge dtablir le projet. Trois types de familles ont t dfinis selon la prsence et lactivit du conjoint. Daprs cette tude, les distributions de frquences de ces familles selon le nombre denfants sont les suivantes : Nombre denfants sans conjoint 0 1 2 3 4 5 6 7 Total 33.3 39.3 16.6 6.4 2.5 1.1 0.8 0.0 100.0 Chef de famille avec femme active avec femme inactive 16.2 8.4 26.6 16.4 26.6 25.2 15.6 20.6 9.3 15.3 4.5 12.2 1.2 1.9 0.0 0.0 100.0 100.0
Les trois types de familles considrs se repartissent en pourcentage comme ci-aprs : Total sans conjoint 100 Questions : 1- dterminez pour chaque type de famille et pour lensemble, le mode de la distribution selon le nombre denfants. 2- dterminez pour chaque type de famille et pour lensemble, la mdiane de la distribution selon le nombre denfants. 3- calculez pour chaque type de famille et pour lensemble, le nombre moyen denfants . 5.8 Chef de famille avec femme active 52.9 avec femme inactive 41.2
Rsum de Thorie et Guide des travaux pratiques 1Ensemble sans conjoint Valeur du mode 2 enfants 1 enfant Chef de famille avec femme active Intervalle modale : 1 enfants
Statistiques
2- On retient pour la mdiane la valeur M pour laquelle la frquence cumule est gale . 3Ensemble sans conjoint Nombre moyen denfants 2.171 1.120 Chef de famille avec femme active 1.935 avec femme inactive 2.622
TP 4
OFPPT/DRIF 52
Rsum de Thorie et Guide des travaux pratiques Objectifs viss : - traiter le lien entre variables caractre quantitatif - choisir la reprsentation graphique adquate pour chaque distribution statistique - interprter les reprsentations graphiques Dure du TP : 2h30
Statistiques
Description du TP : Cet exercice permet au stagiaire dtudier le lien existant entre deux variables caractre quantitatifs en se basant sur la lecture dune reprsentation graphique. Droulement du TP : Au cours de la dcennie 1990-2000, les effectifs employs au fond dune houillre et la production nette de charbon ont volu de faon suivante : Anne Effectifs du fond (milliers de Production nette de charbon personnes (millions de tonnes) 1990 71.3 40.1 1991 65.3 35.8 1992 57.6 32.7 1993 50.4 28.4 1994 47.1 25.7 1995 45.8 25.6 1996 42.4 25.1 1997 38.6 24.4 1998 35.9 22.4 1999 32.7 21.1 2000 30.8 20.7 1- reprsentez lvolution de ces deux sries sur deux graphiques coordonnes arithmtiques prsents lun au dessous de lautre faon mettre en vidence lexistence de covariations ventuelles dans le temps. 2- quels sont les inconvnients de cette prsentation ? 3- quel type de graphique permettrait dy remdier ? 4- tracer le graphique de corrlation correspondant au tableau prcdant. 5- comment interprtez-vous ce graphique ?
TP 5
OFPPT/DRIF 53
Statistiques
Objectifs viss : - construire des reprsentations graphiques adaptes aux variables qualitatives et quantitatives discrtes - calculer les paramtres de la tendance centrale - calculer les paramtres de dispersion Dure du TP : 2h Description du TP : Ce TP permet au stagiaire de sentraner sur la reprsentation graphique des variables qualitatives et quantitatives discrtes. Il lui permet galement de matriser le calcul des paramtres de la tendance centrale et ceux de la dispersion. Un sondage sur la capacit pulmonaire des individus nous a donn les rsultats suivants : Age Sexe Capacit pulmonaire (litre) 2.94 F 54 4.03 M 19 3.75 F 18 6.04 M 26 4.92 F 19 6.57 M 22 5.28 M 18 5.19 M 20 4.08 F 20 4.68 M 18 5.38 M 17 4.71 M 29 5.20 M 17 4.50 M 43 4.93 M 30 3.92 F 18 6.54 M 25 5.35 M 38 4.21 F 19 5.40 M 26 6.66 M 20 5.14 M 18 3.49 F 16 5.82 M 19 5.25 M 20 4.89 M 21 6.07 M 19 3.82 F 19 6.71 M 19 5.93 M 30 6.22 M 24 3.86 F 17 Questions: OFPPT/DRIF 54
Statistiques
1- Construisez une distribution deffectifs pour chacune des variables 2- donner une reprsentation graphique pour chacun des cas 3- donnez la mesure de tendance centrale la plus approprie, pour chacune des variables 4- calculez lcart type de la distribution de la capacit pulmonaire Elments de rponse : 3Age : x= 23.4 ans, sexe: Mo=M, capacit pulmonaire : x= 4.98 litres 4- 0.93 litres
TP 6
OFPPT/DRIF 55
Rsum de Thorie et Guide des travaux pratiques Objectifs viss : - tracer un nuage statistique - trouver lquation de la droite dajustement linaire - faire des prvisions en se basant sur la droite dajustement linaire - tudier la corrlation entre deux variables Dure du TP : 2h30
Statistiques
Description du TP : Cet exercice permet au stagiaire de faire des prvisions en trouvant la droite dajustement linaire par la mthode des moindre carrs. Il permet galement dtudier la corrlation entre deux variables. Droulement du TP : Des tudiants de 1ere anne TCE ont eu les rsultats en statistiques et en mathmatiques financires (/100): x (notes de 66 64 69 93 80 71 87 73 79 56 47 statistiques) Y(notes de 72 70 60 94 82 68 86 82 90 55 64 math.fin.) Questions : 1- tracez le nuage statistique 2- ajustez la droite des moindres carrs 3- quelle note de mathmatiques financires pouvez-vous prdire un tudiant de ce niveau qui a eu 75 en statistiques ? 4- calculez le coefficient de corrlation ? Elments de rponse : 2- y= 16.82+0.81x 3- 77.8 4- 0.845
OFPPT/DRIF
56
Statistiques
TP 7
Objectifs viss : - connatre la terminologie principale des statistiques - tablir des tableaux statistiques - construire des reprsentations graphiques - calculer et interprter les diffrents paramtres des distributions Dure du TP : 18h Description du TP : Ce TP est prsent sous forme de QCM. Il couvre presque la totalit des points traits dans ce module. Il pourrait tre utilis comme test de connaissances la fin de chaque section. Droulement du TP : TERMINOLOGIE ET TABLEAUX STATISTIQUES 1Les caractres suivants sont - Le tour de ceinture d'une personne - Le code postal de l'habitation d'un foyer franais - La superficie d'une exploitation agricole - Le groupe sanguin d'un individu 2Les classes suivantes sont-elles bien dfinies? oui non oui non oui non qualitatifs quantitatifs
oui non
57
Rsum de Thorie et Guide des travaux pratiques L'effectif total Le nombre de classes L'amplitude de la classe
Statistiques
4- Le caractre quantitatif discret x admet le tableau de distribution suivant valeurs frquences 1 10,5% 2 22,3% 3 30,4% 4 23,6% 5 13,2% total 100%
67,2%
63,2%
32,8%
30,4%
6- Pour une distribution continue, l'effectif total s'obtient en multipliant l'effectif de chaque classe par le centre de la classe et en ajoutant les nombres ainsi obtenus
vrai
faux
7- Le tableau ci-dessous (notes obtenues par 40 tudiants un examen de statistique) est un tableau 12 4 7 0 10 9 6 10 7 12 7 9 3 13 6 1 14 5 8 5 13 5 9 4 8 18 0 5 4 0 12 6 6 11 1 3 15 9 3 7
De donnes ponctuelles
De distribution
8- Les caractres quantitatifs suivants peuvent-ils tre considrs comme des variables statistiques continues OFPPT/DRIF 58
Rsum de Thorie et Guide des travaux pratiques le nombre d'accidents du travail survenus dans une PME en 1 an la teneur en aluminium d'un alliage
Statistiques
oui oui
non non
9- Les tudiants de formation continue sont rpartis selon leur ge dans le tableau suivant ge effectifs [20 ; 25[ 38 [25 ; 30[ 59 [30 ; 35[ 47 [35 ; 40[ 24 [40 ; 45[ 12 + de 45 2 total 182
Quelle limite doit-on donner la dernire classe si l'on veut que toutes les classes aient la mme amplitude 50 55 34
Quelle est la proportion d'tudiants gs de moins de 35 ans 53,3% 79,12% 92,31% 25,82%
10- La frquence cumule croissante est dfinie par - proportion d'individus dont la valeur du caractre est infrieure x - proportion d'individus dont la valeur du caractre est suprieure x - ensemble des modalits que peut prendre le caractre - autre rponse
11- On a pu regrouper les individus dune population par classes dont les centres sont les suivants : 52, 60, 68, 76, 84, 92. Quelle est lamplitude des classes 2 4 6 8 16
OFPPT/DRIF
59
Statistiques
REPRSENTATIONS GRAPHIQUES
1- A partir du tableau ci-dessous, 3 graphiques ont t tablis. Indiquez celui (unique) de ces graphiques qui ne constitue pas une reprsentation correcte du phnomne
OFPPT/DRIF
60
Statistiques
OFPPT/DRIF
61
Statistiques
OFPPT/DRIF
62
Statistiques
6- Un histogramme est une reprsentation graphique de la distribution des frquences d'une variable statistique continue VRAI FAUX 7- Dans un diagramme secteurs, la modalit n 2 du tableau ci-dessous serait reprsente par un secteur d'angle
OFPPT/DRIF
63
Statistiques
modalits 1 2 3 4
8- Le tableau suivant donne la rpartition des mnages d'une population selon le nombre de vhicules possds nombre d'automobiles nombre de mnages 0 528 1 2463 2 906 3 156 4 et plus 12
9- La reprsentation graphique qui convient le mieux est un diagramme en btons un histogramme une autre reprsentation
2- La mdiane d'une distribution est toujours gale au second quartile OUI NON
3- Dans une srie statistique, il est possible de dterminer dix dciles OUI OFPPT/DRIF NON 64
Statistiques
4- On observe pendant 79 jours ouvrables, le nombre de lettres recommandes mises au cours de la journe, par le service des approvisionnements. L'volution de ces envois au cours de cette priode est fournie dans le tableau suivant. Dterminer le premier et le troisime quartile de cette srie d'expditions quotidiennes de lettres recommandes. rang nbre rang nbre rang nbre rang nbre rang nbre lettres lettres lettres lettres lettres 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 3 3 4 4 5 5 5 5 5 5 6 6 6 6 6 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 8 8 9 9 9 9 9 9 9 9 65 66 67 68 69 70 71 72 73 74 11 11 11 11 11 11 11 12 12 12 12 13 13 14 15 Q1=7 Q1=6 Q1=7 Q3=12 Q3=11 Q3=10
10 75 10 76 10 77 10 78 10 79 10
5- Cocher la nature des indicateurs numriques suivants Paramtre de Paramtre de position dispersion effectif total 3 dcile moyenne gomtrique
ni l'un ni l'autre
OFPPT/DRIF
65
Rsum de Thorie et Guide des travaux pratiques 6- Soit le tableau suivant modalits employs de service manoeuvres ouvriers ouvriers spcialiss agents de matrise employs cadres cadres suprieurs effectifs 2 3 12 22 15 28 13 ?
Statistiques
Sachant que la moyenne arithmtique est 12,5 le nombre de cadres suprieurs est 7 10 5 autre rponse
7- Il existe 100 centiles qui partagent une srie statistique OUI NON
8- On donne la srie statistique suivante : 14, 16, 12, 9, 11, 18, 7, 8, 9, 16, 7, 9, 18. La mdiane est gale autre rponse
11
14
16
18
[9;18[
[11;18[
9- La moyenne gomtrique d'une srie statistique est La racine carre du produit des valeurs observes la racine cubique du produit des valeurs observes la racine n-ime du produit des valeurs observes le produit des racines n-ime des valeurs observes le quotient des racines n-ime des valeurs observes autre rponse OFPPT/DRIF 66
Statistiques
10- Quand les classes d'une srie statistique sont d'amplitudes ingales, il faut obligatoirement corriger les effectifs ou les frquences pour calculer la mdiane OUI NON
11- La moyenne harmonique d'une srie statistique est gale l'inverse de la moyenne arithmtique des inverses des valeurs OUI NON
12- La mdiane partage l'histogramme en deux surfaces gales OUI 13- Soit la srie suivante la moyenne quadratique est gale la moyenne gomtrique est gale la moyenne harmonique est gale 1,92 4,86 1,87 6,25 6,25 1,87 2,78 5,04 2,15 357 15 3,57 NON
xi 1 2 3 4 5 6
ni 20 30 15 10 5 2
autre rponse
14- La rpartition des clibataires selon leur ge est fournie par le tableau suivant ge effectifs [15 ; 30[ [30 ; 40[ 4500 450 [40 ; 50[ 400 [50 ; 60[ 230 [60 ; 70[ 200 [70 ; 80[ ? [80 ; 90[ 20
Sachant que l'ge moyen est gal 28,8 ans, la valeur manquante est 65 150 l'ge mdian est 20,4 26,7 97 165 22,6 autre rponse 102 autre rponse 24,8
OFPPT/DRIF
67
Statistiques
CARACTRISTIQUES DE DISPERSION
1- Compltez le tableau suivant pour calculer la
2- Calculez le coefficient de variation des donnes suivantes: xi 70 80 90 ni 91 189 70 0,085 0,546 45,64 6,76
3- La synthse d'un ensemble d'observations relatives une variable quantitative peut s'effectuer par des paramtres de tendance centrale et de dispersion. L'une des quatre rponses suivantes n'a rien voir avec ce type de synthse: moyenne et cart-type mdiane et cart-type frquence moyenne par unit d'amplitude et mode variance et mode
4- On observe sur un tronon d'autoroute, pendant 51 jours, le nombre x de dpannages effectus au cours de la journe. Calculer l'intervalle inter-quartile des observations
OFPPT/DRIF
68
Statistiques
ran nbre rang nbre rang nbre rang nbre rang nbre g dpannages dpannages dpannages dpannages dpannage s 1 1 11 3 21 4 31 4 41 6 2 3 4 5 6 7 8 9 10 1 1 1 1 2 2 2 2 3 12 13 14 15 16 17 18 19 20 3 3 3 3 3 3 3 3 4 22 23 24 25 26 27 28 29 30 4 4 4 4 4 4 4 4 4 32 33 34 35 36 37 38 39 40 4 5 5 5 5 5 5 5 5 42 43 44 45 46 47 48 49 50 51 L'intervalle inter-quartile vaut 3 4 5 6 autre rponse 6 6 6 6 6 7 8 9 10 11
6- Une entreprise E possde 3 tablissements A, B, C. Les effectifs et les salaires moyens pour les ouvriers , les employs , et les cadres , sont donns dans le tableau suivant A effectifs Ouvriers Employs Cadres Total 60 30 10 100 salaire moyen 10 20 100 22 B effectifs 180 10 10 200 salaire moyen 8 16 90 12,5 C effectifs 5 30 15 50 129,86 salaire moyen 10 25 100 46 478,28 E effectifs 245 70 35 350 salaire moyen 8,5306 21,571 97,143 20 562,51 69
Statistiques
LA CONCENTRATION
1- Si, pour un caractre quantitatif continu et positif, la mdiane est trs peu diffrente de la mdiale, alors l'indice de concentration de Gini est peu diffrent de 0 0,5 1
2- Dans un diagramme de concentration on porte gnralement en ordonnes les valeurs des frquences cumules des valeurs globales. Comment s'crivent ces valeurs
autre rponse
INDICES
1- Le chiffre d'affaires d'une entreprise a augment de 2% par an pendant 2 ans, puis a diminu de 9% par an pendant 4 ans, et a augment de 8% par an pendant 3 ans. Quelle est l'augmentation moyenne sur la priode 1% 9% 10% autre rponse
2- tant donn une population de 50 millions qui a cr au taux de 20% par an, quelle tait cette population il y a 12 ans 38 486 689 39 424 659 1 555 318 5 607 832 autre rponse
3- Une hausse de 80% suivie d'une baisse de 50% revient une baisse de 10% une hausse de 10% une baisse de 20% une hausse de 30% une baisse de 30% autre rponse
4- Une hausse de 60% suivie d'une baisse de 40% revient une hausse de 20% une baisse de 20% OFPPT/DRIF une baisse de 10% une baisse de 4% une hausse de 10% autre rponse 70
Statistiques
5- Une grandeur augmente de 10% par an. Au bout de combien d'annes aura-t-elle doubl 11 ans 1 an 11,1 ans 12,45 ans 10 ans 8,27 ans 7,27 ans autre rponse 6,23 ans
6- Le calcul de l'indice de Laspeyres ncessite de pondrer les indices lmentaires par des coefficients budgtaires relatifs la priode de base la priode courante
7- Calculez l'indice de Laspeyres des prix de 1998 par rapport 1990 partir des donnes du tableau suivant Modle Quantits Prix Ventes 1998 1210 1550 2875 5635 108,91 107,85 Produit B Produit C Total 69 96 62 115 23 28 25 25 1587 2688 5175 100,97 99,98
8- Calculez l'indice de Paasche des quantits de 1998 par rapport 1990 partir des donnes du tableau suivant
Modle
Quantits
Prix
Ventes 1998 1584 1000 1974 4558 109,53 104,81 108,58 105,69
1990 1998 1990 1998 1990 Produit A Produit B Produit C Total 90 56 78 99 50 94 13 18 23 16 20 21 1170 1008 1794 3972
OFPPT/DRIF
71
Statistiques
RGRESSION LINAIRE
1- Pour justifier un ajustement affine (y = ax + b) , on a calcul le coefficient de corrlation linaire r. Dans les cas suivants, le rsultat est r = 1,22 r = -0,89 mdiocre mdiocre bon bon idiot idiot
2- Quand on ajuste linairement x et y par la mthode des moindres carrs, on obtient deux droites de rgression. L'quation de la droite D de y par rapport x est
3- Dans le cas d'indpendance totale, le coefficient de corrlation linaire est gal 0 1 -1 autre rponse
4- Une valeur leve du coefficient de corrlation linaire est signe d'une relle relation causale, dans le cas du revenu national et de la consommation finale du prix d'un produit et du prix d'un produit substituable du nombre d'abonns au tlphone et des ventes de mdicaments contre le stress des heures travailles par les tudiants pour rviser leurs examens et leurs taux de russite ces examens de la taille des salaris et de leurs salaires de la taille des salaris et de leurs poids de la temprature et de l'allongement d'une barre d'acier OUI OUI OUI OUI OUI OUI OUI NON NON NON NON NON NON NON
OFPPT/DRIF
72
Statistiques
5- Utiliser les calculs effectus dans le tableau ci-dessous pour calculer la covariance entre les variables x et y i 1 2 3 4 5 SOMME 6300 xi 50 60 70 80 90 350 yi 7 5 6 3 1 22 xiyi 350 300 420 240 90 1400 xi 2500 3600 4900 6400 8100 255000 yi 49 25 36 9 1 120
-28
28
308
autre rponse
6- D'aprs les donnes et le graphique du tableau ci-dessous, indiquer laquelle des propositions s'applique correctement ces informations
xi 19 52 38 81 109 75 66 100
yi 12 17 25 43 55 73 42 75
La covariance entre x et y est positive on ne peut rien dire priori sur le signe de la covariance entre x et y aucune proposition ne convient
La covariance entre x et y est ngative Le concept de la covariance n'est pas pertinent pour analyser statistiquement le phnomne tudi
OFPPT/DRIF
73
Statistiques
7- Calculer la pente a de l'quation de rgression y = ax + b , pour les donnes du tableau suivant i xi yi 853,1 1 10 957 977 2 12 939 0,09 3 14 971 8,85 4 16 1006 5 18 1012 autre rponse
8- Calculer l'ordonne l'origine b de l'quation de rgression y = ax + b , pour les donnes du tableau suivant i xi yi 422,4 1 16 462 -13,25 2 18 449 756,14 3 20 458 687,4 4 22 378 5 24 365 autre rponse
SRIES CHRONOLOGIQUES
1-On considre la srie chronologique Trimestre 1 Trimestre 2 1995 10 12 1996 11 15 1997 12 17 1998 13 17 Trimestre 3 13 16 18 19 Trimestre 4 14 13 15 16
2- Si une srie suit un modle multiplicatif et qu'on divise les valeurs de la srie brute par les valeurs des coefficients saisonniers, on obtient la srie des variations alatoires ou accidentelles la srie ajuste la srie dsaisonnalise (C.V.S.) autre rponse 3- Soit la srie chronologique suivante, qui suit un modle multiplicatif t 1 2 3 4 5 6 7 8 9 10 yt 47 30 39 14 62 40 50 16 69 50
11 62
12 15
Le trend, la date t = 3, calcul par les moyennes mobiles d'ordre 4 est gal 39 OFPPT/DRIF 22 34,38 68,75 28,51 74
Rsum de Thorie et Guide des travaux pratiques La valeur la mme date de la srie CVS est 41,46 0,98 37,5 38,4 33,9
Statistiques
4- Soit la srie chronologique Trimestre 1 Anne 1 20 Anne 2 24 Anne 3 28,8 Anne 4 34,6 Anne 5 41,5 La srie suit un modle de type additif
multiplicatif
5- Soit Yt la srie du chiffre d'affaires mensuel d'une entreprise de janvier 1987 dcembre 1991. L'quation du trend est Tt = 3,76 t + 700 ; (t = 1,....,60) Les coefficients saisonniers sont : janvier S1 = -16 fvrier S2 = -51 mars S3 = -80 avril S4 = -81 mai S5 = 11 juin S6 = 64 juillet S7 = 0,09 aot S8 = -69 septembre S9 = - 60 octobre S10 = -1 novembre S11 = 62 dcembre S12 = 222
Sachant qu'on a un modle additif, une estimation de la valeur future de juin 1993 est 940,64 1038,48 1057,3 831,7 764 autre rponse
6- Soit la srie chronologique ci-aprs qui suit un modle de type additif 1996 1997 1998 1 trimestre 420 515 500 2 trimestre 615 685 835 3 trimestre 825 1000 980 4 trimestre 540 620 700 - La moyenne mobile d'ordre 4 du 3 trimestre 1997 est 768 772 703 733 680
Statistiques
- Le coefficient saisonnier S du 1 trimestre est - 109 - 179 -194 - 13 - La valeur de la srie CVS au 2 trimestre de l'anne 1996 est 609 679 576 642
OFPPT/DRIF
76
Statistiques
Statistiques
Ouvrage
Auteur
Edition Gaten morin, 1983 El Wataniya, 2001 Collection Expertise, 1996 Dunod, 2002 Editions dOrganisation, 2002 Mars 1993
Probabilits et statistiques Audet, Boucher, Caumartin et Skeene Manuel de statistiques Omar Raja descriptives Mmento pratique sta Rachid Boutti tistiques Gestion prvisionnelle et Brigitte Doriath et mesure de la performance christian Goujet Lessentiel du marketing Eric Vernette Statistiques descriptives O.F.P.P.T Niveau technicien www.larrun.iut.bayonne.univ-pau.fr
OFPPT/DRIF
78