TD Rev
TD Rev
TD Rev
Voici les résultats d’une AFC. On demande de répondre aux questions suivantes:
1. Discuter les inerties.
2. Quels sont les modalités contribuant beaucoup au premier axe factoriel? Au second
axe factoriel? Interpréter chaque axe en termes de type de loisir et de classe d’âge.
3. Quels sont les loisirs préférés de chaque classe d’âge? Comparer la projection sur le
plan factoriel principal et le tableau de contingence.
4. Quelles sont les classes d’âge les plus concernées par chaque type de loisir?
Exercice 2
Un fabriquant de téléphones portables a effectué une étude de marché dans une population
de 12 étudiants. Le tableau suivant représente la couleur du téléphone portable, le système
d’exploitation de l’ordinateur de chaque étudiant, ainsi que la faculté où il est inscrit.
> acmin$TOT
inertia cum ratio
1 0.72427724 0.7242772 0.3621386
2 0.43333543 1.1576127 0.5788063
3 0.35498491 1.5125976 0.7562988
4 0.26414381 1.7767414 0.8883707
5 0.19115518 1.9678966 0.9839483
6 0.03210343 2.0000000 1.0000000
> acmin$col.abs
Comp1 Comp2 Comp3
Telephone.Argente 768 617 1607
Telephone.Bleu.ciel 69 1207 3825
Telephone.Noir 320 3338 1931
Telephone.Vert.menthe 1900 176 1199
Systeme.Linux 868 1352 352
Systeme.Mac 2380 1 152
Systeme.Windows 933 3165 103
Faculte.DEG 1611 85 485
Faculte.Sciences 1151 60 347
> acmin$col.rel
Comp1 Comp2 Comp3 con.tra
Telephone.Argente 2859 -1374 2934 972
Telephone.Bleu.ciel -180 -1882 -4888 1389
Telephone.Noir 833 5207 -2467 1389
Telephone.Vert.menthe -5503 304 1702 1250
Systeme.Linux 3234 -3013 -642 972
Systeme.Mac -8867 3 278 972
Systeme.Windows 2434 4937 131 1389
Faculte.DEG -6001 189 -886 972
Faculte.Sciences 6001 -189 886 694
Université d’Orléans – Master I ESA – Analyse des données qualitatives 5
Exercice 3
On veut étudier le tableau croisé ci-dessous, issu d’une enquête de l’Association pour
l’Emploi des Cadres de l’Agriculture, en 1975. Cette table donne la répartition par secteur
et par classe d’âge des 76155 cadres de l’agriculture ayant répondu au questionnaire. Elle
permet d’étudier la structure d’âge des différents secteurs.
> afcin$TOT
inertia cum ratio
1 0.144238872 0.1442389 0.7961274
2 0.032225767 0.1764646 0.9739978
3 0.002759967 0.1792246 0.9892314
4 0.001951001 0.1811756 1.0000000
Université d’Orléans – Master I ESA – Analyse des données qualitatives 6
Contributions absolues:
Contributions relatives:
Les questions typiques que l’on se pose à partir d’un tel tableau croisé sont:
1. la structure diffère-t-elle beaucoup d’un secteur à l’autre?
2. y-a-t-il des secteurs ayant des structures semblables?
3. quels sont les secteurs “jeunes”, les secteurs “vieux”?
4. dans quels secteurs les jeunes sont-ils entrés durant les dix dernières années?
5. dans quels secteurs y aura-t-il beaucoup de départs à la retraite au cours des dix
prochaines années?
Université d’Orléans – Master I ESA – Analyse des données qualitatives 7
Exercice 4
Nous considérons ici un jeu de données provenant d’une enquête portant sur 810 clients
d’une banque.
This data frame contains the following columns:
2. duree: "Time relations with the customer" a factor with levels dm2 <2
years d24 [2 years, 4 years[ d48 [4 years, 8 years[ d812 [8 years, 12 years[
dp12 >= 12 years
3. oppo: "Stopped a check ?" a factor with levels non no oui yes
4. age: "Customer’s age" a factor with levels ai25 [18 years, 25 years[ ai35
[25 years, 35 years[ ai45 [35 years, 45 years[ ai55 [45 years, 55 years[ ai75
[55 years, 75 years[
5. sexe: "Customer’s gender" a factor with levels hom Male fem Female
6. interdit: "No checkbook allowed" a factor with levels non no oui yes
7. cableue: "Possess a bank card ?" a factor with levels non no oui yes
10. eparlog: "Savings and loan association account amount" a factor with
levels for > 20000 fai >0 and <20000 nul nulle
11. eparliv: "Savings bank amount" a factor with levels for > 20000 fai >0 and
<20000 nul nulle
12. credhab: "Home loan owner" a factor with levels non no oui yes
13. credcon: "Consumer credit amount" a factor with levels nul none fai >0 and
<20000 for > 20000
14. versesp: "Check deposits" a factor with levels oui yes non no
15. retresp: "Cash withdrawals" a factor with levels fai < 2000 moy 2000-5000
for > 5000
Université d’Orléans – Master I ESA – Analyse des données qualitatives 8
16. remiche: "Endorsed checks amount" a factor with levels for >10000 moy
10000-5000 fai 1-5000 nul none
17. preltre: "Treasury Department tax deductions" a factor with levels nul
none fai <1000 moy >1000
18. prelfin: "Financial institution deductions" a factor with levels nul none
fai <1000 moy >1000
19. viredeb: "Debit transfer amount" a factor with levels nul none fai <2500
moy 2500-5000 for >5000
20. virecre: "Credit transfer amount" a factor with levels for >10000 moy
10000-5000 fai <5000 nul aucun
21. porttit: "Securities portfolio estimations" a factor with levels nul none
fai < 20000 moy 20000-100000 for >100000
Exercice 5
Enquête sur les produits biologiques. Source: Gilles Hunault,
http://www.info.univ-angers.fr/pub/gh/Datasets/pbio.htm
Les données suivantes proviennent d’une enquête réalisée dans des supermarchés an-
gevins et parisiens entre 1996 et 1998 dans le but de connaı̂tre l’avis de consommateurs
quant aux produits biologiques et aux produits diététiques.
L’enquête, effectuée auprès de 219 consommateurs, consistait en un questionnaire avec
les 11 questions suivantes:
Q6 - Sexe de la personne
1 homme
2 femme
Université d’Orléans – Master I ESA – Analyse des données qualitatives 13
Q7 - Classe d’age
1 moins de 25 ans
2 entre 25 et 35 ans
3 entre 35 et 45 ans
4 entre 45 et 55 ans
5 entre 55 et 65 ans
6 plus de 65 ans
Q8 - Etat-civil
0 autre
1 marie
2 celibataire
3 divorce
4 en concubinage
5 veuf
Q9 - Nombre d’enfants
1 0 enfant
2 1 enfant
3 2 enfants
4 3 enfants
5 plus de 3 enfants