Acp
Acp
Acp
classes sociales aujourdhui. Dans un des articles consacrs ce sujet figurait le tableau suivant qui retrace pour 11 catgories de profession figurant en lignes le pourcentage de personnes interroges se sentant appartenir lune des 6 classes sociales proposes. (ex: 43% des agriculteurs se sont auto-dcrits comme appartenant la classe moyenne infrieure). Les absences de rponses ne figurent pas dans ce tableau, ce qui explique que les sommes par lignes ne soient pas gales 100.
PRIVilgi AISE Classe Moyenne SUprieure 15 33,7 56,3 54,8 40,8 34,2 24,1 14,5 16,6 40,5 19,7 Classe Moyenne INfrieure 43 35,4 18,8 26,2 37,7 43,1 46,9 42,1 40,7 36,4 36,5 CLasses POpulaires 19,6 12,2 2,9 0 8,9 9,9 14,9 25 24,6 6,8 18,5 DEFAvoris 11,2 3,9 4 1,6 1,1 2 5,7 13,2 11,3 1,8 9,6
AGRIculteur INDEpendant CAdre SUprieur ENSeignanT PRofessions INtellectuelles CONTremaitre EMPLoy SERVices OUVRiers ETUDiants FEmme au FOyer
4,7 8,3 5,8 8,7 5,3 6,9 4,3 3,9 2,5 5 10,1
3,7 6,1 14,6 7,9 4,7 3,5 3,3 1,3 2,5 9,5 5,1
La premire tape est de crer ce tableau de donnes, labels des variables, types (8.1). On utilise une colonne supplmentaire labelig pour donner des noms aux professions que lon utilisera sur les graphiques :
: On choisit toutes les variables autres que labelig pour faire lanalyse:
LACP consiste calculer de nouvelles variables, les facteurs, qui sont fonction des anciennes et qui sont le plus informatives possibles propos de lensemble des relations entre variables initiales et des ressemblances-dissemblances entre lignes-professions. Pour faire cela, on utilise la base un indice qui mesure la quantit dinformation initiale dans le tableau. Cette quantit, pour des raisons que lon comprend difficilement sans une approche plus mathmatique est gale p=le nombre de variables=6. Chaque facteur va traduire une partie de cette information. Pour choisir le nombre de facteurs
3 intressants analyser, on sintresse dans un premier temps la quantit dinformation extraite par chacun dentre eux. Pour tudier cet aspect, on utilise dans un premier temps, la seule option . Par dfaut les rglages sont les suivants:
Dans , les valeurs propres (ou eigenvalues en anglais) correspondent aux quantits dinformation extraites par chacun des facteurs. Par dfaut SPSS propose de conserver tout facteur qui extrait une quantit dinformation (valeur propre) suprieure 1. Ceci se comprend dans la mesure o une variable prise isolment est porteuse dune quantit dinformation gale 1. Un facteur qui extrait une quantit dinformation moindre que 1 est donc moins porteur dinformation quune variable prise isolment et par consquence na en gnral pas grand intrt. Par contre sil porte une information suprieure 1, il est plus informatif quune variable prise isolment, et donc peut avoir de lintrt. Cette rgle, logique, est cependant peu performante. En effet lorsque lon a beaucoup de variables, il y a un grand nombre de facteurs porteurs dune quantit dinformation suprieure 1 et donc par cette rgle, on retiendra beaucoup de facteurs, dont le nombre en rend linterprtation souvent dlicate. Au contraire, lorsquil y a peu de variables, on a souvent quune seule valeur propre suprieure 1 et donc on ne retiendra quun facteur. Ceci est souvent dommage, car avoir un ou deux facteurs nentrane pas de difficults dinterprtation trs diffrentes, et en avoir 2 reste de toute manire plus informatif quen avoir 1 seul. La premire tape est donc de lui demander de produire les valeurs propres pour quon les tudie et que lon fixe sur cette base le nombre de facteurs que lon va souhaiter utiliser. Ce qui se fait en rglant comme ceci le menu ci-dessus:
Cela fait, on peut envoyer lanalyse. La premire chose qui en sort est le graphique des valeurs propres qui est un graphique qui prsente par ordre dimportance les valeurs propress associes aux facteurs (le 1er tant toujours celui associ la plus grande):
Graphique des valeurs propres
5
Valeur propre
0 1 2 3 4 5 6
Numro du facteur
Valeur propre
0 1 2 3 4 5 6
Numro du facteur
5 On voit quest associ au premier facteur une valeur propre de 4 et quelque cd quil est porteur dune quantit de 4,? dinformation, soit 70% peu prs de linfo totale prsente dans le tableau (4,?/6). Le second est beaucoup moins informatif avec une quantit d peu prs 0,8, soit moins quune variable prise isolment. Le 3me encore moins et les derniers napportent quasiment aucune information. On peut aller vrifier cela sur loutput:
Variance totale explique Valeurs propres initiales % de la Total % cumuls variance 4,262 71,026 71,026 ,826 13,759 84,785 ,760 12,671 97,455 ,118 1,962 99,418 ,033 ,550 99,967 ,002 ,033 100,000
Composante 1 2 3 4 5 6
Sous Composante , on a le n du facteur; lui correspond sous Total la quantit dinformation quil porte (4,26 pour le 1er; 0,83 pour le 2me, ...); sous % de la variance on a le % dinfo contenue dans le tableau qui est extrait par ce facteur (71% pour 1; 13,8% pour 2, ...) et enfin sous % cumules figure le % cumul dinfo extrait par les facteurs (par exemple, si on retenait 3 facteurs, alors le % dinfo extrait serait de 97,5%). Pour choisir combien de facteurs retenir, on a 2 rgles: 1) On limine les facteurs qui portent moins que 1, cest--dire moins quune variable prise isolment. 2) Il intervient gnralement une voire plusieurs rupture de pente sur le graphique des valeurs propres. Cest--dire que lon passe dun facteur reprsentant beaucoup dinformations un autre en reprsentant nettement moins. On sarrtera au facteur prcdant cette rupture de pente. Sur le graphique (a) ci-dessous on retiendrait donc seulement les deux premiers facteurs. Dautres configurations sont aussi possibles, par exemple un premier facteur qui reprsentera une relativement trs forte part dinformation puis deux axes suivants qui reprsenteront une relative forte part, puis une rupture de pente avec des valeurs propres suivantes qui se suivent et se ressemblent ((b) ci-dessous). On retiendra ici 3 valeurs propres (3 facteurs).
(a)
(b)
Exemples de courbes des valeurs propres associes une analyse factorielle. Ces valeurs sont gales la somme des carrs des rapports de corrlation des facteurs avec les variables. En (a) on retiendra 2 axes. En (b) on en retiendra 3. Dans le cas qui nous concerne, les 2 rgles concident: on devrait logiquement ne retenir quun facteur. Cependant, on en retiendra en fait 2 car cela apporte un peu plus dinformation sans pour autant rendre linterprtation beaucoup plus complexe (mais nous sommes dans un cas trs particulier car le tableau de donnes est trs simple). On peut ensuite rellement aller faire lanalyse retourner dans Analyse : Factorisation : Analyse factorielle propose plusieurs mthodes dextraction. Pour faire une analyse standard, on ne touchera pas cette option. On enlvera la croix dans Graphique des valeurs propres (on a dj utilis ce graphique) et on demandera retenir 2 facteurs, daprs ltape prcdente. On demandera en plus loption Structure factorielle sans rotation qui permet dobtenir sur le plan numrique les corrlations entre les variables et les facteurs.
7 On pourra ensuite rgler un certain nombre doptions : Dans , on pourra obtenir des statistiques descriptives de base sur les variables On prendra ici qui donne moyennes et carttypes et inter-variables. dans qui donne la matrice des corrlations
permet dutiliser une analyse avec rotation. Dans un premier temps, on sen passera pour tudier les associations entre variables sous forme de continuum. La seule option que nous cocherons est fourniture des plans factoriels associs aux variables. qui correspond la
permet davoir les scores des lignes (professions ici) sur les que sont les facteurs. On cochera loption qui amne le logiciel sauvegarder ces scores dans le fichier initial laide de nouvelles colonnes. synthtiques
Enfin variables
Ltape suivante est celle de linterprtation du cot variable (catgorie). La premire chose est daller voir les moyennes et les variances dans loutput:
8
Statistiques descriptives PRIV AISE CMSU CMIN CLPO DEFA Moyenne 5,9545 5,6545 31,8364 36,9818 13,0273 5,9455 Ecart-type 2,30103 3,79720 15,21041 8,13914 8,32155 4,53219 n analyse 11 11 11 11 11 11