Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

École Nationale Polytechnique: Département Du Génie Industriel

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 6

École Nationale Polytechnique

Département du Génie Industriel

Analyse des données

Compte rendu sur


L'analyse factorielle des correspondances

Rédigé par :

Kadi Mohamed

Hadjaz Ramzi

1
1 Introduction :

L'analyse factorielle des correspondances vise à rassembler en un nombre réduit de dimensions


la plus grande partie de l'information initiale en s'attachant non pas aux valeurs absolues mais
aux correspondances entre les variables, c'est-à-dire aux valeurs relatives. Cette réduction est
d'autant plus utile que le nombre de dimensions initial est élevé. La notion de  réduction 
est commune à toutes les techniques factorielles  c'est-à-dire où l'on extrait des facteurs  l'AFC
ore la particularité (contrairement aux ACP) de fournir un espace de représentation commun aux
variables et aux individus. Pour cela l'AFC raisonne à partir de tableau réduit ou de fréquences.

2 Les données :

On considère dans cette vignette deux variables qualitatives observées simultanément sur n
individus aectés de poids identiques 1/n. On suppose que la première variable, notée X, pos-
sède r modalités notées x1 , ..., x‘, ..., xr , et que la seconde, notée Y , possède c modalités notées
y1 , ..., yh , ..., yc . La table de contingence associée à ces observations, de dimension rc, est notée T ;
son élément générique est n`h, eectif conjoint. Elle se présente sous la forme suivante d'une table
de contingence présentée dans le Tableau 1).

2
3 Énoncé du TP :

4 Étude de l'indépendance des deux variables :

Pour vérier l'indépendance de deux variables on utilise souvent la loi de khi deux de sorte que
la valeur observée soit supérieur à la valeur théorique qu'on obtient en utilisant la table en tenant
compte de l'erreur qui est à 5%.

4.1 La statistique du khi deux :

La statistique du Khi est dénie comme étant la somme des carrés des écarts à la situation
d'indépendance par rapport à la situation d'indépendance

q
p X
(xij − xijth )2
χ2 =
X

i= j= xijth

pour les fréquences :


p X
q
2
X (fij − fijth )2
χ =n
i= j= fijth

3
Le logiciel a donné les valeurs de χ2 suivantes :

χ2ob = 2598.27 (1)

χ2th = 82.5 (2)

de (1) et (2) on voit que les variables sont bien liées entre elles donc on peut eectuer une AFC.

5 AFC :

5.1 Valeurs propres et choix des axes :

Le tableau suivant représente les valeurs propres ainsi que l'inertie et le cumule en pourcentage.

Le graphique suivant représente les valeurs propres an de pouvoir déterminer le nombre d'axes à l'aide de la
méthode du coude qui casse :

Dans ce cas c'est clair qu'on va choisir les deux premiers axes vu que leurs inertie cumulée est de 77% , on peut
le voir aussi dans le graphique (coude qui casse).
Remarque : La projection de l'AFC s'obtient en eectuant une analyse en composantes principales sur les deux
variables.

4
5.2 Résultat obtenu pour les lignes :

5.2.1 Cordonnées principales des lignes :

5.3 Résultat obtenu pour les colonnes :

5
5.3.1 Cordonnées principales des colonnes :

6 Projection des variables :

Interprétation :
On remarque du graphe que les cadres moy ,employés ,agriculteurs et ouvriers vont généralement dans des
tentes,villages,location et divers endroits les patrons choisissent souvent des hôtels pour leurs vacances par contre
les cadres supérieurs choisissent généralement leurs amis ou bien leurs propriétés et pour les salariés et autres actifs
il choisissent leurs parents

Vous aimerez peut-être aussi