AFC
AFC
AFC
Abdallah Abarda
FSJES Settat,
Année universitaire 2019-2020.
AFC
Caractéristiques de l’AFC
Son objectif est d’analyser la liaison existant entre deux
variables qualitatives (si on dispose de plus de deux
variables qualitatives, on aura recours à l’Analyse des
Correspondances Multiples).
Avant de mettre en oeuvre une A.F.C., il faut s’assurer que
cette liaison existe bien. Pour cela, il existe des graphiques
(diagrammes en barres de profils) et des caractéristiques
numériques permettant de mettre en évidence une telle
liaison lorsqu’elle existe.
Dans ce cas, Le test du khi-deux d’indépendance, basée sur
l’indice khi-deux, permet de tester s’il existe ou non une
liaison significative entre deux variables qualitatives.
Caractéristiques de l’AFC
Son objectif est d’analyser la liaison existant entre deux
variables qualitatives (si on dispose de plus de deux
variables qualitatives, on aura recours à l’Analyse des
Correspondances Multiples).
Avant de mettre en oeuvre une A.F.C., il faut s’assurer que
cette liaison existe bien. Pour cela, il existe des graphiques
(diagrammes en barres de profils) et des caractéristiques
numériques permettant de mettre en évidence une telle
liaison lorsqu’elle existe.
Dans ce cas, Le test du khi-deux d’indépendance, basée sur
l’indice khi-deux, permet de tester s’il existe ou non une
liaison significative entre deux variables qualitatives.
Caractéristiques de l’AFC
Son objectif est d’analyser la liaison existant entre deux
variables qualitatives (si on dispose de plus de deux
variables qualitatives, on aura recours à l’Analyse des
Correspondances Multiples).
Avant de mettre en oeuvre une A.F.C., il faut s’assurer que
cette liaison existe bien. Pour cela, il existe des graphiques
(diagrammes en barres de profils) et des caractéristiques
numériques permettant de mettre en évidence une telle
liaison lorsqu’elle existe.
Dans ce cas, Le test du khi-deux d’indépendance, basée sur
l’indice khi-deux, permet de tester s’il existe ou non une
liaison significative entre deux variables qualitatives.
Caractéristiques de l’AFC
L’A.F.C. est, en fait, une Analyse en Composantes
Principales (A.C.P. ; voir le chapitre 1) particulière, réalisée
sur les profils associés à la table de contingence croisant les
deux variables considérées.
l’A.F.C. consiste à réaliser une A.C.P. sur les profils-lignes
et une autre sur les profils-colonnes.
Les résultats graphiques de ces deux analyses sont ensuite
superposés pour produire un graphique (éventuellement
plusieurs) de type nuage de points, dans lequel sont
réunies les modalités des deux variables considérées, ce
qui permet d’étudier les correspondances entre ces
modalités, autrement dit la liaison entre les deux variables.
Caractéristiques de l’AFC
L’A.F.C. est, en fait, une Analyse en Composantes
Principales (A.C.P. ; voir le chapitre 1) particulière, réalisée
sur les profils associés à la table de contingence croisant les
deux variables considérées.
l’A.F.C. consiste à réaliser une A.C.P. sur les profils-lignes
et une autre sur les profils-colonnes.
Les résultats graphiques de ces deux analyses sont ensuite
superposés pour produire un graphique (éventuellement
plusieurs) de type nuage de points, dans lequel sont
réunies les modalités des deux variables considérées, ce
qui permet d’étudier les correspondances entre ces
modalités, autrement dit la liaison entre les deux variables.
Caractéristiques de l’AFC
L’A.F.C. est, en fait, une Analyse en Composantes
Principales (A.C.P. ; voir le chapitre 1) particulière, réalisée
sur les profils associés à la table de contingence croisant les
deux variables considérées.
l’A.F.C. consiste à réaliser une A.C.P. sur les profils-lignes
et une autre sur les profils-colonnes.
Les résultats graphiques de ces deux analyses sont ensuite
superposés pour produire un graphique (éventuellement
plusieurs) de type nuage de points, dans lequel sont
réunies les modalités des deux variables considérées, ce
qui permet d’étudier les correspondances entre ces
modalités, autrement dit la liaison entre les deux variables.
Données
On considère deux variables qualitatives X et Y :
X à r modalités notées x1 , ..., xl , ..., xr ;
Y à c modalités y1 , ..., yh , ..., yc ;
On les observe simultanément sur n individus (ayant ici
obligatoirement tous le même poids n1 )
Données
Ces données peuvent être présentées sous la forme d’une table
de contingence, ou tableau à double entrée :
Données
Ces données peuvent être présentées sous la forme d’une table
de contingence, ou tableau à double entrée :
Le principe AFC
On suppose qu’il existe une liaison entre X et Y , et on
cherche à décrire, à expliciter, cette liaison.
On se base sur l’étude des profils-lignes et des
profils-colonnes. Rappelons la définition du lime
profil-ligne :
n n n
( l1 , ..., lh , ..., lc )
nl+ nl+ nl+
celle du hime profil-colonne :
n1h n n
( , ..., lh , ..., rh )
n+h n+h n+h
Remarque
Signalons que la distance entre profils (lignes ou colonnes),
utilisée pour réaliser chaque A.C.P., est un peu
particulière : ce n’est pas la distance usuelle, mais la
distance dite du khi-deux.
Exemple illustratif
Exploitations agricoles de la région Midi-Pyrénées. Les
données proviennent des "Tableaux économiques de
Midi-Pyrénées", publiés par la Direction Régionale de
Toulouse de l’INSEE, en 1996 (données relatives à l’année
1993 ; chiffres arrondis à la dizaine près).
Le tableau initial
Le premier résultat fourni est la table initiale, avec ses
marges.
Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.
Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.
Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.
Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.
Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.
Exemple
Prenons l’exemple de l’Aveyron (l = 2) sur l’axe 1 (k = 1), Le
tableau d’inerties fournit : I1 = 0.05501, Celui des coordonnées
donne : c12 = −0.236684. Le tableau de contingence initiale
n 13
permet d’écrire : 2+n = 73 .
Calculer la contribution de l’Aveyron à l’inertie du nuage
des départements selon l’axe 1.
Solution
n2+ 1 2 13 2
n (c2 ) 73 (0.236684)
= = 0.1813
I1 0.05501