Conteúdo 8 - A Análise de Correspondência AC
Conteúdo 8 - A Análise de Correspondência AC
Conteúdo 8 - A Análise de Correspondência AC
Juiz de Fora
AC
Técnica exploratória que busca identificar associações
entre variáveis categóricas (ao invés de contínuas).
transformações.
Versão simples (2 variáveis)
Tabela de contingência (frequência) - N
Y
Total
1 2 ... J
1 n11 n12 ... n1j n1+ J
ni nij
2 n21 n22 ... n2j n2+ j 1
Z
: : : : : :
I nI1 nI2 ... nIJ nI+
Total n+1 n+2 ... n+J n++= 1
Y Total
1 2 ... J (r)
1 p11 p12 ... p1j p1+
2 p21 p22 ... p2j p2+
Z
: : : : : :
I pi1 pi2 ... pij pI+
Total (c) p+1 p+2 ... p+J p++= 1
nij
pij
n
Versão simples (2 variáveis)
Três conceitos básicos:
2. Perfis:
rc
i 1 j 1
tr D r 1 / 2 (P Pˆ )D c1 / 2 D r 1 / 2 (P Pˆ )D c1 / 2
i j
pij pˆ ij
D 1 / 2
r (P Pˆ )D 1 / 2
c
ri c j
1 1
tal que: D r 1 / 2 diag ; c
D 1 / 2
diag ;
r c
Versão simples (2 variáveis)
Pˆ rc é a melhor aproximação de posto 1 para P pela
_____
decomposição de valor singular generalizado.
s s
~ ~ 1/ 2 ~
P k (D u
~ )( D1 / 2 ~
k
1/ 2
rc v k ) rc k r k c v k )
( D u )( D1/ 2 ~
k 1 k 2
s
~
P rc k (D1r / 2 u
~ )( D1 / 2 ~
k c vk )
k 1
T D r 1 / 2 Pˆ D c1 / 2 UΛV
Pˆ D1r / 2 U Λ D1c/ 2 V UU VV 1
u
~
R D r 1 (D1r / 2 U) Λ D r 1 / 2 UΛ tal que ~
rik ik k
ri
v jk k
~
C D c1 (D1c/ 2 V) Λ D c1 / 2 VΛ ~
tal que c jk
cj
Versão simples (2 variáveis)
Deve-se decidir a escala das coordenadas
(normalização):
u ik (k ) v jk (k1 )
~
rik( ) c~ ( )
jk
ri cj
d (a1 , a 2 ) a1 a 2 D c1 a1 a 2
t
2 k 1 2 k 1
ij ij
j 1 i 1
I J
g
i 1
(r )
ik 1 g (jkc )
j 1
AC MÚLTIPLA E CONJUNTA (ACM)
Uma extensão da versão simples porém para mais de
2 variáveis categóricas.
Existem:
Matriz indicadora;
Matriz Burt;
Conjunta (modificação da matriz Burt).
AC MÚLTIPLA E CONJUNTA (ACM)
Matriz Indicadora: X
Obs. w1 w2 x1 x2 y1 y2
1 1 0 1 0 1 0
2 0 1 1 0 1 0
3 0 1 0 1 1 0
4 1 0 0 1 0 1
5 1 0 0 1 0 1
6 1 0 1 0 0 1
7 0 1 0 1 1 0
8 1 0 0 1 1 0
9 1 0 1 0 0 1
10 1 0 1 0 1 0
Total 7 3 5 5 6 4
Se houver muitas obs, o metédo é inviável.
AC MÚLTIPLA E CONJUNTA (ACM)
Matriz Burt : B XX
w1 w2 x1 x2 y1 y2
w1 7 0 4 3 3 4
w2 0 3 1 2 3 0
x1 4 1 5 0 3 2
x2 3 2 0 5 3 2
y1 3 3 3 3 6 0
y2 4 0 2 2 0 4
O total de observações nas categorias w1 e w2 é 10, ou seja,
w1+w2=7+3=10 (=no. obs).
Combinação entre as categorias de uma variável exibe valores
nulos. (vermelho)
AC MÚLTIPLA E CONJUNTA (ACM)
Matriz de correspondência a partir a matriz Burt:
J J
P pkh
b
pkh kh b bkh
b k 1 h 1