8. 考える上でのポイント
n
p
X
n
p
X
XT
p
n
=
=
XT
n
p
2種類の行列が登場
(形だけに注目)
n
n
p
p
S
G
グラム行列と同じ形
p>>nの場合、サイズが小さい
→
計算が速い(Dual
PCA)
カーネル法と関連する
→
非線形性を扱える(Kernel
PCA)
こっちの方が嬉しい事が多い
共分散行列と同じ形
(通常のPCAと関係)
15. Kernel PCA(2/3)
高次元空間でのPCAは以下の通り
(X→φ、共分散行列がでかすぎて解けない可能性も)
1
n −1
ΦΦT
ui = λiui
φφTの固有値分解
(普通のPCA)
ΦTΦにおける
固有値分解
1
n −1
ΦT
Φvi = λivi
S =p' p'
p'
G =n n
n
φの設定の仕方で、この共分散行列は幾らでも大きくなるが(無限大にすら)
Dual
PCAにすれば、高々n×n行列の固有値分解として解ける
めちゃくちゃでかく
なりえる
vi =
1
(n −1)λi
ΦT
ui ui = (n −1)λi Φvi
n次元ベクトル(データ次元)
p’次元ベクトル(超高次元)
yi = ΦT
ui = (n −1)λi ΦT
Φvi
第i主成分得点の求め方もn次元で解決できる
データ数
Gn
n
n
Dual