Think Outside the Box

自分のメモのために。

主成分分析について振り返る

主成分分析とは

  • 多次元データに内在する情報 = 分散と考えて、情報を出来るだけ失うことなく 新たな変数を定義していく方法

  • 合成された変数を通してデータの中から有益な情報を読み取るための有効な分析手法

分散最大化のイメージ

2次元データに対して主成分分析を適用する場合、観測データの情報を最も表す(=分散が最も多い)線形モデルを考えたい。 そこで、データをある一次元の軸へ射影して、その分散が最大となる軸を見つける。これを第1主成分という。 f:id:tngwnaho:20190418181728p:plain

次に、第1主成分と直行するという条件のもとで分散を最大とするような射影軸を第2主成分という。

参考: 主成分分析と固有値問題 | Aidemy Blog