什麼是 PCA?
PCA(主成分分析)是一種降維技術,目標是找到資料中變異最大的方向(主成分),將高維資料投影到少數幾個軸上,保留最多的資訊。
互動示範
試著拉動「資料相關性」滑桿,觀察 PC1 軸的方向如何隨之旋轉,以及 PC1 解釋變異的百分比如何變化。
PC1(最大變異方向) PC2(垂直於 PC1) 投影到 PC1
0.70
← 隱藏 / 顯示 →
PC1 解釋變異
—
PC2 解釋變異
—
幾個值得注意的地方:
- 相關性越高(接近 ±1),PC1 解釋的變異比例越大,代表一條軸就能捕捉大部分資訊
- PC1 和 PC2 永遠互相垂直
- 把投影切到「隱藏」,可以更清楚看到散點和軸的幾何關係