R 主成分分析PCA 教學:使用ade4 套件 - Office 指南
文章推薦指數: 80 %
主成分分析(principal component analysis,簡稱PCA)是多變量分析中的一種降維(dimensionality reduction)方法,可降低資料的維度,同時保留資料中對變異數貢獻最大的 ...
SkiptoprimarynavigationSkiptomaincontentSkiptoprimarysidebar介紹如何在R中使用ade4套件進行主成分分析(principalcomponentanalysis)。
主成分分析(principalcomponentanalysis,簡稱PCA)是多變量分析中的一種降維(dimensionalityreduction)方法,可降低資料的維度,同時保留資料中對變異數貢獻最大的特徵。
在R中有很多不同的套件都可以用來處理主成分分析,這裡我們介紹使用ade4套件進行分析,再以factoextra套件繪製圖形的流程。
安裝R套件
這裡我們需要的套件除了ade4與factoextra之外,還要在加上一個magrittr,而這些都可以透過CRAN官方的套件庫安裝:
#安裝必要套件
install.packages("ade4","factoextra","magrittr")
接著載入這些必要的R套件:
#載入必要套件
library(ade4)
library(factoextra)
library(magrittr)
資料集
這裡我們以factoextra套件所附帶的decathlon2資料集作為示範。
#載入decathlon2資料集
data(decathlon2)
#查看decathlon2資料結構
str(decathlon2)
'data.frame': 27obs.of13variables:
$X100m:num1110.81111.311.1...
$Long.jump:num7.587.47.237.097.37.316.817.566.977.27...
$Shot.put:num14.814.314.215.213.5...
$High.jump:num2.071.861.922.12.012.131.951.861.951.98...
$X400m:num49.849.448.950.448.6...
$X110m.hurdle:num14.714.11515.314.2...
$Discus:num43.850.740.946.345.7...
$Pole.vault:num5.024.925.324.724.424.424.924.824.724.62...
$Javeline:num63.260.162.863.455.4...
$X1500m:num292302280276268...
$Rank:int1245789101112...
$Points:int8217812280678036800479957802773377087651...
$Competition:Factorw/2levels"Decastar","OlympicG":1111111111...
這個資料集中包含了一些運動員的比賽資料,我們取其中一部份的資料進行主成分分析的模型建立,之後再用其餘的資料進行預測。
#取出部份資料
decathlon2.active%.$lisup
將新個體的座標標示在個體分布圖上:
#繪製個體分布圖
p%.$cosup
#計算cos2
var.cos2
延伸文章資訊
- 1主成分分析(PCA)原理及SPSS實操 - 每日頭條
主成分分析是一種降維分析,將多個指標轉換為少數幾個綜合指標。由霍特林於1933年首先提出。主成分分析方法之所以能夠降維,本質是因為原始變量之間 ...
- 2主成份分析(Principal Component Analysis, PCA)
主成份分析(Principal. Component Analysis, PCA). 它是對多個變數決定各變數權重而成. 加權平均,依此訂出總指標. 經由線性組合而得的主成份,能保有原.
- 3主成分分析PCA
主成分分析(Principal Component Analysis, PCA)最主要是利用數學的方法,將複雜的事情簡化之。主成分分析在100 年前由英國數學家卡爾·皮爾森發明, ...
- 4世上最生動的PCA:直觀理解並應用主成分分析 - LeeMeng
主成分分析(Principal Component Analysis, 後簡稱為PCA)在100 年前由英國數學家卡爾·皮爾森發明,是一個至今仍在機器學習與統計學領域中被廣泛用來 ...
- 5主成分分析法 - MBA智库百科
主成分分析(principal components analysis,PCA)又稱:主分量分析,主成分回歸分析法主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合 ...