R 主成分分析PCA 教學:使用ade4 套件 - Office 指南

文章推薦指數: 80 %
投票人數:10人

主成分分析(principal component analysis,簡稱PCA)是多變量分析中的一種降維(dimensionality reduction)方法,可降低資料的維度,同時保留資料中對變異數貢獻最大的 ... SkiptoprimarynavigationSkiptomaincontentSkiptoprimarysidebar介紹如何在R中使用ade4套件進行主成分分析(principalcomponentanalysis)。

主成分分析(principalcomponentanalysis,簡稱PCA)是多變量分析中的一種降維(dimensionalityreduction)方法,可降低資料的維度,同時保留資料中對變異數貢獻最大的特徵。

在R中有很多不同的套件都可以用來處理主成分分析,這裡我們介紹使用ade4套件進行分析,再以factoextra套件繪製圖形的流程。

安裝R套件 這裡我們需要的套件除了ade4與factoextra之外,還要在加上一個magrittr,而這些都可以透過CRAN官方的套件庫安裝: #安裝必要套件 install.packages("ade4","factoextra","magrittr") 接著載入這些必要的R套件: #載入必要套件 library(ade4) library(factoextra) library(magrittr) 資料集 這裡我們以factoextra套件所附帶的decathlon2資料集作為示範。

#載入decathlon2資料集 data(decathlon2) #查看decathlon2資料結構 str(decathlon2) 'data.frame': 27obs.of13variables: $X100m:num1110.81111.311.1... $Long.jump:num7.587.47.237.097.37.316.817.566.977.27... $Shot.put:num14.814.314.215.213.5... $High.jump:num2.071.861.922.12.012.131.951.861.951.98... $X400m:num49.849.448.950.448.6... $X110m.hurdle:num14.714.11515.314.2... $Discus:num43.850.740.946.345.7... $Pole.vault:num5.024.925.324.724.424.424.924.824.724.62... $Javeline:num63.260.162.863.455.4... $X1500m:num292302280276268... $Rank:int1245789101112... $Points:int8217812280678036800479957802773377087651... $Competition:Factorw/2levels"Decastar","OlympicG":1111111111... 這個資料集中包含了一些運動員的比賽資料,我們取其中一部份的資料進行主成分分析的模型建立,之後再用其餘的資料進行預測。

#取出部份資料 decathlon2.active%.$lisup 將新個體的座標標示在個體分布圖上: #繪製個體分布圖 p%.$cosup #計算cos2 var.cos2



請為這篇文章評分?