探索式因素分析(EFA) - SPSS - 吳統雄

文章推薦指數: 80 %
投票人數:10人

主成分分析 行為研究 English 吳統雄 國際研究團隊 知識光譜 第1類知識 第2類知識 第3類知識 取用行為模式 研究目錄 教學課程頁 研究方法 統計多變項分析 參考延伸文獻 討論區目錄 站務與協助 ☰ 社群地圖 社群新聞 │吳統雄 履歷 研究 教學 服務 榮譽 │社科 第1類知識 第2類知識 第3類知識 研究方法 統計/多變項分析 投票行為與選舉預測 53237選民結構 人類取用行為新典範 取用行為國際研究團隊 │資管 管理學‧經濟學 資訊系統開發 電子商務 網路教育 數位電視 產學合作 就業進修‧甄選必勝 │文創 數位美學/數位文創導論 數位出版/電子書 視覺設計 優化網站 數位視訊/微電影 數位文創管理 大學青年‧網路雜誌 │電音 統雄數位音樂作品選 我,被禁唱的民歌手 數位音樂創作教學 統雄的音樂知識美學 歡迎聽歌.點歌.下載樂譜 │人文 公共評論 法律評論 社會評論 教育文化傳媒評論 科技科普評論 美語樂學 文學創作 萬象現代(NBA) 資訊社會 幽默人生 統雄-統計神掌因素分析1 探索式因素分析(EFA):詮釋與實作 ExploratoryFactorAnalysisbySPSS 神掌打通任督二脈‧易筋經以簡馭繁 因素分析簡介 因素分析的類型 因素分析的樣本數 探索式因素分析(EFA):SPSS應用 設計題庫因素萃取 主成分分析 轉軸法 建構新構念(因素)變項 因素負荷量 因素分析的報表 相關係數矩陣 可行性檢定 共同性 因素數目取捨 陡階檢定 因素命名 建構量表 構念變項分數 因素分析真實個案解析:政治態度分析 因素效度/驗證式因素分析(CFA)  因素分析簡介 因素的意義、名稱、類型、與樣本數。

因素的意義與名稱 因素分析中之「因素 factor」,指存在而看不見、無法用物理方式觀察、測量出來的變項,如動機、創新…等等。

因素分析所歸納、萃取之「因素 factor」即為理論建構中之潛在變項 LatentVariable 或構念Construct。

因素廣義上等同常識之「向面dimension」,不過,在統計專業定義上,「因素factor」可專指因素分析之結果,必須為等距資料;而「向面 dimension」可專指「多元尺度法MultidimensionalScaling」分析之結果,通常為等序資料。

Factors 與Dimensions 在計量方法上的差異,前者的基礎為「相關」,而後者為等序上的「相似」。

物理Dimensions 在物理上,Dimensions 特指可具體測量的變項,如長度、重量、時間…等,請勿混淆。

因素分析的類型 因素分析是多變項萃取與分類統計工具,又分為2類:第一類稱為探索式因素分析exploratoryfactoranalysis,EFA),目的在萃取構念(construct)-或稱隱性因素(latent factor),並用以建構量表。

建構的程序為: 1.設計題庫:依據研究目的,收集相關項目。

2.因素萃取:一般使用SPSS。

3.因素命名:根據理論邏輯進行因素命名-亦可視為「構念」命名。

4.建構量表:淨化量表項目以建構具備信度的測量工具-最常見的是「總加量表」。

第二類為驗證式(confirmatoryfactoranalysis,CFA),是檢驗「因素效度」-或稱「因素組合」-確認構念存在、以及應用構念發展理論的方法。

因素分析是相關分析與變異數分析的綜合進階應用。

因素分析的樣本數 能否作EFA的前提與樣本數密切相關。

樣本數當然是愈多愈好,但底限呢?文獻有3種主張: 1.樣本數絕對值:雖然有出現過底限100的記錄,一般仍以200為底限。

2.[樣本/項目]比:從主張5;1到20:1的都有。

3.依據各種相關指標(如Communality,KMO...詳後),對個案作反覆評估。

(Zhao, MacCallumetal.) 從知識立場,當然是第三種途徑最完整,但此一途徑,許多目的是希望能以較少樣本,也能執行因素分析,若不周全,其實風險較高。

在各方考量下,對非統計專業者,就不知如何著手作因素分析了。

統雄老師推算過研究人類行為的最低樣本數為200,所以建議準用這個樣本數為最低限。

下載SPSS範例 下載SPSS高等統計範例資料(右鍵下載)Analy-SPSS-Teaching.exe 下載SPSS多變項分析範例資料(右鍵下載)Analy-SPSS-Teaching-Multi.rar 下載SPSS統計與多變項習題資料(右鍵下載)Analy-SPSS-Multi_Ex.7z 下載SPSS範例資料(教材專區)Analy-SPSS-Teaching.exe 下載範例資料(教材專區):Analy-SPSS-Teaching-Multi.exe 探索式因素分析(EFA):SPSS應用 探索式因素分析(EFA) 的概念模型如下: 對Y1項目的測量,是受到潛在變項 LatentVariable(F1,因素1)的影響,與誤差(e1)的結果。

F1會影響Y1,Y2,Y3,Y4,即存在顯著相關性;但不影響其他Y,即,F1與其他Yn兩兩相關為0。

同理類推F2,F3,F4,且F1,F2,F3,F4彼此獨立而互斥,即Fn之間兩兩相關為0。

亦即,F為Y的自變項,Y1,Y2,…Y13,為可測量之項目,「 探索式因素分析(EFA)」即將逆向由Yn歸納、萃取出其各潛在變項 LatentVariable為何。

因素內的項目數 因素內的項目,除非為可具體物理測量者,其數目可不受限制。

譬如:身高、體重2項目,可能可以合成為1個因素,稱為「體型」。

但若項目為「存在而不可見」的心理、態度項目,則因素內的項目數如果小於5,是可能沒有意義的。

「探索式因素分析(EFA)」通常是要協助建構心理、態度量表,而量表就是等同「考卷」,如果想要測量數學認知、英文認知的考卷,只有 4題以下選擇題,是不可能有效度意義的。

以上圖例,出自國際頂級教科書,統雄老師採用其的另一目的,就是指出:當前國際統計、計量分析研究生態,還是處於宗教型、紅衣大主教抄寫羊皮聖經、缺乏科學化行為研究共識的階段。

應用範例 範例目的:網路使用沉迷行為分析 這是一個習題,不是真正的研究。

分析的程序為: 1.設計題庫:依據研究目的,收集相關項目。

2.因素萃取:一般使用SPSS。

3.因素命名:根據理論邏輯進行因素命名-亦可視為「構念」命名。

4.建構量表:淨化量表項目以建構具備信度的測量工具-最常見的是「總加量表」。

設計題庫 依據研究目的,收集相關項目。

本例 題庫:52題(即項目,或狹義的變項) 擬萃取出若干獨立而互斥的構念(因素),以解釋網路使用行為。

因素萃取 使用SPSS分析的程序如下。

〉資料縮減 〉因子 選擇要萃取的項目(變數)本例是C1~D26。

SPSS使用shift拉變項的時候,有可能會掉,要小心檢查。

〉描述性統計量 〉萃取 〉主成分分析 萃取的方法有多種,最常用的為: 主成分法(PrincipalComponentAnalysis):以變異數分析為基礎。

其次為: 狹義的主因素法(PrincipalFactorAnalysis):以共變數分析為基礎。

特徵值(Eigenvalue) 每因素所含各項目所貢獻的量。

每1個項目的最高特徵值是1,總特徵值數,就是項目數,所以本例就是52。

通常認為1個因素的貢獻要超過1個項目才有意義,所以預設為1以上,才進行萃取。

另一個選項〈因子個數〉,預設為不選,而採用反覆萃取,至選定之特徵值為準。

若是選擇此項,是由研究者決定萃取的因素個數,通常是第二輪以後的作法,或是進行「驗證式因素分析」時,強迫建構因素使用。

收斂最大疊代(MaximumIterationsforConvergence) 又一個難以望文生義的中文統計名詞。

意指最多反覆萃取幾次,預設25為早期個人電腦規格最高能達成數。

隨著電腦硬體大幅進步,已可突破。

通常保留預設,但如果無法在25次內完成,則會出現以下訊息: 「無法收斂於2個疊代。

(收斂=.0X)。

」 則再將「收斂最大疊代」數值改為「X」以上。

〉轉軸法 因素必須追求「獨立而互斥」,其在幾何上的意義,就是資料在「2個獨立而互斥因素」構成的直角平面座標上,會形成迴歸直線。

有時資料會受到第3個以上因素的影響,直接視覺並無直角平面、也無直線,但旋轉後,會接近此前提之要求。

轉軸(如右圖)可以增加因素內項目的貢獻度、不同因素之間的獨立性,建議必選。

〉分數:產生新構念變項(因素)之分數 照常用的量表就是總加量表,傳統上在經過因素分析、取捨項目後,就是將淨化後的項目總加,作為建構新構念(因素)變項的分數。

現在因素分析可以提供更細緻的權重方法,譬如迴歸法就是以項目對因素的迴歸係數來權重後再總加。

〉選項 因素負荷量 在因素分析中,MissingValue的處理,為避免項目間不平衡產生的誤差,應該選擇Listwise。

因素負荷量就是項目對因素的標準迴歸係數,介於0~1之間。

其意義評估與相關分析同。

預設為0.1以下就不顯示了,當然,0.3以下就幾無重要性了。

系統預設報表為按照變項輸入順序排序,在後續建構量表時,閱讀較不順,所以改選按相關程度排序。

因素分析的報表 基本資料 相關係數矩陣 觀察項目間的相關程度。

可行性檢定 因素分析繼續往下作有沒有意義? KMO/MSA因素獨立性考驗 因素之間必須彼此獨立互斥,所以必須作因素獨立性考驗,其實就是「相關」的「逆應用」。

SPP提供2個因素獨立性分析:KMO考驗與Bartlett樣本球型檢定。

KMO考驗沒有通用中文譯名,是由該考驗分析的研究作者3人:Kaiser-Meyer-Olkintest命名而來。

  KMO考驗又是MSA,Measureofsamplingadequacy 分析的延伸,一般直譯為:樣本正確性測驗,頗不達意,故統雄老師將其統一譯為「因素獨立性考驗」,而MSA是「雙因素獨立性考驗」而KMO 是「多因素獨立性考驗」。

MSA定義公式如下: j,k:2因素 r2:r,j的判定係數 p2:r,j的淨相關的判定係數 r,j的淨相關的判定係數就是 2因素相同的部分,所以其值要愈小,因素獨立性愈膏。

而KMO就是各MSA的總加觀念,定義公式如下: 由於因素獨立性相當於信效度的觀念(百分比、面積),所以,作者建議宜大於0.6。

  而0.8以上,亦即具備高因素獨立性。

Bartlett樣本球型檢定 類似卡方分析概念,如果各項目樣本落點平均分配(像球型),即不顯著,就是缺乏因素間的獨立互斥。

所以本項檢定必須顯著才可通過。

共同性 共同性(Communality),即項目可貢獻至因素之程度。

因素數目取捨 根據預設捨棄Eigenvalue<1的因素,本例剩餘12個因素。

平方和負荷量:即判定係數。

變異數的%:反映各因素可解釋總變異量的百分比。

對人類行為而言,真正獨立互斥之因素很少多於7個,所以必須再進一步取捨。

從平方和負荷量總和發現,第5因素與前後因素尚有差距,而第6因素以後,因素間差距變小,稱為發生「陡階(Scree)」現象。

陡階檢定 根據陡階圖,決定選擇前5項因素。

成分矩陣 成分就是因素, 這是轉軸前,各因素所含之項目分析。

因素命名 根據理論邏輯進行因素命名-亦可視為「構念」命名。

  通常會以轉軸後的矩陣,也以「陡階檢驗」分派各因素所含之項目;通常取正相關項目,但如果測量設計時,就有設計「反面項目」,則負相關也納入。

但也可能有特殊情況,以下將有例子。

以各因素所包含的項目為準,進行命名。

本例的第一個因素,包括的10個項目,都與情色有關,故可命名為: 情色行為 包括:d21,d20,d19,d18,d23,d22,d9,d24,d10,d12 其他4個因素,則可分別命名為: 交友行為 包括:c7,c2,c1,c3,c4,c5,c6,c14 收集資訊行為 包括:d16,d17,d11,d15,d7,d8 在本因素中,包括c17:「我常常會因為使用網路和爸媽吵架或遭到責罵」,且為負相關 -.579。

其值在中小之間,唯與其他6個項目均欠缺直接邏輯關係,故不納入。

但,是否意味,「收集資訊行為」是一種社會相信中的「積極行為」,所以促成與父母關係較好?是一個可未來探索的問題。

  遊戲行為 包括:d5,d1,d2,d3,d4,d6 禮儀行為 包括:c10,c9,c8,c11,c12 建構量表與因素分數 建構量表與其因素分數計算,分作:原始項目分數總加法,和自動構念變項權重分數法2種。

原始項目分數總加法 將各因素所包含的項目總加,作為其因素分數。

如「情色行為」因素包括:d21,d20,d19,d18,d23,d22,d9,d24,d10,d12 則其因素分數為其10項目之總加,由於各因素所包含的項目可能不一致,故常取其平均數,以利比較。

  自動構念變項權重分數法 如果在前述階段,選擇了以下設定: 〉分數:產生新構念變項(因素)之分數 便可 在「變數檢視」可以發現自動產生新構念變項、與其權重分數。

在「資料檢視」則可發現各樣本的構念變項分數。

  權重分數呢?還是原始分數? SPSS自動產生的構念變項分數是權重分數,而一般量表在統計時,都是使用原始分數總加? 這兩者之間有優劣嗎? 這好比1份25題的考卷,原始總加量表就是每題平均4分;而權重量表,則是收回全體考卷後,再統計比較多人會答的題目,評分高一點;而較少人會答的題目,評分低一點,這就是權重分數。

權重分數的效果,可能會使觀察對象之間的差異較小;而原始分數的效果,可能會使觀察對象之間的差異較大。

所以,採用那一種分數,還是要從理論基礎、研究的特殊目的,再加斟酌。

因素效度/驗證式因素分析(CFA) 使用MaximumLikelihood方法的因素分析:http://www.unt.edu/rss/class/Jon/SPSS_SC/Module9/M9_FA/SPSS_M9_FA1.htm  管理研究統計課程-問卷 統雄數學神掌系列目錄 分享意見反映 統計教學的內涵與取向 高考統計考題的解析 微積分精華篇 微積分思想篇 微積分進階精華篇 統計/數學符號與其英語讀法 資料型態與視覺呈現 敘述統計 機率論與機率分配 推論統計學精華篇 t分配與t檢定 推論統計‧理論建構 資料分析程序與SPSS基礎 SPSS資料清理 SPSS轉換:Recode重新編碼 SPSS轉換:Compute建構新變項 SPSS選擇觀察值_SPSS 資料庫管理 樣本代表性檢定 單變項:類別_二元資料/百分比分析-詮釋 單變項:類別_二元資料/百分比推論-應用 單變項分析:連續資料_描述與估計推論 單變項連續資料的視覺檢視:變項清理與啟發 卡方分析(雙向) 多向卡方分析 列聯表樞紐分析 單向卡方分析 變異數分析(單因子):詮釋 變異數分析(單因子):應用 簡單迴歸/相關分析:詮釋 簡單迴歸/相關分析:應用 對數/邏輯相關分析 測量工具信度/效度分析 量表信度檢定 量表效標關聯效度檢定 探索式因素分析(EFA):詮釋與實作 探索式因素分析(EFA):應用進階 因素效度分析_CFA:詮釋 因素效度分析_CFA:應用 多變項分析精華篇 多元迴歸分析:詮釋 多元迴歸分析:應用 一般線性模型精華篇 廣義線性模型 雙因子/多因子變異數分析 調節模型與交互作用詮釋 調節模型分析與建構 SPSS統計圖應用:調節模型檢定 共變數分析/詮釋 共變模型建構/應用 因果模型與因果邏輯 中介模型分析 因徑/SEM:模型詮釋與因果邏輯 因徑/SEM:探索式因徑模型建構 因徑/SEM:驗證式結構方程解析 多變項分析實例SEM篇 多變項分析實例SEM+調節篇 因徑/結構方程SEM:反省 無母數統計 統計研討篇 專題-卜豐投針實驗 專題-機率與統計悖論 第1類知識計量工具 第2類知識計量工具 第3類知識計量工具 非等機率統計_新知識體系建構 TX空時座標建構 一般取用測量 信仰取用測量 研究方法/民調市調系列          本站Google排行榜‧全球冠軍 研究方法講義目錄 資訊管理講義目錄 數位文創/數位內容講義目錄 數位音樂講義目錄 產學合作-就業進修講義目錄 人文素養-人與社會講義目錄 人類行為+資訊管理研究目錄 網路使用/電子商務研究目錄 網路教育研究目錄 數位音樂作品目錄



請為這篇文章評分?