1-1 結構方程模型之介紹
結構方程模型(Structural equation modeling, SEM) 是一種融合了因素分析和路徑分析的多元統計技術。它的強勢在於對多變數間交互關係的定量研究。在近三十年內,SEM 大量的應用於社會科學及行為科學的領域裡,並在近幾年開始逐漸應用於心理學、教育學、行銷學研究中。學界中,常見SEM 潛在變數,
包括:
1. 心理學:壓力程度(level of stress)。
2. 社會學:民主制度的品質(quality of democratic institutions)。
3. 生物學:基因型和環境(genotype and environment)。
4. 醫學保健:個人健康功能差異大(difficulty in personal functioning)。
一、何謂SEM?
什麼是結構方程模型(Structural equation modeling, SEM)?簡單地說,就是用一系列的算式,檢測變數之間的因果關係(causal relationship)。這種統計方法就叫作SEM。
為什麼要學新的SEM?以圖1-2 及圖1-3 來說,你亦可以只用多元迴歸(multiple regression)一個一個算出來,不是嗎?沒錯,但是你要算幾遍才夠?此外,逐次算出來的結果,與用SEM算出來的還是有些不一樣,因為SEM可以讓你作更多的分析。跑一次迴歸就有一次誤差,那如果你迴歸之間的誤差有高度相關,你怎麼解決這樣的問題呢?
結構方程模型是一種相當複雜的因果關係模型,它除了可以處理觀察變數與潛在變數以及各潛在變數之間的關係外,同時也考慮了誤差變數的問題。
圖1-1 因果圖之示意圖
結構方程模型(Structural equation modeling, SEM) 的意涵:
1.SEM 是統計之一種技術,旨在檢定變數之間的「關係假設」( test hypotheses about relationships among variables)。
2.SEM 統計重點放在:相關、線性迴歸、因素分析、試題反應理論(IRT)、潛在長成分析、聯立方程式⋯。
3.SEM 亦可視為共變數結構之分析(Analysis of Covariance Structures), 因為SEM 係用觀察之共變數矩陣及平均數(observed covariances and possibly means) 來適配模型。
一般我們所常用的統計方法如迴歸分析、主成分分析、因素分析、路徑分析及變異數分析等,其實都可看成是結構方程模型的特例。但是,結構方程模型的本質上卻都具有上述統計方法所無法比擬的優點。也正因為如此,導致近年來,結構方程模型在心理學、教育學、管理學以及行為科學等領域中能被廣泛的應用。
概括來說,結構方程模式之主要用途:
第一、考驗理論模式(test of theory)
Strictly confirmatory(SC)- 純驗證性
Alternative (competing) models(AM)- 競爭模式
Model generating(MG)- 模式衍生
第二、考驗測量工具的建構信度(construct reliability) 或因素結構效度(validity of factorial structure)。所謂信度, 意指測驗(test, 亦即測量工具)在經歷時間的變化、指標的更動或評分者的替換時在測量分數上的一致性(consistency)、穩定性(stability) 或可靠性(dependability)。至於信度分析則是屬於測驗分析(test analysis) 的一種,目的在於呈現測量受隨機誤差影響的程度。
二、SEM 的發展史
1. Path analysis of Sewall Wright (1918)。
2. Causal modeling of Hubert Blalock (1961)。
3. Factor analysis estimation of Karl Jöreskog (1969)。
4. Econometric simultaneous equations of Arthur Goldberger。
SEM 已成為心理學學者最常用的統計技術。至今,SEM 結構方程模型發展,已經應用到各種領域,涵蓋領域包含:
1. 人力資源管理(Medsder et al., 1994)。
2. 健康醫療(Taylor & Cronin, 1994)。
3. 社會學(Kenny, 1996)。
4. 心理學(Agho et al., 1992)。
5. 經濟學(Huang, 1991)。
6. 宗教的研究(Legge, 1995)。
7. 國際行銷(Han, 1998)。
8. 消費者行為(Spreng et al., 1996)。
9. 通路的管理(Schul & Babakus, 1988)。
10. 廣告(MacKenzie & Lutz, 1989)。
11. 定價策略(Walters & Mackenzie, 1988)。
12. 服飾的滿意度(Jayanti & Jackson, 1991)。
13. 飯店顧客的滿意度(Gundersen et al., 1996)。
三、SEM 的二種模型:驗證性因素分析vs. 結構模型
(一) 驗證性因素分析
SEM 分二種模型,第一種模型為測量模型(measurement model),此模型是用來界定潛在變數與觀察變數之間的線性關係,即如何從觀察變數來間接推測潛在變數。第二種模型為結構模型(structural model),此模型是用來界定潛在自變數與潛在依變數之間的線性關係,即如何從潛在自變數來推測潛在依變數。
驗證性因素分析(Confirmatory Factor Analysis, CFA) 是相對於探索性因素分析 (Exploratory Factor Analysis, EFA) 的一種因素分析方法,通常適用於研究進入較成熟階段時,主要在於詳述和估計一或多個假設模型的因素架構,每一個潛在變數為所屬觀察變數的共同因數,驗證因素分析各參數的性質或因素的數目( 林清山,民77)。CFA 已經被廣泛的使用在心理學、行銷和建議使用在檢測選擇模型的驗證工具上。因此,研究者施測所得的樣本資料必須藉由測量模型的直線關係做為切入點,才能進行整體分析。在驗證性因素分析的過程中,研究者基於理論或假設,可對其因素分析模型提出一些限制,例如,研究者可以決定只有哪些共同因素之間有相關、哪些觀察變數為哪些共同因素所影響、哪一個觀察變數有唯一性因素、哪幾對唯一性因素之間有相關存在等限制。
圖1-2 線上學習市場行銷組合模型
(二)CFA 模式建構過程
Model 1 為單一因素的一階驗證性因素模型。此模型根據行銷組合和線上學習系統準則所建立的測量項目,包含系統品質、教材內容、課程特色、系統服務、促銷活動、廣告、人員推廣、學分費折扣、收費合理、不滿意可退費、便利性、教育單位合作、入口網站連結、業者聲譽口碑、業者辦學經驗、專業性和行業別等 17 個指標變數。由於指標變數皆從行銷組合和線上學習系統準則的測量尺度(scale) 而來,因此,隱含著單一因素的一階驗證性因素模型是一個基本資料結構的可能模型。
Model 2 為一階的驗證性因素( 潛在變數間不存在相關) 模型,其模型由指標變數轉至潛在變數間不存在相關( 直交) 的一階因素模型,此模型包含產品、推廣、價格、通路和業者形象等五個潛在變數和17 個指標變數。由於此模型與使用直交轉軸所萃取出5 個因素相同,並且由於萃取因素採直交轉軸法,也因此假定其潛在變數間不存在相關。因此,一階的驗證性因素( 潛在變數間不存在相關) 模型已被考慮是一個基本資料結構的可能模型,並且此模型也提供了檢測測量變數間無相關的模型與測量變數間有相關性的模型其配適度比較的情形(Doll et al., 1995)。
Model 3 為一階且有相關的驗證性因素( 潛在變數間有相關) 模型,為驗證性因素分析的一般模型,此模型可稱為驗證性因素分析的多因素模型(multifactor model)(Joreskog & Sorbom, 1989),也是驗證性因素分析最常見的型式。此模型包含產品、推廣、價格、通路和業者形象等五個潛在變數和17 個指標變數,且潛在變數間彼此有相關,用於驗證觀察變數是否可由已知潛在變數所組成(Doll et al., 1995)。
在此模型的潛在變數雖是由直交轉軸法所萃取而來的,但潛在變數彼此間並無強制需無相關,若模型存有大量的共同變異指標變數,原則上指標變數間可能存有相關。雖然此模型無法明確的被提出,但由於指標變數皆從行銷組合和線上學習系統準則的測量尺度而來,並且行銷組合變數是相互關連,交互影響的,因此,一階且有相關的驗證性因素( 潛在變數間有相關) 模型不排除是一個可能模型。
Model 4 為二階驗證性因素模型。此模型由一階的產品、推廣、價格、通路和業者形象等五個潛在變數和一個二階因素( 行銷組合) 所組合,由17 個指標變數衡量。假設此模型在一階驗證性因素時潛在變數間的測量誤差存在高相關,藉由抽取更高階的共同因素,以同時解決潛在變數的測量誤差與潛在變數間高相關的問題(Doll et al., 1995)。
二階驗驗性因素模型有二個特性:
1.二階因素屬外層構面,一階因素是內層構面,進一步來說二階因素是「根據」一階因素而來。由於一階驗證性因素分析的模型( 如Moldel 3) 有時無法解決因素分析的問題,如在品牌行銷策略中,Boonghee et al.,(2000) 發現分屬於不同品牌(Brand) 的測量指標之測量誤差間有相關存在,假如能以二階(second-order) 因素分析來解此一問題,則可以大大減低測量誤差之間的相關,即假定在一階因素的「認知品質」、「品牌忠誠度」和「品牌聯想」之上存有「品牌權益(Brand Equity)」因素。除了測量誤差的問題以外,有時研究者也發現,在多因素驗證性因素分析之中各因素之間的相關很高,解決共同因素之間高相關的一個方法就是抽取更高階的共同因素(Anderson & Gerbing,1988),在這些情形下,就必須使用到二階的驗證性因素分析(second-orderconfirmatory factor analysis)( 如Model 4)。
2.二階因素是沒有指標,亦即潛在變數(latent variables) 是無法直接測量的,必須藉由指標變數來間接推測得知。如「品牌權益(Brand Equity)」是一種抽象的潛在變數,它無法被直接觀察得到,因此,必須藉由指標變數「認知品質」、「品牌忠誠度」和「品牌聯想」來間接推論才能得知(Boonghee et al.,2000)。經由二階驗證性因素分析的特性,在Model 4 可以看出,第二層的共同因素「行銷組合」對觀察變數並無存在直接效果,而第一層各共同因素「產品、價格、通路、推廣、形象」之間也沒有直接關聯,因此,第一層之間的相關必須透過第二層共同因素來解釋。
若想以Stata sem/gsem 來驗證選擇模型和測試每個理論模型的配適度。首先,在邏輯、理論和先前研究的基礎上,針對上述四種可能的因素結構選擇模型,使用多種模型配適度指標(GFI, AGFI, RMSEA) 來評估模型資料配適,而以最適模型進行因素和變數的信度和效度檢驗。在進行資料分析工作時,以內定之最大概似估計法(Maximum Likelihood Estimation, MLE) 估計參數,利用MLE時資料必須符合多變量常態分配(multivariate normality) 的假定,樣本數不能太小,最少應要求在 100 至 150 之間才適合使用(Ding et al., 1995)。
(三) 完整(full) 結構模型
完整結構模型= 測量模型 + 結構模型
圖1-3 顧客滿意度之SEM示意圖
在模型中包括兩類變數:一類為觀測變數,是可以通過訪談或其他方式調查得到的,用長方形表示;一類為結構變數,是無法直接外顯的變數,又稱為潛在變數,用橢圓形表示。
各變數之間均存在一定的關係,這種關係是可以計算的。計算出來的值就叫參數,參數值的大小,意味著該指標對滿意度的影響的大小,都是直接決定顧客購買與否的重要因素。如果能科學地測算出參數值,就可以找出影響顧客滿意度的關鍵績效因素,引導企業進行完善或者改進,達到快速提升顧客滿意度的目的。
三、SEM 類型
線性SEM 類型,常見包括:
1. 建構新的因果模型、路徑分析(Causal modeling or path analysis)。
2. 驗證性因素分析(Confirmatory factor analysis, CFA)。
3. 二階因素分析(Second order factor analysis)。
4. 共變數結構模型(Covariance structure models)。
5. 相關結構模型(Correlation structure models)。
除此之外,Stata 尚提供功能更強大的「廣義SEM」讓你做往昔SEM 無法做到的特殊迴歸分析,故本書特別在最一章「Generalized SEM 之分析」來介紹它。Generalized SEM 之特殊迴歸,類型包括:
1. 測量模型(generalized response)。
2. 單因子measurement model (generalized response)。
3. 雙因子measurement model:Likert 量表vs. 測驗卷的組合。
4. 雙層次測量模型( 廣義反應變數)。
5. Multilevel mediation models。
6. 三層次模型(generalized response)。
7. Logistic 迴歸。
8. 多類別(multinomial) 反應變數的logit 迴歸。
9. 試題反應理論(Item response theory, IRT)。
10. 次序反應變數之機率迴歸(Ordered probit regression)。
11. 混合模型(Combined models) 之gsem。
12. Heckman Selection 模型。
13. 內生性「處理效果」模型(Endogenous treatment-effect models)。
14. 截取/斷尾迴歸(Tobit regression)。
四、SEM 比多元迴歸(Multiple Regression) 更優
1. 可對外顯之自變數及依變數做控制。
2. 同一時間,可同時分析多個因變量。
3. 可區分變數之間的直接效果、間接效果、總效果。
4. 建構Xs 變數如何透過其它變數來影響Ys 變數。
5. 可檢定三個( 以上) 更複雜縱向數據的模型。
6. 建構模型更具彈性(more flexible modeling)。
7. 使用CFA 可校正測量誤差(CFA to correct for measurement error)。結構方程模型(SEM) 是用於建構和測試的統計模型,也是因果模型的統計技術。驗證性因素分析,路徑分析和迴歸,都僅是SEM 的特殊情況下的混合技術。SEM 旨在鼓勵驗證及建模,而不是探索。因此,它適合於理論檢定(theory testing), 而不是理論的發展(theory development)。通常你先提一個假設( 表示你的研究型態,並以測量模型來操作化定義你研究的構念(operationalises the constructs),最後測試模型的適配度。等你決定所提的某理論或其他可驗證模型之後,SEM 即可估計該模型的自由參數(free parameters) 值。通常你最初提出的假設,都需要微調該模型證據。但SEM鮮少有人拿它來做純粹的探索研究。SEM 的長處是建構模型成為潛在變數(latent variables),所謂潛在就不是直接可觀測的變數,但卻是從觀測到的變數來估算的。這樣的模型可明確捕捉到「測量模型之不可靠性(unreliability of measurement in the model)」、並根據理論來找出潛在變數之間的因果關係。
8. 利用Bulider 圖形介面來建模非常容易(Attractive graphical modeling interface)。
9. 可分別檢定「整體vs. 個別」係數的適配品質(Testing models overall vs. individual coefficients)。
五、SEM 的主要優勢
1. 可同步檢定多個依變數之模型(Test models with multiple dependent variables)。
2. 可處理中介變數之之模型(Ability to model mediating variables)。
3. 能求得誤差項的模型(Ability to model error terms)。
4. 可依據不同群組,分別求其迴歸係數(Test coefficients across multiple betweensubjects groups)。
5. sem 指令亦能處理下列難處理的資料(Ability to handle difficult data):
(1) 自我相關誤差之縱貫資料(Longitudinal with auto-correlated error)。
(2) 多層次(e.g. 個人層vs. 團體層) 資料(Multi-level data)。
(3) 非常態資料(Non-normal data)。gsem 更能處理8 類連續分配vs. 間斷分配的反應變數之聯立迴歸式。
(4) 殘缺資料(Incomplete data)。
6. SEM 具有理論的先驗性(priori),讓你執行驗證性分析:
(1) 將理論融入到研究模型及研究假設(hypotheses)。
(2) 迫使研究者思考他需要哪些必要的資訊,包括:
(a) 哪些外生變數(Exogenous) 影響內生變數(which variables affect others)。SEM 係根據多個變數間之邏輯關係,建立高適配度之統計模型。
(b) SEM 可算出中介變數的直接vs. 間接效果(directionality of effect)。
圖1-4 外生變數預測內生變數之示意圖
圖1-5 外生變數影響內生變數之示意圖
7. SEM 可以立體、多層次(multi-level) 的展現驅動力分析。這種多層次的因果關係更加符合真實的人類思維形式,這點是傳統迴歸分析無法做到的。SEM根據不同屬性的抽象程度將屬性分成多層進行分析。
8. SEM 分析可以將無法直接測量的屬性納入分析,這樣就可以將數據分析的範圍加大,尤其適合一些比較抽象的歸納性的屬性,比方說消費者忠誠度。
9. SEM 分析可以將各屬性之間的因果關係量化,使它們能在同一個層面進行對比,同時也可以使用同一個模型對不同層級市場或各競爭對手進行比較。
六、SEM法的共享特性(Shared Characteristics of SEM Methods)
1. SEM 可區別觀察變數及潛在變數之間的差異。
2. SEM 的基本統計係以共變數為基礎。
3. SEM 並不局限於非實驗數據,實驗數據亦可分析。甚至Likert 5 點計分量表及可混搭測驗成績( 雙參數之試題反應理論) 一同納入同一gsem 模型。
4. 許多傳統統計分析(e.g. 似不相關迴歸、ANOVA、多元迴歸、信度分析⋯),都是SEM 的特例。
5. 它不像傳統標準技術那麼重視個別統計量(e.g. 迴歸係數t 檢定) 之顯著性,SEM 反而較重視模型的整體適配度。