⊙涵蓋單變項與多變項統計方法的效果值指標,適合作為應用統計學課程主要教材及量化研究課程輔助教材。
⊙為研究者進行整合分析的必備查考寶典。
⊙隨書附贈多套Excel VBA & VB程式(如:Cohen’s d增益集、非中心性信賴區間估計增益集、GES對比分析估計軟體、集群分析效果值估計軟體),以便利效果值的估計。
本書主要目的有二:
一、探討及推廣各類效果值指標的估計與選用,以彌補統計顯著性考驗之不足。
二、建構橫跨各類效果值間的橋接關係,使其具有可比較性,便於進行整合分析。
作者簡介:
李茂能
現職
國立嘉義大學名譽教授、兼任教授
學歷
美國喬治亞大學博士
經歷
國立嘉義大學教授
章節試閱
Chapter01 效果值簡介
一、效果值的意義與重要性
效果值(effect size),簡單地說,就是實驗效果大小或雙變項關係強度的量化指標,其值愈大,常代表著組平均數間之差異愈大,或雙變項間之關係愈強,前者來自因果性實驗研究,後者來自觀察性相關研究。效果值是描述統計,而p值(p-value)是推論統計,兩者之影響因素不同,效果值不易受樣本大小影響,而p值易受樣本大小影響。效果值反映了(1) 變項相關性的強弱、(2) 變項差異性的多寡、(3) 勝算比、(4) 迴歸係數及(5) 適配度的大小,最常見的效果值就是組平均數差異或標準化平均數差異值(standardized mean difference)。過去量化研究中,接納或拒絕虛無假設的顯著性考驗模式(Fisher 氏的significance testing 或Neyman-Pearson 氏的hypothesis testing),似乎已成為量化研究不可或缺的下決策工具。不過,此種二分法之顯著性考驗,並無法回答差異有多大或關係有多強(Gliner, Vaske, & Morgan, 2001),因而研究者常只關心虛無假設的考驗結果或p 值是否小於既定的α,而忽略了效果值的分析(Rojewski, 1999;Thompson, 1996, 1998; 李茂能,2010)。此外,許多研究者錯把p值當作效果值大小的指標,例如:他們常認為p < .05比p < .01來得不重要。因此,常導致把虛無假設考驗的結果,視為研究價值的唯一指標及誤把p值大小看成效果值大小的迷思。
一個研究達到統計的既定顯著水準,可能係樣本過大所致,只要樣本過大,微小的處理效果,即使沒有臨床上的應用價值,也會推翻虛無假設;反之,未達到統計的既定顯著水準,可能係樣本過小所致,很大的處理效果也可能無法推翻虛無假設,亦即重要的效果卻出現不顯著之統計結論(李茂能,2002)。
表1-1 SPSS摘要表之依變項為最高受教年限,自變項為性別。t考驗結果顯示男女受教育的年限差為.602,達到.05的顯著水準(p = .000)。如果從該筆資料(N = 1509),隨機抽樣12%的受試者,其分析結果如表1-2之SPSS 摘要表所示,t 考驗結果顯示男女受教育的年限差為.778,未達到.05的顯著水準(p=.072)。由此觀之,p值乃是樣本大小的函數。相同的研究問題會因樣本大小的顯著差異,使得統計上的顯著結果變成不顯著,而導致重要效果的研究結論變成不重要。
由前述實例也凸顯出,研究之前樣本規劃的重要性,如果樣本規劃不可行,不管結果有無達到統計上的既定顯著水準,研究者均需報告效果值,以利評估最後結論的有效性。因此,身為一個量化的研究者不僅要問資料分析結果在統計上的顯著性與否,尚需考慮本質上其效果值有多大,才能正確評估其在臨床上或應用上的價值。統計上的顯著性,並不一定等於實務上具有應用價值。為彌補顯著性考驗之缺失(p值設計上的缺陷),不少國際期刊已要求作者報告效果值,Grisson & Kim(2012)及Warne(2017)就指出很多不同領域的學術團體或期刊已要求作者提供效果值資訊;例如:AERA、British Psychological Society、APA、Communication Monographs、Educational and Psychological Measurement & Human Communication Research 等。
二、效果值的類別
基本上,效果值可分為兩類:(1)仍保留原變項測量單位的未標準化效果值與(2)去除測量單位的標準化效果值(standardized effect sizes)。未標準化效果值的優點是容易計算、不受變異量之影響及保留更多資料情境的資訊。未標準化效果值如已具跨研究之可比較性(例如:具有共同測量單位的度、量、衡與貨幣),這些測量單位為眾人所熟悉,就不需再進行標準化了。有些效果值本身已無測量單位(unit-free of measurement),如Pearson 積差相關(本身即為標準化的指標)、勝算比(odds ratio, OR)、相對風險(relative risk, RR)也不需再進行標準化,可以直接進行研究間效果值的比較與整合。有些效果值指標(如樣本平均數間差異量)係來自於不同測量量尺或植基於武斷的測量單位,若想在研究間具有可比較性與可整合性,就須經標準化過程(目的使其具有共同量尺),以去除特定量尺的依賴性。經標準化的分數才具有無測量單位的特性,方能進行跨研究的比較與整合分析。例如:測量相同英文能力的IELTS & TOEFL 的成績,因使用不同量尺根本無法直接比較兩者分數的高低,如欲直接進行比較,需將原始分數轉換成常態化標準分數。傳統上,最常見的標準化方法是轉換成z分數或t分數。
如果依照估計參數的來源,效果值可分為潛在效果值(latent effect size)與樣本效果值(sample effect size)。利用HLM 分析之母群參數(如μ & σ),計算而得的效果值稱為母群效果值;利用SEM 分析所得的母群參數(或經信度偏差、全距減縮之校正過),估計出來的效果值也稱為母群效果值或潛在效果值,常以希臘字母δ表示之;而利用樣本統計量(如x & sd)計算而得的效果值,稱為樣本效果值(Enzmann, 2015)。其實,潛在效果估計值因考慮到測量誤差,通常比樣本效果估計值來得高(Leonhart, Wirtz, & Bengel, 2008)。
Chapter01 效果值簡介
一、效果值的意義與重要性
效果值(effect size),簡單地說,就是實驗效果大小或雙變項關係強度的量化指標,其值愈大,常代表著組平均數間之差異愈大,或雙變項間之關係愈強,前者來自因果性實驗研究,後者來自觀察性相關研究。效果值是描述統計,而p值(p-value)是推論統計,兩者之影響因素不同,效果值不易受樣本大小影響,而p值易受樣本大小影響。效果值反映了(1) 變項相關性的強弱、(2) 變項差異性的多寡、(3) 勝算比、(4) 迴歸係數及(5) 適配度的大小,最常見的效果值就是組平均數差異或標準化平均數...
作者序
本書主要目的在於探討各類效果值指標的估計、選用與解釋。效果值(effect size),簡單地說,就是實驗效果大小或雙變項關係強度的量化指標,其值愈大,常代表著組平均數間之差異愈大或雙變項間之關係愈強。由於研究者對於統計顯著性考驗的運用邏輯存在著一些迷思或誤解,過去許多研究報告常忽略了效果值大小的評估,僅依p值(p-value)的大小就下結論,易導致結論的偏差。
為何效果值與p值同等重要?假如事先沒有適切的樣本規劃,研究者僅利用p值進行統計假設考驗,可能導致不當的結論。主因在於p值易受樣本大小的影響,只要樣本過大,通常會推翻虛無假設;反之,樣本過小,通常很難推翻它。反觀效果值不僅可用來評估臨床上的應用價值,而且不會受樣本大小的影響,足以彌補統計顯著性考驗設計上的不足。統計上的顯著性並不一定等於實務上的有用性,因此近幾年來學術研究期刊逐漸要求作者同時報告p值與效果值。
令人困擾的是效果值的定義或類型,會因研究設計、研究問題與統計方法而改變,假如研究問題的焦點在於組間差異,那麼效果值的定義在於組間平均數的平均差異,需要獨立樣本的研究設計;假如研究問題的焦點在於個體的改變量,那麼效果值的定義在於平均改變量,需要重複量數的研究設計。此外,有時同一種統計方法(如多元迴歸分析)卻存在著許多不同形態的效果值統計量(如未標準化迴歸係數、標準化迴歸係數、淨相關、部分相關),何者為佳,研究者亦常生困惑。由此觀之,欲正確估計與選用效果值統計量,需先釐清效果值與研究問題、研究設計及統計方法間的複雜關係。
本書另一個目的在於探究各類效果值間的轉換,使其具有可比較性(comparable),以利整合分析(meta-analysis)。效果值估計是整合分析的核心工作,除了需知道如何正確估計之外,尚須注意效果值可能衍生自不同統計方法(如單變項ANOVA 考驗、迴歸分析、多變項分析或HLM、GMA分析),為了使效果值能跨不同統計方法而具有可比較性,必須透過適當公式與對比分析的橋接(參見內文第12章圖12-18~圖12-20),使其具有共同量尺(如全部轉換成Cohen’s d值或Pearson’s r值),才能進行整合分析。
本書涵蓋單變項與多變項統計方法的效果值指標,從t考驗、ANOVA到MANOVA,從Regression、GLM到SEM或HLM應有盡有,不僅可作為整合分析研究者查考的寶典,也適合於應用統計學課程之主要教材、一般量化研究課程之輔助教材。本書致力於效果值及其信賴區間公式的推演,並透過應用軟體輔以應用實例,以利研究者能正確估計、描述與解釋效果值。本書經多年之腦力激盪,終能順利完成。特別感謝恩師Dr. Olejnik&林清山教授的教誨。書中引介適用於跨研究比較的通用指標η2G,就是來自Dr. Olejnik&Algina的創見,而本書內有一些應用實例的數據,係引自林清山教授的大作:《心理與教育統計學》與《多變項分析統計法》,以利教學上的結合。此外,為了減輕研究者計算效果值及其變異量的繁重負擔,書中除了提供筆者新開發的軟體之外,也推薦了一些網路計算器,以便利效果值的估計。筆者秉持知識傳承的使命感,日夜戮力以赴力求完善,內容倘有疏漏之處,尚請同好不吝指教。
李茂能
2022年夏於嘉義
本書主要目的在於探討各類效果值指標的估計、選用與解釋。效果值(effect size),簡單地說,就是實驗效果大小或雙變項關係強度的量化指標,其值愈大,常代表著組平均數間之差異愈大或雙變項間之關係愈強。由於研究者對於統計顯著性考驗的運用邏輯存在著一些迷思或誤解,過去許多研究報告常忽略了效果值大小的評估,僅依p值(p-value)的大小就下結論,易導致結論的偏差。
為何效果值與p值同等重要?假如事先沒有適切的樣本規劃,研究者僅利用p值進行統計假設考驗,可能導致不當的結論。主因在於p值易受樣本大小的影響,只要樣本...
目錄
Chapter01 效果值簡介
一、效果值的意義與重要性
二、效果值的類別
三、何時效果值不須標準化
四、效果值大小的解釋
五、效果值的用途及其信賴區間
六、效果值估計的多元面貌與整合分析
Chapter02 類別性變項的效果值分析
一、風險、勝算的定義與解釋
二、OR、RR使用時機
三、OR、RR & RD標準誤的計算
四、實用的效果值計算器
五、效果值指標φ & V的定義與解釋
Chapter03 t考驗與相關性指標的效果值分析
一、Cohen’s d值的定義
二、對比分析的計算流程
三、Cohen’s d值與t考驗的關係
四、Hedges & Olkin(1985)之抽樣誤差校正公式
五、由t 考驗值推估併組標準差
六、相關係數效果值分析
七、併組標準差的不同估計方法
八、筆者研發的Cohen’s d EXCEL增益集
Chapter04 單因子ANOVA的效果值分析
一、變異數分析效果值指標
二、通用η2G、ω2G
三、單因子獨立樣本
四、單因子相依樣本
五、單因子ANCOVA的效果值分析
六、ANOVA分析中效果值指標的選擇
七、非對稱性信賴區間的建立
Chapter05 雙因子ANOVA的效果值分析
一、獨立樣本
二、重複量數
三、混合設計模式
四、變異數分析的對比效果值分析
五、η2G對比效果值與Cohen’s d值或r值的互換
Chapter06 通用η2G對比效果值分析
一、單因子事後考驗的效果值估計
二、雙因子事後考驗的效果值估計
三、通用η2G計算器(GES)之簡介
四、GES操作表單與研究設計
Chapter07 多變項分析的效果值分析
一、常用效果值指標
二、單因子多變項分析
三、雙因子多變項分析
四、混合模式MANOVA設計
Chapter08 多元迴歸分析與多層次分析的效果值分析
一、多元迴歸效果值分析
二、多層次模式效果值分析
Chapter09 隨機集群分析的效果值分析(上)
一、三種群聚內與群聚間變異量的估計
二、集群效果值估計的類型與定義
三、集群分析的兩大研究設計
四、集群效果值的估計
五、集群效果值虛胖的其他三種簡易校正方法
Chapter10 隨機集群分析的效果值分析(下)
一、部分集群效果值標準差的選擇
二、三種樣本變異量的估計
三、母群效果值
四、樣本效果值
五、部分集群設計的資料分析方法
六、母群效果值估計之實例示範
七、樣本效果值估計之實例示範
八、集群隔宿設計下Cohen’s dt及dw與Hedges’ gt及gw間之轉換
九、各類母群效果值指標間之互換
十、應用軟體
Chapter11 SEM分析與成長模式分析的效果值分析
一、SEM分析的效果值分析
二、潛在特質前、後測差異分析:重複量數設計
三、成長模式效果值分析
Chapter12 網路效果值計算器簡介與各類效果值間之轉換
一、網路效果值計算器
二、各類效果值間的轉換
三、ESCAL線上效果值轉換表單
四、CMA的效果值轉換表單
五、筆者研發的ESC效果值轉換器
附錄一 筆者研發的效果值分析軟體清單
附錄二 如何解決無法開啟EXCEL增益集
中英文參考書目
中英文索引
Chapter01 效果值簡介
一、效果值的意義與重要性
二、效果值的類別
三、何時效果值不須標準化
四、效果值大小的解釋
五、效果值的用途及其信賴區間
六、效果值估計的多元面貌與整合分析
Chapter02 類別性變項的效果值分析
一、風險、勝算的定義與解釋
二、OR、RR使用時機
三、OR、RR & RD標準誤的計算
四、實用的效果值計算器
五、效果值指標φ & V的定義與解釋
Chapter03 t考驗與相關性指標的效果值分析
一、Cohen’s d值的定義
二、對比分析的計算流程
三、Cohen’s d值與t考驗的關係
四、Hedges & Olkin(1985)之抽樣...