人類社會的各類組織由個體組成,隨著時間遞延而產生各種行動,因此社會科學研究無法逃脫「空間」與「時間」兩個基本元素。本書基於此一體認,利用多層次模式(MLM)來處理社會科學研究當中的空間與時間嵌套結構,並進一步導入結構方程模式(SEM)來分析多層次與縱貫資料,不僅兼顧兩大社會科學新興典範,也首度採用Mplus 8來進行範例分析,使讀者不僅能懂能做,擁有躋身國際學術舞臺的量化工具。
本書作者長年投入量化方法專書寫作,擅長範例分析,筆風平實易懂,體例結構分明,導入高階觀念時循序漸進,講求實作經驗與實例基礎。全書分成五篇十五章,第一篇導論,第二篇從迴歸到多層次模式,第三篇縱貫性多層次模式,第四篇縱貫性結構方程模式,第五篇中介與調節,完整涵蓋以迴歸為基礎的高階方法技術,各章皆有Mplus範例解析,附錄提供完整Mplus 8介紹,是入門高階統計模式的必備用書。
※循序說明迴歸分析、多層次模式、縱貫資料分析的原理與應用
※導入最新Mplus8軟體進行實例示範,提供分析語法與結果說明
※首先將中介與調節概念擴展至多層次與縱貫性中介與調節分析
※以交互嵌套與SEM取向進行年齡、時代、世代效果的APC分析
※引述古典與最新文獻,掌握技術沿革發展,完備方法知識體系
※適用於管理、心理、教育、社會、醫護、公衛、觀光休閒及體育運動等學術領域。
作者簡介:
邱皓政
現任:國立臺灣師範大學管理學院 教授
國立臺灣師範大學校務研究辦公室 主任
學歷:美國南加州大學心理計量學博士
經歷:美國加州大學洛杉磯分校神經醫學研究中心 統計分析師
國立臺灣師範大學副總務長
天主教輔仁大學心理學系 副教授
世新大學社會心理學系 副教授
教育部訓育委員會 專案研究員
臺灣統計方法學學會 理事長
中國測驗學會 常務理事
臺灣心理學會 秘書長
華南師範大學 客座教授
北京中國科學院 訪問教授
著作:《量化研究與統計分析》(五南)
《統計學:原理與應用》(五南)
《潛在類別模式:原理與技術》(五南)
《多層次模型分析導論》(譯)(五南)
《階層線性模式》(審訂)(五南)
《調查研究方法》(審訂)(五南)
《量表編製:理論與應用》(審訂)(五南)
章節試閱
Chapter 2 變數與資料格式
2.1 緒論
統計的基本素材是數據(data),數據來自測量(measurement)。例如學者發放問卷向「受測者」進行調查、操作儀器蒐集「受試者」的實驗資料、便利商店收銀台紀錄「消費者」的消費資訊、「學生」參加會考、護士拿血壓計測量「病患」的血壓、教育部調查各「學校」的升學率、保險公司統計各業務「團隊」的業績、徵信公司蒐集「廠商」的經營績效等等,都是在進行測量。
基本上,測量是運用一套符號系統去描述被觀察對象的某個屬性的過程,其關鍵在進行觀察(observation),被觀察對象可能是個體(例如受測者、受試者、學生、消費者、病患),也可能是整體(例如學校、廠商、團隊)。所得到的資料型態取決於量尺(scale),最後測量的結果則以變數(variable)的形式呈現。
由於本書的內容涉及帶有嵌套結構的橫斷面與縱貫面資料,因此變數的型態與資料格式也就相對複雜。同時也更容易受到遺漏值的影響,本章將逐一介紹單層次、多層次與縱貫資料的基本數據格式,以及遺漏處理的方法。
2.2 變數與資料
2.2.1 測量尺度與變數
統計學者Stevens(1951)依不同測量方法的數學特性,將測量尺度分成四種類型:名義、順序、等距和比率。四種尺度的差異取決於區辨性(被觀察者相同或不同,亦即 = 或≠)、次序性(被觀察者有無前後次序,亦即> 或<)、單位距離(被觀察者差異有無評估單位,亦即+ 或-)與零點特性(被觀察者強度差異有無絕對零點,亦即× 或÷),如表2.1 所示。
名義尺度(nominal scale)的測量,係針對被觀察者的某一現象或特質,評估所屬類型種類,並賦予一個特定的數值。由名義尺度所測量得到的變數,稱為名義變數。例如性別(男、女)、種族(本省、外省、原住民)、婚姻狀態(未婚、已婚、離婚、喪偶等)、就讀學校等等,是一種具有分類功能的測量方式。
其次,順序尺度(ordinal scale)的測量,指對於被觀察者的某一現象的測量內容,除了具有分類意義外,各名義類別間存在特定的大小順序關係。以順序尺度測量得到的變數稱為順序變數,如大學教授層級(教授、副教授、助理教授、講師)、教育程度(研究所以上、大專、高中職、國中、國小及以下)、社經地位(高、中、低)等,皆屬以順序尺度所測得之順序變數。
等距尺度(或稱間距尺度)(interval scale)的測量,係針對被觀察者的某一現象或特質,依某特定的單位,測定程度上的特性。等距尺度測量得到的數值,除了具有分類、順序意義外,數值大小反映了兩個被觀察者的差距或相對距離。以等距尺度測量得到的變數,稱為等距變數,其數值兼具分類、次序和差距的意義。如以溫度計量出的「溫度」、以考試決定的「學業成績」、以智力測驗測得的「智商」等。最後,當一個測量尺度使用了特定單位,同時又具有一個絕對零點,稱為比率尺度(ratio scale)。例如身高(公分)、體重(公斤)、工作所得(元)、年齡(歲)、住院日數、受教育年數等等變數,都是以比率尺度來測量得到的比率變數。
由於名義與次序測量並未使用特定度量工具或特定單位,測量數值只能反映測量對象的性質或屬性差異,數值所代表的意義為質性的概念,因此被稱為質性變數(qualitative variable)或類別變數(categorical variable),相對之下,等距與比率尺度的測量使用特定度量工具且有具體的測量單位,使得每個數值能夠反映強弱與多寡程度,因此被稱為量化變數(quantitative variable)或連續變數(continuous variable)。在統計學領域,大多數的分析方法都可以同時處理類
別與連續變數,但有些分析方法特別是針對類別變數所設計,例如卡方檢定與對數線性模式,甚至有專書出版(例如Agresti, 2002, 2007; Azen & Walker, 2011, 0Simonoff, 2003)。有些方法特別適用於連續變數的分析,例如本書所關注的線性迴歸、多層次模式與結構方程模式皆是以連續變數的分析應用為主,迴歸分析最經典的著作莫過於Cohen, Cohen, Aiken(2003)所合著的“Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences” 與Pedhazur(1997)Multiple Regression in Behavioral Research,是本書預先修習的基礎書目。
2.2.2 原始資料與虛擬化
經過有系統的測量活動之後即可獲得資料,如圖2.1 的Excel 表單當中的各項資訊。由於圖2.1 當中的資料尚未經過任何處理,因此稱為原始資料(raw data),各欄位中的資料有些是數字,有些是文字,甚至有些是特殊格式(例如生日)。這種原始資料無法進行統計分析,必須加以轉換成類似圖2.2 的數值型資料格式,而將文字資料轉換成數值資料的編碼過程必須記載在編碼簿(codebook)以利查考。
由圖2.2 可以看出,每個欄位皆賦予一個英文單詞作為變數名稱,每一個橫列表示一筆觀察資料,亦即個別的受測者。通常為了便於運算,有時研究者會將數據進行轉換,例如薪資變數(wage)在原始資料的單位為「元」,但是在圖2.2
當中則為帶有兩位小數的「千元」。
Chapter 2 變數與資料格式
2.1 緒論
統計的基本素材是數據(data),數據來自測量(measurement)。例如學者發放問卷向「受測者」進行調查、操作儀器蒐集「受試者」的實驗資料、便利商店收銀台紀錄「消費者」的消費資訊、「學生」參加會考、護士拿血壓計測量「病患」的血壓、教育部調查各「學校」的升學率、保險公司統計各業務「團隊」的業績、徵信公司蒐集「廠商」的經營績效等等,都是在進行測量。
基本上,測量是運用一套符號系統去描述被觀察對象的某個屬性的過程,其關鍵在進行觀察(observation),被觀察對象可能是個體(例如受...
推薦序
2017 年春天,邱皓政教授邀請我為其新書「多層次模式與縱貫資料分析:Mplus8 解析應用」寫序,我欣然同意,也藉此機會先睹為快。我跟皓政教授相識於20 多年前的一場學術會議,當時我們都是剛剛取得博士學位。他極力推銷結構方程模式( structural equation modelling; SEM),而我則是口沫橫飛大談Rasch 模式和試題反應理論(item response theory; IRT)。當時我們不知道原來這兩種不同的學派,其實有高度的重疊,新版的MPlus 可以進行SEM 與IRT 分析就是最好的例證。多年來我見證了皓政教授在統計模式的學術發展與知識轉移
的貢獻,讓我十分佩服。
本書有兩大重點,一是多層次結構的資料分析。如Program for International Student Assessment(PISA),Trends in International Mathematics and Science Study (TIMSS)等國際大型教育資料庫,資料有兩層結構:學校與學生,學生是嵌套在學校內。另一為縱貫資料分析。代表性資料就是對受試者進行多次的重複測量,如定期或不定期測量受試者的體重、病情、能力等。這類的資料也有兩層結構:受試者和重複測量,重複測量是嵌套在受試者內。由於縱貫資料具有多層次
結構特性,因此縱貫資料分析也可以歸類為多層次模式分析。不過由於縱貫資料有其特殊的議題(如成長軌跡的描述),自有其獨立存在的必要,這也是本書的做法。
PISA 和TIMSS 在抽樣時,首先隨機抽取一些學校(如150 所),然後在校內隨機抽取一些學生(如40 人),蒐集學生的結果變項(如在數學考試上的分的教科書是Bryk 與Raudenbush(1992)的Hierarchical Linear Models in Social
and Behavioral Research: Applications and Data Analysis Methods。此書的結果變項著重在連續變項,後來該書於2002 年再版,增加了類別的結果變項,大幅提高其實用性。這兩版書搭配HLM 軟體,方便操作。後來我於2006 年至柏克萊分校訪問,旁聽 Rabe-Hesketh 教授一門關於多層次模式的課,當時使用的教科書是Skrondal 與 Rabe-Hesketh(2004)的Generalized Latent Variable Modeling: Multilevel, Longitudinal and Structural Equation Models,搭配的軟體是
GLLAMM。由於我的研究興趣在Rasch 模式和IRT,結果變項是類別而非連續變項,因此對如何在多層次模式裡進行IRT 分析特別感到興趣。新版的HLM、GLLAMM、MPlus 都可以分析類別結果變項,大幅增加了多層次模式在社會科學的應用。
我曾在研究所開授過多層次模式分析,使用過上述兩本書。在軟體操作上我要求學生使用HLM 或GLLAMM。雖然這兩個軟體還算容易上手,但麻煩的是這兩個軟體基本上是為多層次模式量身打造,無法進行其他常見的統計分析,如傳統的多變量分析。學生常苦於因為學習一種新的統計方法,就要學習一種新的軟體。如果有通用的軟體可以進行各種分析,還能讓使用者容易上手,將可大幅增加學習效果和促進應用。MPlus 就是這樣的軟體,它可以用來進行簡單的分析,如變異數分析、迴歸分析,也可以進行多變量分析,如因素分析、結構方程模式,還可以進行複雜的分析,如多層次模式、IRT、潛在類別模式等。學會了MPlus 就可以應用該軟體所提供的強大功能,進行各式各樣的統計分析,甚至可以自行研修MPlus 所提供更為複雜的分析方法和進行模擬研究。
我跟MPlus 的作者B. Muthen 教授有數面之緣。2011 年我主辦心理計量學會的年會,當時B. Muthen 教授獲頒該學會的終身成就獎,並發表演說。後來我邀請他於2012 年在本校(香港教育大學)舉行三天的MPlus 工作坊,免費入場,吸引數百位學者、實務工作者、研究生參加。MPlus 的應用越來越廣大,多層次模式和縱貫模式也逐漸受到重視,可是缺少一本使用MPlus 進行多層次模式或縱貫模式分析的中文參考書。
皓政教授的這本「多層次模式與縱貫資料分析:Mplus8 解析應用」剛好填補這個需求。它佐以範例、MPlus 指令、與報表,按部就班解釋統計原理和解讀報表,由淺至深、由簡至繁,內容豐富。本書第一篇從資料嵌套特性帶入多層數)和其他的背景變項。由於學校的招生和環境的關係,通常來自同一所學校的同學,在結果變項(如數學程度)的相似度,會遠高於來自不同學校的學生。如此一來,就違反了傳統單層次模式的假設(所有學生來自同一個母群體),造成後續分析的錯誤。同理,在縱貫資料裡,同一個人的重複測量的相似度,會遠高於不同人的測量。解決之道就是根據資料的多層次特性或縱貫特性,正確使用本書所介紹的多層次模式和縱貫模式。
我跟多層次模式與縱貫模式相當有緣,早在我就讀加州大學柏克萊分校博士班期間,我修習由指導教授Mark Wilson 所開授多層次模式的課,當時使用次模式、縱貫模式、SEM 分析方法等的必要性。接著說明多層次、縱貫資料格式,遺漏值處理等。這些都是進行多層次和縱貫模式時會碰到的實務問題。第二篇正式介紹多層次模式與縱貫模式,作者透過傳統的線性迴歸分析,逐步闡述多層次模式,參數的固定或隨機效果,組內相關係數,預測變項平減的策略與效果,模式的比較,脈絡效果,交叉嵌套模式的分析。接著介紹線性與非線性成長的縱貫模式,具有多層次結構的縱貫模式(如學校、學生、重複量測),縱貫模式裡時序資料的平減(平移)以及脈絡效果。第三篇則以SEM 的觀點來處理縱貫資料,主要可分為兩種方式:潛在成長模式與多波次結構方程模式。另外如果重複量測的次數非常多,則成為時間序列,可以使用自我迴歸的做法。第四篇討論如何在多層次和縱貫模式裡,進行研究設計並探討中介和調節的效果。本書最後以統計的寧靜革命作為完結,總括作者多年來在這一領域的心得與反省,擲地有聲,足以當作吾輩的指引。
本書每章適時提供MPlus 範例語法和結果,方便讀者自行照表操課,強化學習效果。本書應該可以滿足讀者的需求,適合當作研究所多層次模式、縱貫模式的教科書或參考書。在此我想藉機薦請皓政教授和其他同行,在這本書的基礎上,繼續撰寫其他進階統計方法的參考書,以饗讀者,以推進社會科學資料分析的品質。
王文中
香港教育大學協理副校長(研究與知識轉移)
心理學系教育與心理測量講座教授
評估研究中心聯席總監
美國教育研究協會會士
2017 年春天,邱皓政教授邀請我為其新書「多層次模式與縱貫資料分析:Mplus8 解析應用」寫序,我欣然同意,也藉此機會先睹為快。我跟皓政教授相識於20 多年前的一場學術會議,當時我們都是剛剛取得博士學位。他極力推銷結構方程模式( structural equation modelling; SEM),而我則是口沫橫飛大談Rasch 模式和試題反應理論(item response theory; IRT)。當時我們不知道原來這兩種不同的學派,其實有高度的重疊,新版的MPlus 可以進行SEM 與IRT 分析就是最好的例證。多年來我見證了皓政教授在統計模式的學術發展與知識轉移
的貢獻,讓我...
作者序
⋯⋯山頂洞人時期,我們的祖先在夜晚圍坐火堆,火光陰影之外迴盪著狼的嚎叫聲,然後有人開始講話,他會講個故事,我們就不會在黑暗中害怕。⋯⋯
電影《天才柏金斯》(Genius)
四月中,再度飛往荷蘭參加Utrecht University 方法與統計學系(Department Methodology & Statistics)舉辦的第十一屆多層次模式研討會,由於大會手冊籌備人員名單當中沒有Dr. Joop Hox 的名字,他在系上網站的頭銜也變成了榮譽
教授(Emeritus Professor),以為見不著這位老友了,結果推開會場大門之後,Dr. Joop Hox 的熟悉身影即出現在眼前,但他已不如往常般需要張羅會場事務,因此我有更多時間和他敘舊家常。他悠悠地告訴我《Multilevel Analysis》一書舊
了,新寫的第三版年底會出版,我告訴他我也有一本新的多層次模式著作正在排版,兩人會心一笑。因為上回為了履行送書承諾特別飛往荷蘭參加多層次模式研討會(那時是第八屆),看來為了這本書,我們還會再見面,他也會很慷慨的再次把我的書擺在展示櫃中,與他和其他學者一系列著作的旁邊。這場景有點像《美麗境界》(A Beautiful Mind)一片中的贈筆情節,普林斯頓大學教授們將自己的鋼筆放在甫獲諾貝爾經濟學獎的John Forbes Nash 身前以示尊崇,因為對於當時的教授而言,鋼筆是他們著述立言的工具,是他們學術生命的一部分,不同的是,我與Dr. Joop Hox 都只是平凡的學者,不曾得到什麼偉大的獎項,但我們所分享的也是彼此學術生命的重要部分,都有相似的心情。
如果說我們兩位是以文會友實不為過,我們身處世界兩端,平時以email 書信往來,各自在研究室以不同語言記述多層次模式的興起與擴展、創新與變革,大多時候得靠著自己摸索學習,耗盡心力,我相信Dr. Joop Hox 也經歷著同樣的歷程。雖然他沒說,我沒講,彼此都明白著述的辛苦,但如果您看到研討會中從世界各地慕名而來的學者專家、後生晚輩,認真聆聽Dr. Joop Hox 的講演與評論,即能明白知識的力量是如此無遠弗屆,文人立言著述絕非無足輕重(trivial),而能帶領我們離開黑暗恐懼。
除了Dr. Joop Hox 這位遠在荷蘭的學術前輩能給我以友輔仁的助益,Mplus軟體的作者Dr. Bengt Muthén 的新書更是直接影響了本書的撰寫。就在去年五月University of Connecticut 舉辦2016 Modern Modeling Methods Conference,早餐時
恰與Dr. Bengt Muthén 與Tihomir Asparouhov 同桌,他熱情地告訴我隔週就要上市的新書《Regression and Mediation Analysis Using Mplus》的內容,並告訴我即將會有新版的Mplus8 上市,會大幅擴充縱貫資料分析應用功能,建議我加強縱
貫模式的相關章節。這就是為何本書書名在「多層次模式」一詞之後增列了「縱貫資料分析」的原委,當天早餐後我缺席了研討會的論文發表,直接回到房間打開電腦,刪除已經寫了一年餘的章節架構,把縱貫分析模式編入大綱,並增加了一整篇(本書第十二至十四章)關於中介與調節分析的內容,也使得本書一舉超過當初規劃的500 頁,加重了成本負擔與閱讀深度,但面對學術的發展與工具的進步,我們只能往前跟上而沒有退路可走。
只是要跟Dr. Bengt Muthén 抱怨的是,一年前他老神在在的跟我說,Mplus8 is coming soon,卻讓我苦等了一整年,直到今年四月底本書完稿送到了出版社排版,我才收到Mplus8 的安裝通知,所幸Mplus8 與Mplus7 的基本介面相差不
遠,主要的演算程序與報表產出則完全相同,我本想向出版社提議取回完稿重新補充Mplus8 的最新應用模式,但是一想到主編大人的無奈眼神就打消念頭,最後只在第一章稍微介紹Mplus8 的最新發展,並在各章做些微修正補充,剩下的就等第二版改版時再說了!
為了趕赴荷蘭研討會,我決意落筆付梓完成本書,因此Joop 成為第一位分享本書成書喜悅的師長。事實上,全程參與本書寫作的林碧芳博士則是本書成書艱辛的見證者,也將是本書未來成為課堂教材實際授課指導的不二人選。在兩年的撰述期間,具有深厚量化方法學養與資料分析經驗的林博士不僅協助範例編纂與Mplus 分析檔案整理,並不時對於本書內容提出挑戰、質疑與建議,使得本書能更臻完善,若將林博士忝列作者實也當之無愧。另外,在本書起步維艱之時,高雄醫學大學護理學院王瑞霞院長特別安排研習活動、提供學術討論舞台讓我試教部分內容,瞭解學員的學習狀況,調整教材深度,為本書能夠順利開展奠定務實基礎,也令我銘記在心。當然,也要感謝居中牽線的好友徐少慧老師,要不是那篇令她困擾的糖尿病患者自主管理追蹤研究,我也不會啟動這本書的寫作計畫。
Thomas Wolfe 在紐約街頭看到失業救濟的乞食隊伍,自責在經濟蕭條的失落世代,自己的作品實在是無足輕重,但在紐約舊公寓的天台上,Max Perkins語重心長道出,人類因為故事、敘說和書寫而脫離狼嚎下的黑暗與恐懼,創造智慧與文明。本書僅是當代研究方法技術的一本學術性專論,在人類知識文明的累積上或能往前多邁一步,但是方法的實踐,則有待各位來完成。如有關於本書的各項建議看法,尚請不吝指教。
邱皓政
謹誌於
台師大管理學院
2017/5/7
⋯⋯山頂洞人時期,我們的祖先在夜晚圍坐火堆,火光陰影之外迴盪著狼的嚎叫聲,然後有人開始講話,他會講個故事,我們就不會在黑暗中害怕。⋯⋯
電影《天才柏金斯》(Genius)
四月中,再度飛往荷蘭參加Utrecht University 方法與統計學系(Department Methodology & Statistics)舉辦的第十一屆多層次模式研討會,由於大會手冊籌備人員名單當中沒有Dr. Joop Hox 的名字,他在系上網站的頭銜也變成了榮譽
教授(Emeritus Professor),以為見不著這位老友了,結果推開會場大門之後,Dr. Joop Hox 的熟悉身影即出現在眼前,但他已不如往常般...
目錄
Chapter1 導 論
Chapter2 變數與資料格式
Chapter3 線性迴歸原理
Chapter4 多層次迴歸模式
Chapter5 MLM 模式發展與評估
Chapter6 脈絡分析與交叉嵌套模式
Chapter7 多層次縱貫模式
Chapter8 縱貫脈絡模式與APC 分析
Chapter9 潛在成長模式
Chapter10 潛在成長模式設定議題
Chapter11 自我迴歸與狀態變動模式
Chapter12 中介與調節效果分析
Chapter13 多層次中介與調節
Chapter14 縱貫式中介與調節
Chapter15 結語:統計的寧靜革命
附錄A:Mplus 簡介與語法功能
附錄B:參數符號
Chapter1 導 論
Chapter2 變數與資料格式
Chapter3 線性迴歸原理
Chapter4 多層次迴歸模式
Chapter5 MLM 模式發展與評估
Chapter6 脈絡分析與交叉嵌套模式
Chapter7 多層次縱貫模式
Chapter8 縱貫脈絡模式與APC 分析
Chapter9 潛在成長模式
Chapter10 潛在成長模式設定議題
Chapter11 自我迴歸與狀態變動模式
Chapter12 中介與調節效果分析
Chapter13 多層次中介與調節
Chapter14 縱貫式中介與調節
Chapter15 結語:統計的寧靜革命
附錄A:Mplus 簡介與語法功能
附錄B:參數符號