序
本書在 2007 年 8 月初版至今已經三年,感謝學術界的先進以及許多好朋友採用這本書做為社會科學研究方法或是量化研究方法課程的教科書,也感謝許多大學部與研究所同學對於這本書的支持。也因為有了大家的鼓勵,所以讓我有足夠的動力來修改與補充原版本的內容,進而推出這本書的第二版。我也稍微修改了書名,原書名是「社會科學研究方法:如何做好量化研究」,新版本的書名是「社會科學研究方法:打開天窗說量化」。因為我始終認為量化的社會科學研究方法是相當有趣的一個學門,既然有趣,那麼書名是不是也應該要有趣一點呢?修改的書名是我指導的碩士生廖健良先生所想出來的,謝謝他的巧思。
回想當年我撰寫這本書的目的是希望能夠將社會科學研究方法以及量化研究設計用最簡單的方式表達出來,用最生活化的用語將一般人認為艱澀的內容呈現出來。第二版的修改與補充內容也是依循這樣的基本原則來撰寫,希望能夠實現我寫這本書的初衷,讓大家對於量化的社會科學研究有深刻的理解,同時也因此有了從事實證研究的能力。
就研究來說,「方法」很重要。當我們觀察真實世界形形色色的現象與行為時,如果我們沒有受過「方法」的訓練,我們是絕對無法將這些複雜的現象與行為做細膩深刻的描述,也無法提出令人信服的分析。在這種情況之下,我們真的很難累積有用的知識。既然缺乏有用知識的累積,那麼我們又如何期待這些有限知識能夠改善我們的生活品質呢?當然,有人認為我是賣瓜說瓜甜,可是我覺得並不盡然。這麼多年的學術生涯當中,我讀過不算少數的研究論文,有些論文讀完之後令人興奮無比,這包括提出有趣的研究問題以及作者有能力使用合適的研究方法,所以呈現出來的分析讓人拍案叫絕。可是,有些論文的內容讀完之後卻索然無味,讓人有不痛不癢的感覺,大部分的情況是研究者費了很多心力蒐集資料,但是卻因為缺乏方法的訓練而讓研究內容有氣無力。當然,我這裡所指的「方法」並不只是侷限在量化的方法而已,質化的研究途徑同樣也非常強調嚴謹的「方法」。說了那麼多,我只是希望讀者能夠瞭解,具備完整的研究方法訓練之後,我們才有能力與機會做出高品質的研究。
本書的內容仍然沿用初版的撰寫架構,但是補充了幾項重要的內容:第一,重新改寫第四章第四節的信度與效度內容,目前的內容應該算是非常完整,其中也放入日常生活的例子。第二,樣本代表性不足的補救方法,包括事後分層加權法( Post-Stratiecation Weighting )以及事後反覆多重加權法( Raking )的原理,補充內容安排在第六章第一節。第三,增列一個專章討論 OLS 線性迴歸分析如果面臨自我相關( autocorrelation )以及變異數不齊一( heteroscedasticity )的問題時,應該如何處理。補充內容放在第十五章。第四,增列一個專章討論依變數是二分類別變數的邏輯斯迴歸模型( logistic regression ),內容放在第十六章。第五,第十八章既存資料統計結果分析增加兩個案例,一個是中央政府在民國 91-95 年期間分配給縣市補助預算影響因素的分析,另一個是有關立法委員記名表決影響因素的分析。前者是用來補充說明矯正自我相關以及變異數不齊一的案例,後者則是補充說明如何詮釋邏輯斯迴歸模型的真實案例。第六,其餘的修正內容比較細微,包括增列一些生活上的實例或是修正原版本文字詮釋上的錯誤等等。
◎第二版章節安排
本書的第一章到第七章涵蓋量化研究設計的相關內容,我們依照量化研究的流程一一為讀者討論重要內容。第一章討論我們為什麼要做研究?什麼是社會科學研究?什麼是量化的社會科學研究?有什麼簡單例子可以說明什麼是量化研究?量化社會科學研究的流程為何?同時也告訴讀者,學術界標準的量化研究期刊論文與碩博士論文的內容骨幹應該如何安排?
第二章的內容討論如何選擇量化研究的主題?選擇的原則為何?有什麼思考方向可以幫助我們選擇研究主題?如何提出合適且具體的研究問題?要如何提問?有什麼簡單例子可以說明?提出具體的研究問題對於我們研究有何幫助?研究問題與研究的顯著性之間有何關聯?
第三章我們討論理論是什麼?理論可以幫助我們做什麼?量化研究的理論如何建構?研究假設是什麼?如何發展量化研究當中的假設?假設有哪些陳述的方式?在量化研究當中如何呈現假設?
第四章我們讓讀者瞭解什麼是理論與概念的操作化與測量?如何操作化與測量抽象的理論與概念?什麼是變數?變數有哪些類型?什麼是測量的效度與信度?它們代表什麼意義?如果測量的效度與信度不佳,會造成什麼不良後果?什麼是測量層次或尺度?為什麼要如此區分?
第五章我們討論什麼是調查法?使用時機為何?調查法的類型有哪些?問卷設計的基本概念為何?一份完整問卷當中的題目要如何排列?開放式與封閉式的問卷指的是什麼?問卷題目的設計有什麼技巧?
第六章也是屬於調查法的相關內容,我們討論什麼是抽樣?常用的抽樣方法有哪些?樣本規模大小要如何決定?問卷調查可以透過什麼方式施測?問卷回收之後如何編碼以便後續的統計分析?樣本代表性不足時如何補救?
第七章我們討論另一種資料蒐集的方法,亦即既存資料分析法,我們討論什麼是既存資料分析法?使用時機與它的優點為何?既存資料法的資料性質與資料來源為何?使用上需要注意哪些?有什麼實例可以說明既存資料分析法的使用要訣與步驟?
從第八章一直到第十六章我們將討論統計分析,依序講解敘述統計與推論統計分析。在常態曲線、雙變數的敘述統計以及假設檢定部分,我依循 Jane Fielding 和 Nigel Gilbert ( 2003 )所著的 Understanding Social Statistics 這本書在這幾個單元的邏輯順序來撰寫。因為該書在這幾個部分的內容是我所看過的統計書籍當中最淺顯的,非常適合初學者。我雖然以他們的邏輯結構為基礎,但是我完全改寫成自己慣用的詞彙與表達方式,並配合台灣周遭的實例重新組合而成。其他各個不同的統計分析部分的撰寫結構,主要是參考 Alan Agresti 和 Barbara Finlay ( 1999 )所著的 Statistical Methods for the Social Sciences ; A. Koutsoyiannis ( 1987 )的Theory of Econometrics ; Peter Kennedy ( 1994 )的 A Guide to Econometrics以及 Damodar N. Gujarati ( 1988 )的 Basic Econometrics 等等。
本書只講解統計分析如何運用在社會科學研究領域,我們並不講解統計軟體的操作方法。因為市面上這種書籍非常多,讀者可以自行參考學習。我一直以為,只有瞭解量化研究設計的概念以及統計基本原理之後,再去實際操作這些統計軟體才會有意義。
第八章屬於敘述統計,內容主要討論什麼是統計上的單一變數分析?當測量尺度不同時,單一變數分析所使用的統計方法為何?何謂常態曲線與常態分配?標準分數指的是什麼?它有什麼用途?如何將絕對數值轉換成標準分數?
第九章的內容也是屬於敘述統計,主要討論敘述統計上的雙變數分析指的是什麼?如何從事類別變數與類別變數之間的關聯度分析?如何從事順序變數與順序變數之間關聯度的分析?如何從事等距變數與等距變數之間關聯度的分析?什麼是皮爾遜相關係數?什麼是簡單迴歸分析?
第十章則進入推論統計,內容討論代表性樣本指的是什麼?何謂抽樣分配?何謂中央極限定理?抽樣分配與中央極限定理之間有何關聯?信賴區間指的是什麼?信賴區間可以幫助我們判斷什麼?平均值抽樣分配的信賴區間如何計算?影響信賴區間寬窄的因素是什麼?比例抽樣分配的信賴區間如何求得? 第十一章的內容主要是討論統計上假設檢定的基本概念以及實務上要如何進行假設檢定?
第十二章的內容主要討論如何針對單一變數從事假設檢定。包括如何檢定大樣本平均值?如何檢定小樣本平均值?如何檢定大樣本的比例?如何檢定小樣本的比例?
第十三章的內容主要討論如何針對雙變數之間關係從事假設檢定。例如如何檢定類別變數與等距變數之間的關係?如何檢定類別變數與類別變數之間的關係?如何檢定等距變數與等距變數之間的關係?
第十四章的內容進入多變數分析以及多變數的假設檢定,我們討論什麼是多元迴歸模型?如何檢定多元迴歸模型當中的迴歸係數與判定係數( R2 )?多元迴歸模型當中的虛擬變數代表什麼意義?實務上如何操作運算?從事多元迴歸模型時,有那些重要概念必須掌握?例如何謂調整後R2 ?何謂線性重合?如何檢測?何謂標準化迴歸係數?如何求得?
第十五章討論當利用最小平方法( OLS, ordinary least square )從事線性迴歸分析時,如果資料特質並不符合 OLS 基本的前提時,我們該如何處理?我們在這一章討論兩項最常違反的前提,一個是變異數齊一性,另一個是無自我相關或序列相關。其實,這些內容已經屬於計量經濟學的範疇,技術上來說,它們的確是比較深澀。不過,因為量化研究所分析的資料經常會面臨這些問題,如果不瞭解這些問題,那麼我們就很容易誤用最小平方法的線性迴歸模型,進而做出錯誤的統計推論。
第十六章討論當依變數是二分類別變數時的多變量統計分析模型。如果依變數是連續性變數,利用最小平方法所從事的線性迴歸分析可以達到分析的目的,但是依變數是二分類別變數時,我們會發現利用最小平方法估計將會產生資料呈現上相當不合理的現象,所以我們需要找一個解決方案。這個解決方案在統計學上稱之為邏輯斯迴歸分析( logistic regression )或是洛基分析( logit analysis )。本章將討論這個重要的主題。依變數是二分類別變數的情形經常可見,例如當分析單位是個人時,我們觀察這些個人是否參加總統大選投票?是否獲得信用卡核准?是否出國唸書?是否結婚?是否犯罪?是否蹺課?是否吸毒?當分析單位是國家時,我們觀察這些國家是否開放外資?是否加入某一個經濟合作組織?是否廢除死刑?
第十七章與第十八章的內容主要討論如何詮釋統計分析的結果。第十七章是討論如何詮釋問卷調查的統計分析結果,而第十八章則是討論如何詮釋既存資料所做的統計分析。在這兩章當中,我總共舉了 6 個真實分析案例(調查法 2 個,既存資料分析 4 個),讓讀者熟悉詮釋統計分析結果的要訣。
第十九章的內容則是告訴讀者,在量化研究當中(不管是期刊論文或是學位論文),我們如何處理「結論」的部分。量化研究的結論主要區分為「研究發現」與「討論」兩個部分,我們會清楚地讓讀者知道「研究發現」應該如何處理?「討論」的部分究竟要討論些什麼?
最後,我在本書的結語會告訴讀者,當你透過本書內容奠定了量化研究的基礎之後,接下來你應該怎麼辦?
◎第二版致謝
首先仍然要感謝揚智出版集團葉忠賢總經理以及閻富萍總編輯對於本書的出版提供慷慨的協助。其次,第二版撰寫過程仍然得到許多朋友在技術上的熱心協助,例如文稿的補充與修正,圖形的繪製等等,這些朋友包括目前在美國伊利諾大學芝加哥校區攻讀博士學位的李孟壕先生、台大城鄉所博士候選人紀建良先生、即將赴美攻讀博士學位的陳威助先生等等。最後,本書初版上市至今,學術界的許多前輩與好朋友不斷地給予鼓勵,讓我覺得自己真的做對了這件事。也因此讓我有了信心與動力完成本書第二版的增訂,由衷心地謝謝他們!
羅清俊
2010年夏天
於國立臺北大學公共行政暨政策學系三峽校區研究室