1.3 統計學的內容是什麼:從五個例子來看
在社會與行為科學領域中,對於統計方法有幾種基本的應用方式,以下我們將介紹五種常見的應用範例,並同時介紹一些專有名詞,關於這五種範例與專有名詞的相關細節,將在後面的章節詳細討論。
1.3.1 簡單中卻有大道理:描述統計
作為學生的你願意花多少時間來學統計呢?現在的學生究竟願意花多少時間讀書?這些都是老師們十分關心的問題。如果在速食店隨機找 10 個學生來問一下,他們可能會回答一個星期花了大約7小時在課業上(平均每天 1 個小時),這樣的答案對於一般的大學生來說可能已經算是不錯的了,有人可能多一點,十幾個小時,也有人平常都不會讀書,除非要考試了。但是如果拿一樣的問題去問 10 位老師,他們可能會認為一個星期花 14 個小時讀書也不為過。
現在,有一位統計老師希望透過科學的方法來瞭解這個問題,他編製了一份簡單的問卷,列舉一些關於統計課程學習的問題,然後透過他的朋友協助發放給選修統計課程的學生來填寫,最後回收了將近 500 份問卷。他發現有 15% 的學生會進行課前預習,45% 的學生會做課後複習,他們練習統計習題的時間,每週平均只有 0.8 小時,但是花了 2.9 小時在使用統計軟體來做作業,尤其是當統計學是選修課而非必修課時,使用軟體做作業的時間越長,學生課後複習的比率越高。這位老師對於研究結果感到驚訝,因為他自己的統計課並沒有使用統計軟體,他認為統計知識的建立一定要從演算中學習。他開始思考是否改變教學方式,因為研究數據透露著,有使用電腦來輔助學習統計的學生,似乎對於課程的滿意度較高,也比較樂意在課前課後自我學習。
前面的例子說明了描述統計的奧妙,它甚至改變了某位老師的教學方式。簡單來說,描述統計 (descriptive statistics) 是指利用某些簡單的數據來描述一群對象的某些特徵,這個「簡單的數據」稱為統計量 (statistic),而數據通常來自於一群人、動物、物體或事件,統稱為研究對象。以統計學的術語來說,這一群研究對象就是樣本 (sample),而樣本是從母體裡所抽取得到一個子集合,母體 (population) 則是指帶有某共同特徵的一群研究對象的全部。例如,在大學當中修統計學的學生可以是一個母體,因為他們擁有一個共同的特徵,是在大學四年間都要修一門相同的課。同樣的,在大學當中教統計的老師也可被認為是一個母體,這些老師不論是系上的專任老師或兼課老師,只要是在大學開課教統計學的老師,都擁有共同的特徵,但是助教就不算是這個母體的一部分,因為他們不是老師,而是協助老師教課的人。
描述統計可以說是研究者能夠從手邊資料所得到的最基本的資訊,雖然這些統計量都很簡單(例如平均數或標準差),但是卻有大功用,它對我們所蒐集的資訊提供我們客觀的摘述,關於描述統計的相關細節,我們會在第三章至第五章進行討論。然而,描述統計也是有所限制,例如它們無法獲知數據之間的相互關係,也無法瞭解不同狀況下的數據差異的意義。例如當統計課是必修或選修課時,學生學習的狀況是否真的有所差別?使用統計軟體來協助教學是否真的會提高學生的學習興趣?如果僅看粗略的描述統計量,我們並無法得知自主學習與課程的教學方式是否有關,而學生們願意多花時間讀書的確實原因為何也不得而知。所以我們需要推論統計來協助我們。
1.3.2 由小看大、見微知著:統計推論
前面描述統計的例子中,我們曾經舉例:在速食店隨機找 10 個學生調查得知平均每週讀書時間是 7 小時,那麼這句話到底能不能反映大學生的現況呢?也就是說,這 10 個學生所蒐集得到的統計量是否能夠推論到具有相同特徵的所有大學生的這個母體呢?此外,那位認真的統計老師調查 500 位學生所得到的「每週平均花費 2.9 小時使用統計軟體來做作業」,是否就是現在學生學習統計的普遍狀況?
描述統計量只能反映我們從一個樣本裡所蒐集的測量數據是什麼,但是無法得知我們沒有掌握的資料會如何。顯然一個樣本所得到的資料並不能代表全體,但是為了得到更全面的結果,研究者必須進行統計推論,從手中所獲得的樣本資訊(掌握已知)來對其所出自的母體得出結論(推論未知),而統計推論 (statistical inference) 就是利用樣本來推知母體的過程。
為了確保樣本能夠代表母體,樣本的獲得必須遵循一定的規則,最常見的抽樣方式是隨機抽樣,也就是從母體中以某種隨機方法挑選成員,母體中的每一個成員都有相同的機率被選擇作為樣本,而且每個被挑選的成員彼此相互是獨立不互相影響,此時所建立的樣本可稱為隨機樣本 (random sample)。利用隨機樣本所獲得的資料所計算出描述統計量之後(例如 10 位學生平均每週讀書7小時),得以用來推論母體的狀況,此一被推論的母體特徵被稱為參數 (parameter),例如大學生每週平均讀書幾小時。有很多常見的以描述統計量來推論母體參數的例子:
初入社會的社會新鮮人平均起薪是 22K(從某資料來源推論社會新鮮人)。
一般上班族每天花 23 分鐘才能到達工作地點(從某批上班族的經驗推論一般上班族)。
臺灣地區平均每戶成年人數為 2.53 人(從政府訪查數據推論全臺地區)。
臺灣地區平均每人每月消費支出為 18,007 元(從某消費調查數據推論全體)。
以上每個數值都是從樣本或某特定資料來源所獲得的描述統計所估計而來的參數。我們不可能去一一詢問每一個人的起薪是多少,或是去調查每一個上班族每天花多少時間通勤,因此每個數值都是母體的估計值。利用描述統計量是否能夠準確估計母體參數,取決於抽樣過程與抽取的觀察值數目。關於抽樣方法,以及相關機率問題與估計過程,將在第六章至第八章進行討論。
1.3.3 是事實還是偶然:假設檢定
科學家除了想對母體特徵進行瞭解之外,更對事情的因果關係感興趣。為了掌握因果 (causality),最好的方式就是進行實驗(experiment)。一般來說,實驗的進行必須先去定義自變數 (independent variable; IV) 與依變數 (dependent variable; DV)。
自變數是指研究者能夠操弄的變數,藉由操弄某個變數的不同狀況(實驗水準),觀察一群實驗受試者 (subject) 或參與者(participant) 的行為表現,此時被研究者預期會被自變數所影響的行為結果稱為依變數。
例如,酒駕是危害民眾安全的行為,因為喝酒會影響駕駛人的反應能力,但是要喝下多少酒精才會影響駕駛呢?如果喝下帶有米酒調味的湯頭是否會影響駕駛呢?政府對於酒駕的定義必須有一個合理的標準才能作為取締的依據,此時就需要進行實驗。如果我們以喝下酒精的多寡為自變數,測量駕駛對於信號的反應速度作為依變數。研究者認為酒精會影響對反應速度的這個想法稱為研究假設 (research hypothesis)。一般來說,研究假設是研究者對於兩個或兩個以上變數關係的預期或預測,在實驗中,研究假設是指自變數與依變數的預測關係。
為了檢驗研究假設是否成立,科學家挑選一群實驗參與者,將他們隨機分配到幾個不同的組別,然後操弄不同的狀況來進行實驗處理 (treatment),例如讓參與者飲用不同比例的含酒精飲料,最後觀察他們的行為反應靈敏度。之所以要進行隨機分派 (random assignment) 的目的,是為了確保參與者有相同的機會被分配到各種實驗狀況下,而且參與者被分派到實驗組與其他參與者的分派是獨立的。因此每一組參與者的特徵都十分相似,使得每一組之下的參與者在依變數上的表現,可以被視為是自變數影響的結果。
對於實驗操弄是否影響依變數,需要進行一系列的統計分析與考驗。首先,研究者必須計算每個實驗狀況下,受試者在依變數得分的描述統計量,此一步驟跟一般描述統計量的計算過程完全相同。第二個步驟則是決定不同組別的依變數描述統計量的差異,是否效果大到能夠歸因於自變數的影響,而非偶然性的差異,此一步驟需要使用統計假設檢定 (statistical hypothesis testing)。
基本上,任何兩個群組的描述統計量都會存在一些無法預期的差異,稱之為隨機差異 (chance difference),即使自變數對於依變數完全沒有影響,隨機差異也會發生於實驗研究中的不同群組當中。假設檢定的原理,就是將實驗中的各群組實際所觀察到的差異,來與群組間預期的隨機差異進行比較。如果獲得隨機差異的機會很小,而實際所觀察到的差異夠大,那研究者就可以得到受試者們的差異並非是隨機差異的結論,亦即可將觀察值的差異歸因於自變數的效果。為了要決定不同實驗群組間在依變數上的平均數差異是否不是機會所造成,最常使用的統計方法為 t 檢定與變異數分析 (analysis of variance; ANOVA);前者適用於只有兩個組別的平均數相互比較時,後者則可應用在超過兩個組別的平均數差異的比較。
統計假設檢定在學術研究上被廣泛使用,要瞭解它所涉及的概念,需要有描述統計、機率與抽樣理論的統計知識,這些主題將在第三章到第八章進行討論。接著我們將在第九章與第十章正式介紹統計假設檢定,在第十一章與第十二章開始進行一連串關於實驗設計與變異數分析的說明。
1.3.4 無獨有偶、預測未來:相關與迴歸
許多社會科學研究無法以實驗方式來進行研究,例如許多變數無法進行操弄,例如性別、年齡、左撇子或右撇子、體重、身高、收入狀況、教育程度、藥物使用狀況等受試者變數 (subject variable)。但是科學家還是對於這些受試者變數與其他相關變數之間是否具有共變關係感到興趣。如果一個變數的改變與另一個變數的一致性改變有關,則兩個變數稱為具有共變關係。例如,如果一個人的學業成績與個人的努力有關係,那麼成績與努力就具有共變關係,這兩個變數的變化具有關聯性,此時可以計算介於 –1.00 到 1.00 之間的相關係數 (correlation coefficient),作為描述兩組分數的相關程度和方向的統計量。
相關係數雖然是一個統計量,但也需要使用統計假設檢定來決定這個係數是否是隨機現象。如果兩組分數的相關並非是隨機發生的,那麼我們就可以嘗試從一個變數去預測另一個變數。假設你知道一個人的努力程度,就可以預測他的學業表現,但是以努力程度去預測學業成績到底有多麼準確呢? 也就是如何有效的以某個變數的分數去預測另一個變數的分數,必須使用迴歸分析 (regression analysis)。相關與迴歸分析技術可以說是社會科學的領域中最被廣泛使用的一種統計技術,例如下列各種狀況的研究與應用:
孩童年齡增長與智力發展的關係(教育學者關心的學習議題)。
廣告投資金額越高,是否有效提高產品銷售情形(行銷經理關注的業績提升問題)。
以歷年來的出生與死亡人口來預測未來的人口結構(政府官員必須掌握的趨勢)。
要獲得多少產品需要投入多少生產成本與人力(企業高層在意的成本效益模式)。
關於相關與迴歸的原理,我們將在第十三章與第十四章介紹,然後在第十五章討論比較進階的多元迴歸分析,最後在第十六章介紹時間序列分析。
1.3.5 此消彼長:交叉分析
每當選舉季節,電視上最熱鬧的新聞之一就屬候選人的支持度調查。我們經常可以聽到某某民調公司以電話訪問臺灣地區 18 歲以上的 1,000 名選民,詢問他們如果明天是投票日,他們是否支持某一政黨的候選人,然後得到一個百分比數字,同時交代一下抽樣誤差的比例(例如正負三個百分點),以作為選舉情勢分析的證據。
事實上,民調的分析也是一種統計推論,民調公司所訪問的選民就是樣本,從而獲得支持意願的數據,進而推知全體選民的支持意向,此時為了確保樣本能夠代表母體,抽樣過程是其關鍵,樣本越大,抽樣誤差 (sampling error) 越小。若從統計的角度來看,民意調查與前述的統計推論有兩個主要的差異。
第一個差異,是民調所使用的變數通常不是反映強度變化的連續變數,而是數人頭的類別變數。連續變數的資料可以計算各種描述統計量,但是類別變數所能夠使用的描述統計量相當有限,通常只有人數的次數資料,或是把人數除以總人數得到百分比。例如 1,000 個選民當中,有 250 人支持甲政黨,有 400 人支持乙政黨,150 人支持丙政黨,其餘則是未表態者,除以總人數之後,就可得到百分比或機率:.25、.40、.15 與 .20。
進一步的,民調通常會把選民的投票意向,再就他所屬的政黨別,進行兩者的交叉分析,看看不同政黨背景的人是否支持特定的政黨,還是說會有跨政黨的投票意向。例如偏向甲政黨的選民,理應支持甲政黨的候選人,偏向乙政黨的選民,則應支持乙政黨的候選人,如果有相當比例的選民投向對立或不同的政黨,那麼就有玄機可以探討了。
在統計上,對於類別的次數分配是否具有特殊的比例(例如一個班級的性別比例是否為 1 比 1),或是兩個類別變數的分布比例是否具有連帶關係(例如選民自己的政黨傾向與候選人的支持情形),可以利用卡方檢定 (chi-square test; χ2-test) 來檢驗。由於所牽涉的變數主要是類別變數,因此不需要對於母體分配是否為特殊分配進行假設,因此這一類的統計分析又被稱為無母數檢定 (non–parametric test)。關於卡方檢定在類別資料與等級資料的分析應用,我們將在本書的最後一章:第十七章介紹。