YA!我喜歡統計學!R語言版來了!
你也許常聽到「統計學好難喔」、「念統計有什麼用」這樣的話,
那只是很少人發現統計學的魅力,這本書將顛覆你的刻板印象!
外表看似枯燥又艱深,骨子裡卻是有趣又實用,
講解觀念親切生動,讓你一不小心就愛上統計學了。
※每章均附「真實世界的統計」,讓你知道統計其實默默地貼近你的生活。
※互動式學習網站加深你與統計學的情感連結。
※本書附有資料檔,請至五南官網輸入本書書號,即可找到資料下載處。
學統計學也可以很輕鬆!
讀者千呼萬喚的R語言版也出來囉!
這是一本關於基礎統計學,以及在不同情況下,如何應用統計學分析和理解資料的書。本書理論的部分、數學證明或特定數學程式的討論很少。為什麼呢?很簡單,因為目前的你還不需要。
這本書針對學生而寫,但並非降低標準,而是盡可能給予充分資訊,展現基本概念及最常用的技術。本書也沒有設定在接觸之前需要具備什麼知識,全書進度安排得宜,讓學生按自己的節奏安排進度。
本書將教你如何精準善用統計學,搭配廣泛運用於統計領域的R語言,讓它成為你研究或工作上最好的夥伴。
作者簡介:
尼爾‧J‧薩爾金德(Neil J.Salkind, 1947~2017)
於堪薩斯大學心理學和教育學系執教35年,同時兼任人類發展和家庭生活系的教授。35年來,開設的課程有發展理論、生命全程發展理論、統計學和研究方法。
獲得馬里蘭大學人類發展博士學位,發表了150多篇專業文章及一些大學教材,如《兒童發展、探索性研究和人類發展理論導論》(Sage,2004)。他也是1989~2002年《兒童發展摘要與傳記》的編輯。在兒童發展研究領域很活躍,在貿易領域也有頗多著述。喜歡烹飪、游泳、閱讀、藏書及尋找古董車和老舊建築。
萊絲莉‧A‧肖(Leslie A. Shaw)
堪薩斯大學心理學博士,專精於定量心理學。曾於堪薩斯大學發育障礙中心從事博士後研究,後於康奈爾大學就業與殘疾研究所擔任研究助理,與人共同發表了20多篇文章,同時擔任《知識與發展障礙》雜誌的統計顧問。現居紐約伊薩卡,喜歡讀書、旅行。
譯者簡介:
余峻瑜
現職:臺灣大學工商管理學系暨商學研究所專任助理教授
學歷:英國牛津大學應用統計博士
專長領域:
‧作業分析學進行服務與營運模式創新
‧以資料科學、管理科學及系統模擬進行服務最佳化
‧系統思考及系統動力學之應用
‧複雜決策之問題解構
‧作業策略及行為作業管理
‧設計思考與使用者研究
章節試閱
1 統計學或虐待學?由你自己決定
為什麼要學習統計學?
你以前一定都聽過,「統計學很難」、「統計學的相關數學很難應付」、「我不知道怎麼用電腦」、「學統計有什麼用」、「接下來要做什麼」,還有就是統計學入門課程學生的吶喊,「我就是不懂!」
好啦,放輕鬆。學習統計學入門課程的學生,在和其他學生或他們的配偶、同事、及朋友交流的時後,或多或少會發現他們自己曾在某個時候出現上面其中之一(甚至更多)的念頭。
而且,不是開玩笑,一些統計學課程很容易被描述為虐待學 (sadistic)。這是由於那些書無一例外的讓人厭煩,而且作者缺乏想像力。
本書將改變這種狀況。事實是,當你或者你的老師選擇了《愛上統計學》這本書時,表示你們已準備好航向正確的航道—讓人不害怕、內容豐富多元並且很實用(甚至有趣)的方法,我們教你如何善用統計學,讓它成為你的好工具。
如果選用這本書作為課程教材,這也意味著你的老師是站在你的立場,因為他(或她)知道統計學是令人害怕的,但他已採取措施來確保統計學不會讓你害怕。事實上,我們敢打賭你在幾個星期之後,很有可能變得開始享受這門課程。
為什麼選擇 R 語言?
在這本書中,我們將為你展示如何使用這套統計分析的工具─—R語言,來進行數據分析。別擔心,我們將會親手演示如何操作,確保你能瞭解R語言及數據分析。
為何選擇 R 語言呢?很簡單,因為 R 免費且強大。你不需要租軟體或是嘗試去連線到學校網站共用軟體,只需要打開電腦,執行RStudio(或是你想要使用的其他編譯器,請看下一個章節的介紹)。這本書將使用 R 語言來簡單的計算和演示所有統計範例。我們將探索使用圖形視覺化我們的數據。而且我們將在前面幾個章節介紹其他方式去做相同的統計分析。在這本書的後半段,當統計開始變得有一點複雜時,在你已經學會了基礎 R 語言的前提之下,我們將會使用內建函式。我們希望你可以自在的學習 R 語言,而且藉由使用 R 語言,開始瞭解統計的力量。
五分鐘統計學簡史
在閱讀更多內容之前,有必要從歷史的觀點瞭解統計學。如你所知,幾乎所有的社會學、行為科學、生物學的大學生,還有教育學、護理學、心理學、社會福利與社會服務、及人類學的研究生,都必須選修這門課。所以多瞭解一些統計學的源起,應該還不錯吧?當然囉。
很久很久以前,當人們發現計數 (counting) 是個非常好的想法時(比方說「你需要多少個這些來交換那些中的一個?」),蒐集資訊也成為一個有用的技能。
如果用到計數,人們就會知道太陽在一季中升起多少次,度過整個冬天需要多少食物,以及一個人擁有多少資源。
這只是個起點。一旦數字成為語言的一部分,似乎接下來的步驟就是將數字連結到結果上。這工作在 17 世紀當人們蒐集第一組與人口相關的資料時,就已開始。從此以後,科學家(大多數是數學家,但之後是物理學家和
生物學家)需要發展特定的工具來回答特定的問題。例如,法蘭斯‧ 加東(Francis Galton)(順道一提,他是達爾文的表兄弟,生卒年是1822–1911年),他對人類智力的本質非常感興趣。他也推測掉頭髮是因為腦力過度運
用,不過這不是真的。讓我們回到統計的部分。
為了回答有關家庭成員智力相似的主要問題之一,他使用了特定的統計工具相關係數(一開始是由數學家開發的工具)。接著他把相關係數廣泛地應用於行為科學和社會科學。你將在第 7 章對這個工具有全面的瞭解。事實上,你學到的大多數基本統計方法,最初都是發展及應用自於農業、天文學、甚至政治學領域;統計學在人類行為領域的應用相對晚得多。
在過去的 100 年中,發展新方法來運用原有的觀念出現快速的進展。用於比較兩個群體的平均數差異的最簡單檢定方法,在 20 世紀初由威廉‧戈塞 (William Wealy Gosset) 首次突破,我們會在第 14 章再次提到他。以此概念為基礎而發展出來的技術,在數十年後大放異彩,更為精深。個人電腦以及像 Excel 這樣的軟體的盛行,讓所有想探索這些有趣主題的人,都可以輕鬆使用如此複雜精細的技術。
使用這些功能強大的個人電腦,事實上利弊互見。優點是大多數統計分析不再需要使用龐大、昂貴的中央處理器,且價格不超過 250 美元的個人電腦就能滿足 95% 的人 95% 的需求。但反過來說,學藝不精的學生(如已經
通過這門課的同學)把手邊有的舊資料丟入電腦軟體中、跑一些複雜的分析,他們就會得到可靠的、可信的、且有意義的結果。很可惜並不是這樣。你的老師會說「垃圾進,垃圾出」(Garbage in, garbage out),這是因為如果
你一開始就不是用可靠和可信的資料,那麼分析這樣的資料所得到的結果,就既不可信也不可靠。
現在,在不同領域,如刑事司法、地球物理學、心理學,或驗證NBA球賽中是否存在手氣效應(沒在開玩笑,你可以看 2014 華爾街期刊的文章https://www.wsj.com/articles/SB100014240527023040710045794090710157453
70)的統計學家發現,他們基本上使用相同的技術來回答不同的問題。當然,在資料蒐集方面有重要的差別,但是大體上來說,緊接在資料蒐集之後所進行的分析,即使名稱有所不同,也是非常類似的。這事的寓意是什麼呢?這
個課程會提供你為瞭解統計學如何用在所有學科中所需要的工具。更棒的是,這只需要 3 個或 4 個學分。
如果你想進一步瞭解統計學的歷史,而且想看歷史發展軸線,可以從一個很棒的地方開始,那就是英國的南安普頓大學的網站,網址是 http://www.economics.soton.ac.uk/staff/aldrich/Figures.htm。
五分鐘到啦,你已經知道你該知道的統計學歷史了。我們來看看統計學是什麼以及它不是什麼。
1 統計學或虐待學?由你自己決定
為什麼要學習統計學?
你以前一定都聽過,「統計學很難」、「統計學的相關數學很難應付」、「我不知道怎麼用電腦」、「學統計有什麼用」、「接下來要做什麼」,還有就是統計學入門課程學生的吶喊,「我就是不懂!」
好啦,放輕鬆。學習統計學入門課程的學生,在和其他學生或他們的配偶、同事、及朋友交流的時後,或多或少會發現他們自己曾在某個時候出現上面其中之一(甚至更多)的念頭。
而且,不是開玩笑,一些統計學課程很容易被描述為虐待學 (sadistic)。這是由於那些書無一例外的讓人厭煩,而且...
作者序
任何一本書永遠都是進行式,《愛上統計學》的最新版本也不例外。過去的17 年左右,許多人曾告訴我們這系列的書有多麼大的幫助,但是其他人也告訴我,他們想讓這本書有所改變以及為什麼要改變。在寫這本書的時候,我們試著維持輕鬆的步調、容易操作的範例以及有用的圖表來學習統計,同時引入 R 作為一個有用的、免費的工具。所以,你如果喜歡系列中其他書籍,你也會喜歡這本書。我們知道,使用 R 一開始可能很嚇人,因此大部分R 的學習,安排在前面統計觀念較為簡單的章節。在假設檢定之後的章節,R 就僅僅是扮演輔助性質的角色。
這本書是為大學生提供的入門統計課程而編寫的,但它也可以用於剛接觸統計學的研究生。經過大量的試誤:一些成功和許多不成功的嘗試以及從各個教育階層的老師與同學大量的回饋,我們嘗試用一種我們(以及許多學生)認為比較不嚇人且具有知識含量的教學方式來教學。我們已經盡我們最大的努力,將所有上述的經驗融入這本書。
對於學生來說,你將從本書中學到的是瞭解基礎統計領域和研究內容所需的資訊。你會學到基礎的知識以及最常使用的技巧去整理及解讀資料。這種書比較少提及理論、證明或是探討選用數學方式的合理性。為什麼在這本
《愛上統計學:使用R 語言》的書中會比較少這些理論性的東西呢?簡單來說,現在你根本用不著那些。這不代表我們認為那不重要,而是在你學習的這個階段和時間,我們希望為你提供我們認為你可以理解和學習的內容,同時不要害怕將來學習其他課程。我們(和你的教授)希望你成功。
因此,如果你正在尋找一個詳細推導F分配的變異數分析,請從Sage找另一本好書(我們將很樂意為你推薦一本)。但如果你想瞭解為什麼和如何讓統計為你工作,你找對書了。本書讓你能瞭解在期刊文章中閱讀的內容,解釋許多統計分析的結果的意義,並教你如何執行基本的統計任務。
總是有新的東西值得關注,同時也需要用不同的方式重新理解舊的主題和觀念。以下的清單是《愛上統計學:使用R 語言》中最新的內容:
•本書前兩章節專門介紹安裝R(必學)和 RStudio(有幫助),然後介紹一些有助於掌握R 技巧的基礎知識。
•在第18章有決策樹圖,顯示何時適合選用迴歸。
•搭配t檢定結果的效應量修正公式,列在第13章與第14章。
•更新本書中的一些範例,以包括來自更多不同領域的最新範例。
•第20章,描述了本課程以外的統計方法,包括一些更常用的方法;大部分的方法皆附上R的範例。
•其他技巧、很酷的網站和附錄A及G中,提供有用的R資訊。
除了影片教你如何精通R以外,該網站也包含了按章節順序編排的所有範例及資料集。各章節後搭配各真實案例的期刊文章也都已經放在網路上了。所有的資源都可以在edge.sagepub.com/salkindshaw 中找到。
在這一版本中出現的所有錯誤都是我們的責任,我們向被這些錯誤困擾的老師和學生道歉。我們已經在新版中盡力更正,並希望做得更好。期望能收到大家的建議、批評、和指教。祝大家好運。
A. Shaw
康奈爾大學
njs@ku.edu
任何一本書永遠都是進行式,《愛上統計學》的最新版本也不例外。過去的17 年左右,許多人曾告訴我們這系列的書有多麼大的幫助,但是其他人也告訴我,他們想讓這本書有所改變以及為什麼要改變。在寫這本書的時候,我們試著維持輕鬆的步調、容易操作的範例以及有用的圖表來學習統計,同時引入 R 作為一個有用的、免費的工具。所以,你如果喜歡系列中其他書籍,你也會喜歡這本書。我們知道,使用 R 一開始可能很嚇人,因此大部分R 的學習,安排在前面統計觀念較為簡單的章節。在假設檢定之後的章節,R 就僅僅是扮演輔助性質的角色。
這本書...
目錄
關於作者
序言
致謝
電子資源
PART I 耶!我喜歡統計學
1 統計學或虐待學?由你自己決定
為什麼要學習統計學?
五分鐘統計學簡史
統計學:它是什麼(以及它不是什麼)
我在統計學課堂上做什麼
使用這本書學習統計學的十種方式
這本書還涵蓋了哪些範圍呢?
小結
PART II 歡迎來到這個有趣、有用、有彈性、好玩、而且(非常)深入的R語言及RStudio的世界
2 這裡就是你跟R的初戀與緣分的起點
R語言的極簡史
R語言的優點
R語言的缺點
其他使用R的理由?
給你(以及你的老師)一個關於開源軟體的簡短註解
去哪裡尋找並下載R
R的套件及函式
格式注意事項
一堆免費的資料集!
在R中尋求幫助
用help來尋求幫助
一些重要的專門術語
去哪裡尋找並下載RStudio
我們來玩一下RStudio吧
從RStudio操作
小結
3 使用RStudio──比你想像中容易
盛大的旅程及四個窗格
RStudio 窗格的好處
小試身手─—使用剛才介紹的目錄、標籤、及一個樣本資料集來使用RStudio吧!
基本知識:+, -, ? , *, 和更多:使用運算符處理資料
讓我們看看工作空間中的內容
讀取已存在的資料集
糟糕!你如何更正命令列錯誤?
指向或單擊以打開資料集
計算某些統計值
關於R和RStudio的十大重要事項(非依據重要程度排序)
小結
PART III 西格瑪•佛洛伊德 (Σigma Freud) 和敘述統計
4 必須完成的功課」──計算和瞭解平均值
計算平均數
計算中位數
計算眾數
集中趨勢測量數的選擇(以及現在你所需要知道的測量尺度)
應用電腦和計算敘述統計值
真實世界的統計
小結
5 差異萬歲─—瞭解變異性
為什麼瞭解變異性很重要
計算全距
計算標準差
步驟引導
重要的是什麼?
計算變異數
標準差與變異數
使用R 計算變異性測量數
真實世界的統計
小結
6 一幅圖真的相當於千言萬語
為什麼要用圖形表示資料?
完成一張好圖的十種方法
第一要事:建立次數分配
圖變厚了:建立直方圖
下一步驟:次數多邊形圖
累積次數
其他圖示資料的絕妙方法
使用電腦(R)呈現資料
真實世界的統計
小結
7 霜淇淋和犯罪──計算相關係數
相關係數到底是什麼?
計算簡單相關係數
瞭解相關係數的涵義
決定性的努力:將相關係數平方
輸入資料來計算相關係數
透過匯入文件來計算相關係數
其他很酷的相關
談一談部分相關
用R來計算部分相關
真實世界的統計
小結
8 只是真相──瞭解信度和效度
信度和效度介紹
信度:再做一次,直到做對
信度的不同類型
計算a係數或克隆巴赫係數
使用R計算克隆巴赫 (Cronbach) 係數
瞭解R呈現結果的意涵
多大才是大?解釋信度係數
效度─—哇!真相是什麼?
最後的友善建議
信度和效度:非常親密的兄弟
真實世界的統計
小結
PART IV 抓住獲得樂趣和利潤的機會
9 假設和你─—檢定你的問題
因此你想成為一位科學家……
樣本和母體
虛無假設 (Null Hypothesis)
研究假設 (Research Hypothesis)
好的假設標準是什麼?
真實世界的統計
小結
10 來和鐘形曲線玩耍吧─—機率和機率的重要性
為什麼是機率?
常態曲線(或鐘形曲線)
我們最中意的標準分數:z分數 (z score)
假設檢定和z分數:第一步
環肥燕瘦的分布型態
真實世界的統計
小結
PART V 顯著性差異─—使用推論統計
11 顯著的顯著性─—對你我來說,它意味著什麼
顯著性的概念
顯著性與有意義 (meaningfulness)
推論統計介紹
顯著性檢定介紹
變得更有信心
真實世界的統計
小結
12 只有孤單一個──單一樣本Z檢定
單一樣本z檢定的介紹
通往智慧和知識的道路
計算檢定統計量
使用R來做z檢定
特殊效果:這是真正的差異嗎?
真實世界的統計
小結
13 兩個群體的t檢定─—不同群體的平均數檢定
獨立樣本t檢定的介紹
通往智慧與知識的道路
計算t檢定統計量
t(EA) 的效應量
使用R來計算t檢定量
真實世界的統計
小結
14 兩個群體的t檢定─—相關群體的平均數檢定
相依樣本t檢定的介紹
通往智慧與知識的道路
計算檢定統計量
使用R進行t檢定
t(EA) 的效應量(再一次)
真實世界的統計
小結
15 兩個群體是否太多?─—嘗試進行變異數分析
變異數分析的介紹
通往智慧與知識的道路
ANOVA 的不同選擇
計算F檢定統計量
使用R計算F比率
簡單變異數的效應量
但差異在哪呢?
真實世界的統計
小結
16 兩個以上的因子─—因子變異數分析的簡要介紹
因子變異數分析的介紹
通往智慧與知識的道路
ANOVA的新選擇
一堆效應
主要事件:因子ANOVA的主效應
其他列
按組別繪製平均值
或許更有趣的:交互效應
關於變異的假設
使用R計算F檢定統計量
計算效應量對於因子變異數分析
真實世界的統計
小結
17 親戚或只是好朋友?─—用相關係數檢定關係
相關係數檢定之簡介
通往智慧與知識的道路
計算檢定統計量
原因與相關(再一次!)
使用電腦計算相關係數
真實世界的統計
小結
18 使用線性迴歸─—預測未來
線性迴歸簡介
預測是怎麼一回事
預測的邏輯
為你的資料繪製最佳直線
我們的預測有多好?
使用R計算迴歸直線
瞭解R的輸出報告
預測變數越多就越好?可能……
真實世界的統計
小結
PART VI 更多統計!更多工具!更多樂趣!
19 卡方和其他無母數檢定─—非常態時該如何
無母數統計的介紹
配適度(單樣本)卡方檢定
計算卡方檢定統計量
獨立性卡方檢定
計算獨立性卡方檢定的統計量
使用R進行卡方檢定
瞭解R的輸出報告
你應該瞭解的其他無母數檢定
真實世界的統計
小結
20 你應該瞭解的其他重要統計方法
多變量變異數分析 (Multivariate Analysis of Variance)
重複量測的變異數分析 (Repeated-Measures ANOVA)
共變異數分析 (Analysis of Covariance, ANCOVA)
多元迴歸 (Multiple Regession)
多層次模型 (Multilevel Models)
後設分析 (Meta-Analysis)
邏輯斯迴歸 (Logistic Regression)
因素分析 (Factor Analysis)
路徑分析 (Path Analysis)
結構方程式模型 (Structural Equation Modeling)
小結
附錄A R和RStudio帶來更多樂趣
附錄B 表
附錄C 資料集
附錄D 練習題答案
附錄E 數學─—只是基礎而已
附錄F 10個(或更多)最佳(和最有趣)的統計網址
附錄G 資料蒐集的10 個誡律
附錄H 統計術語
附錄I 給你的獎賞—布朗尼食譜
關於作者
序言
致謝
電子資源
PART I 耶!我喜歡統計學
1 統計學或虐待學?由你自己決定
為什麼要學習統計學?
五分鐘統計學簡史
統計學:它是什麼(以及它不是什麼)
我在統計學課堂上做什麼
使用這本書學習統計學的十種方式
這本書還涵蓋了哪些範圍呢?
小結
PART II 歡迎來到這個有趣、有用、有彈性、好玩、而且(非常)深入的R語言及RStudio的世界
2 這裡就是你跟R的初戀與緣分的起點
R語言的極簡史
R語言的優點
R語言的缺點
其他使用R的理由?
給你(以及你的老師)一個關於開源軟體的簡短註...