只能跑出統計報表的統計套裝軟體落伍了,讓統計專家以及程式高手帶著您,透過AI來幫您做統計計算、分析與解讀!
R語言是進入統計學領域的一把重要鑰匙,本書從基礎開始,一個個步驟帶您領會運用R語言的樂趣。
R 是一種專門為統計分析與資料管理所設計的手稿語言。R 誕生於90 年代初期,由S 語言所轉變而來。它是免付費的公開軟體,可自由下載原始碼,加上十分容易在官方網站找到別人寫好的套件或分析程式碼,因此近年來使用的人越來越多,並且不乏許多專業人士如:風險分析師、研究學者、統計學家等。
本書會從入門的安裝步驟開始,介紹R的資料型態、資料整理、繪圖、推論統計的概念、變異數分析等,幫助讀者打好基礎,讀完您會發現,原來統計就是這麼輕鬆啊!
作者簡介:
黃芳銘
現職:嘉義大學教育系教授
學歷:美國猶他大學社會學博士
經歷:國立體育學院教育學程中心助理教授
台北縣漳和國中數學教師
著作:《結構方程模式-理論與應用》
章節試閱
第1章
R 的簡介
難易指數:非常簡單
學習金鑰
了解R 語言是什麼以及學習使用R 語言做基本的計算
了解Rstudio 的基本運作功能以及基本的操作方法
安裝重要R 統計的套件
R 是一種專門為統計分析與資料管理所設計的手稿語言(scripting language)。R 誕生於90 年代初期,由S 語言轉變而來。它是免付費的開源軟體(open source),可自由下載原始碼,加上十分容易在官方網站(http://www.r-project.org/) 找到別人寫好的套件(packages,或稱為軟體包,如果你對package 不太清楚的話,你可以把它想成App)或分析程式碼,因此近年來使用的人越來越多,其中不乏許多專業人士如:風險分析師、研究學者、統計學家⋯⋯等。
R 大致上的語言方式與S 或S-plus 語言相通,最大的不同在於結果的輸出,R 僅會顯示最少的訊息,但可以將想要輸出結果儲存為一個物件(object),以提供後續演算之用,這也是與許多統計軟體(如:SAS、SPSS)不同的地方。R 語言是一種高階的直譯式語言(interpreted language),在程式執行之前,使用者不用自己編譯程式,可以將心力投入在資料的分析上,就像使用Matlab 這類的程式語言一樣。R 能快速地擴張,歸功於它的物件導向(object-oriented) 功能,具有執行使用者自訂功能及套件的能力(就R的套件,作者在2021/04/17 查詢時有17,444 個套件,2021/06/11 查詢時是17,682 個套件)。另外,R 有高品質的學術繪圖功能(例如本書單元4 中所介紹的ggplot2 套件)。它的程式可以依據個別需求修改,具備相當好的說明文件與討論區,在網路上也有相當的社群討論區或論壇開放討論關於R的問題。最後,R 可以應用於機器學習、資料探勘等領域。
開始使用之前,必須安裝兩個軟體:R,一個實際的編程語言以及RStudio,是一個整合開發環境(Integrated Development Environment, IDE),如同其他程式的整合性平台,除提供了視覺化操作介面之外,也提供相關工具與環境,大幅地提升了使用R 的工作效率。
1.1 安裝R
R 的官方網站的「CRAN」(Comprehensive R Archive Network,R 綜合典藏網的簡稱),可以下載針對Unix、MacOS 或Windows 的安裝軟體及原始碼。它除了收藏R 的執行檔下載版、原始碼和說明文件,也收錄了各種用戶撰寫的套件(軟體包)。現時,全球有超過一百個CRAN 鏡像站。
STEP 1 開啟 R 官方網站的網頁,點選 download R。
STEP 2 從鏡像站列表中選擇台灣的鏡像站(台灣大學),如果您的所在地不在台灣,就選擇距離自己最近的鏡像站。
STEP 3 依照您自己電腦的作業系統下載安裝檔,在 Windows 系統中就點選「Download R for Windows」。
STEP 4 有四種安裝檔,第一次安裝 R ,請選擇「base」。
STEP 5 點選網頁上最新的下載連結(2021/06/11,版本是Download R 4.1.0 for Windows),下載 R 安裝檔。R 網站每年10 月會更新版本。未來想更新,可以安裝installr 套件,呼叫出套件library(installr),打上updateR() 語句。
STEP 6 安裝檔下載完成後,請直接執行,進行安裝,首先選擇語言。
STEP 7 R 是以開放原始碼授權釋出的,此顯示GNU GPL 使用條款,請點選「下一步」。
STEP 8 選擇目的資料夾,設定好之後,請點選「下一步」。
STEP 9 選擇要安裝的元件,你會看到32-bit Files 以及64-bit Files,兩者都安裝,設定完後,請點選「下一步」。
STEP 10 選擇是否要自訂啟動選項,初次使用的話,用預設就可以了,請
點選「下一步」。
STEP 11 選擇「開始」功能表的資料夾,設定好之後,請點選「下一步」。
STEP 10 選擇是否要自訂啟動選項,初次使用的話,用預設就可以了,請
點選「下一步」。
STEP 11 選擇「開始」功能表的資料夾,設定好之後,請點選「下一步」。
STEP 12 選擇你想要附加的工作,選好後,請點選「下一步」。
STEP 13 等待安裝過程。
STEP 14 安裝成功,點選「完成」離開安裝程式。
第1章
R 的簡介
難易指數:非常簡單
學習金鑰
了解R 語言是什麼以及學習使用R 語言做基本的計算
了解Rstudio 的基本運作功能以及基本的操作方法
安裝重要R 統計的套件
R 是一種專門為統計分析與資料管理所設計的手稿語言(scripting language)。R 誕生於90 年代初期,由S 語言轉變而來。它是免付費的開源軟體(open source),可自由下載原始碼,加上十分容易在官方網站(http://www.r-project.org/) 找到別人寫好的套件(packages,或稱為軟體包,如果你對package 不太清楚的話,你可以把它想成App)或分析程式碼,因此近年...
作者序
歡迎閱讀過本書的讀者,在上面替作者寫一段序言,抒發您對本書的任何高見。
本書的完成,要感謝的人實在太多了,這些生命中難以忘懷的人給我幫助與扶持,造就今日的我,進而成就了這本書。
良師:
先是國中導師楊淑敏將我這個在街頭流浪、有家歸不得的小子拉回學校。如同我第二位母親的美術老師陳素秋,陪伴我走過國中、高中、大學、就業……的人生關鍵時刻,甚至在美國留學時的擇偶抉擇,回國後的成家立業,她都盡心盡力地幫助。
大學時期王秋絨老師對我生活的照顧。在修了林清山老師的教育統計學後,讓我感悟「有為者亦若是」,可是到現在還沒實現這句話。林振春老師啟蒙了我的研究與統計概念。宋明順老師將我帶入社會學的世界,激發我去拿到社會學的博士。還有,鼓勵與支持我出國留學的前體院校長邱金松老師,他對我的關心與照顧,已如同親生父親。
美國猶他大學研究所老師Tomas J. Burns看到我的潛能,據說是他給我留美的獎學金,並教我SEM統計。碩士論文指導教授Dair, J. Gillespie,她的教學如三月春陽般的光輝,春風徐徐沐浴其間。感謝博士論文指導教授郭文雄,讓我能順利地在獎學金截止之前拿到博士學位。
益友:
楊金寶教授和我一起合作發表文章,其豐富的學識,流暢的文筆,令我折服,可貴是如同姐姐般地關照我。李俊賢教授在統計學領域切磋琢磨,提供許多寶貴的資料,成書後為我校稿,在學術領域裡求真、求善、求美,奮不顧身,還因為眼睛太過勞累,得到結膜炎(超感動的)。
家人:
感謝愛妻惠玲婚前如伯樂般睿智,知我是千里良駒,將終身託付給我,婚後辛勤持家,讓我無後顧之憂,致力於教學與研究,進而有本書的撰寫,感謝女兒于庭與繪襄的乖巧及支持,並為本書命名。
感謝《一百萬個可能》這首歌,在寫作徬徨時,暖了我的心,得以繼續向前走,看到街燈。
黃芳銘 謹誌
於Weber Sanctum
辛丑年仲秋
歡迎閱讀過本書的讀者,在上面替作者寫一段序言,抒發您對本書的任何高見。
本書的完成,要感謝的人實在太多了,這些生命中難以忘懷的人給我幫助與扶持,造就今日的我,進而成就了這本書。
良師:
先是國中導師楊淑敏將我這個在街頭流浪、有家歸不得的小子拉回學校。如同我第二位母親的美術老師陳素秋,陪伴我走過國中、高中、大學、就業……的人生關鍵時刻,甚至在美國留學時的擇偶抉擇,回國後的成家立業,她都盡心盡力地幫助。
大學時期王秋絨老師對我生活的照顧。在修了林清山老師的教育統計學後,讓我感悟「有為者亦若是」,...
目錄
序言
1 R 的簡介
1.1 安裝R
1.2 RStudio
1.3 基本的計算
2 R 的資料型態
2.1 基本資料型態
2.2 變項指派
2.3 向量、因素以及列表
2.4 因素向量
2.5 矩陣與資料架構(資料框)
2.6 列表
2.7 資料框
3 資料整理
3.1 安裝與載入tidyverse 套件
3.2 dplyr 套件常用函數
3.3 選擇變項
3.4 篩選觀察值
3.5 新增衍生變數
3.6 依照變數排序觀測值
3.7 聚合變數(總結或概括)
3.8 依照類別變數分組
4 繪圖
4.1 ggplot2 套件繪圖簡介
4.2 基本步驟:用ggplot() 準備畫布
4.3 長條圖
4.4 圓餅圖
4.5 直方圖
4.6 盒鬚圖
4.7 散布圖
4.8 折線圖
4.9 儲存圖片
5 敘述統計
5.1 次數分配
5.2 集中量數
5.3 離散性
5.4 偏態與峰度
5.5 使用套件計算描述統計
6 推論統計的基本概念
6.1 母群與樣本
6.2 假設檢定
6.3 第一類型及第二類型錯誤
6.4 臨界值
6.5 p 值與顯著性
6.6 效果量
6.7 統計檢定力
7 兩個平均數比較
7.1 兩個獨立樣本t 檢定
7.2 相依樣本t 檢定
8 單因子變異數分析
8.1 單因子獨立樣本變異數分析
8.2 單因子相依樣本變異數分析
9 二因子獨立樣本變異數分析
9.1 二因子獨立樣本ANOVA 的假設
9.2 二因子獨立樣本ANOVA 變異數分解
9.3 多重比較
9.4 效果值的計算
9.5 二因子獨立樣本ANOVA 的假定
9.6 二因子獨立樣本ANOVA 實例解說與R 的操作
10 二因子相依樣本變異數分析
10.1 二因子相依樣本ANOVA 的假設
10.2 二因子相依樣本ANOVA 的變異數分解
10.3 單純主要效果檢定與事後比較
10.4 二因子相依樣本ANOVA 的假定
10.5 二因子相依樣本ANOVA 範例與說明
11 二因子混合設計變異數分析
11.1 二因子混合設計ANOVA 的假設
11.2 二因子混合設計ANOVA 的變異來源與F 檢定
11.3 單純主要效果檢定與事後比較
11.4 二因子混合設計ANOVA 的假定
11.6 二因子混合設計ANOVA 實例解說與R 的操作
12 卡方檢定
12.1 適配度檢定
12.2 獨立性檢定
12.3 同質性檢定
12.4 卡方分布
12.5 卡方檢定的假定
12.6 卡方分析的弱點
12.7 類別變項的關連
12.8 效果量
12.9 適配度檢定實例解說與R 操作
12.10 獨立性檢定實例解說與R 操作
12.11 同質性檢定實例解說與R 操作
13 皮爾森相關
13.1 皮爾森r 相關係數的定義與限制
13.2 皮爾森相關的假設
13.3 皮爾森相關假定
13.4 相關的議題與效果量
13.5 皮爾森相關實例解說與R 的操作
13.6 決定係數
14 簡單與多元線性迴歸
14.1 OLS 迴歸
14.2 迴歸線的數學形式
14.3 迴歸模式的顯著性檢定
14.4 OLS 估計法的假定
14.5 R 中lm() 函數的簡介
14.6 簡單線性迴歸的目的與資料要求
14.7 簡單線性迴歸範例與R 操作
14.8 多元線性迴歸範例與R 操作
14.9 迴歸診斷
14.10 模式選擇
15 探索性因素分析
15.1 共同因素模式
15.2 決定因素數目的方法
15.3 因素抽取
15.4 因素轉軸
15.5 EFA 的實例解說與R 的操作
15.6 因素分析APA 報表與結果解釋
16 信度
16.1 α 係數實例解說與R 的操作
16.2 α 係數作為項目分析的議題
序言
1 R 的簡介
1.1 安裝R
1.2 RStudio
1.3 基本的計算
2 R 的資料型態
2.1 基本資料型態
2.2 變項指派
2.3 向量、因素以及列表
2.4 因素向量
2.5 矩陣與資料架構(資料框)
2.6 列表
2.7 資料框
3 資料整理
3.1 安裝與載入tidyverse 套件
3.2 dplyr 套件常用函數
3.3 選擇變項
3.4 篩選觀察值
3.5 新增衍生變數
3.6 依照變數排序觀測值
3.7 聚合變數(總結或概括)
3.8 依照類別變數分組
4 繪圖
4.1 ggplot2 套件繪圖簡介
4.2 基本步驟:用ggplot() 準備畫布
4.3 ...