本書特色
•注重統計思維和方法應用。
強調對統計思維的理解和方法應用,並以實際案例引出學習內容及目標。
•使用R完成計算和分析。
本書所有例題皆以R完成計算及分析,以便讀者瞭解R語言的功能和特點。
•注重統計方法之間的邏輯。
以圖解方式展示各章內容,方便讀者清楚掌握統計方法間的融會貫通。
統計學是一門資料分析的學科,被廣泛應用於生產、生活和科學研究的各個領域。在電腦和網際網路普及的今天,統計軟體的使用,不僅促進了統計科學的發展,也使統計學習發生了革命性的變化。當我們把計算交給電腦「秒殺」的時候,就能有更多的時間去理解統計方法的原理,就會發現統計學習和應用並不困難。
R語言是一款統計計算語言,它有許多優點,包括:
1.比起大多數的統計軟體,R是免費的。
2.更新速度快,包含很多最新方法,使用上更靈活。
3.提供豐富的資料分析技術,功能十分強大。
4.多樣化的繪圖功能,有助於對資料進行視覺化分析。
由於R的強大功能及使用上的靈活性,在實際工作及科學研究上,已逐漸成為資料分析的主流。
作者簡介:
賈俊平
現任
中國人民大學統計學院副教授
學歷
中國人民大學統計學碩士
著作
《統計分析與R》(五南)
《統計學》(中國人民大學)
《統計學基礎》(中國人民大學)
《應用統計學》(中國人民大學)
《統計學—基於SPSS》(中國人民大學)
《統計學—基於R》(中國人民大學)
《描述統計》(中國人民大學)
《數據建模與決策》(中國人民大學)
《工商管理統計》(當代中國)
《市場調查與分析》(中國統計)
審核者簡介
陳正昌
現任
國立屏東大學教育學系副教授
學歷
國立政治大學教育學博士
著作
《統計分析與R》(五南)
《SPSS與統計分析》(五南)
《Minitab與統計分析》(五南)
《多變量分析方法》(五南)
《基礎統計學》(鼎茂)
《行為及社會科學統計學》(復文)
《量化研究與統計分析》(新學林)
作者序
統計學是一門資料分析學科,已被廣泛應用於生產、生活和科學研究的各個領域。但在電腦時代到來前,由於計算問題使統計學的應用受到極大限制,很多人也由於計算問題對統計學望而卻步。然而,在電腦和網際網路普及的今天,尤其是統計軟體的使用,不僅促進了統計科學的發展,也使得統計學習發生了革命性的變化。軟體的使用,讓我們從繁雜的統計計算中解脫出來,從而有更多的時間去理解統計方法的原理。當我們把繁雜的計算交給電腦「秒殺」的時候,就會發現統計的學習和應用並不困難。R是一種優秀的免費統計軟體,不僅提供了豐富的資料分析技術,功能十分強大,而且與多數統計軟體相比,R的更新速度快,使用更靈活,包含很多最新方法。同時,對於自己開發的一些新的統計模型,也可以很方便地在R中設計程式求解。由於R的強大功能和使用上的靈活性,在實際工作與科學研究的很多領域被越來越多的人使用。可以說,R已逐漸成為資料分析軟體的主流。
●本書概要
本書是一本基於R完成全部例題計算和分析的統計學教材,全書內容共11章。第2章和第3章介紹資料的描述性分析方法,包括圖表的使用和常用統計量的計算與分析方法。第4章至第6章介紹統計推論的基本原理和方法,包括作為推論理論基礎的機率分配及參數估計和假設檢定。第7章至第11章是實際中常用的一些統計方法,包括類別變數分析、變異數分析、迴歸分析和時間序列預測等。
●本書特色
本書有以下特點:
使用R完成計算和分析。本書所有例題的計算與分析,均由R軟體(3.2.3版本)實現。書中每個例題解答均呈現R的詳細程式和結果,並注重其靈活性和多樣性。對同一資料或變數的分析盡可能使用不同的R程式套件和功能選項,繪製圖形時,盡可能使用不同的函數及參數選擇,以便
讓讀者瞭解R的功能和特點。當然,本書R的應用只是發揮拋磚引玉的作
用,讀者可根據自身分析需要,選擇不同的R程式套件或程式設計,來解
決所面臨的統計分析問題。
注重統計思維和方法應用。本書完全避免統計方法的數學推導,強調
對統計思維的理解和方法應用。每章開頭均展示一個實際案例,引出學習
內容和學習目標。
注重統計方法之間的邏輯。在第1章最後以圖解方式展現了本書的邏輯
架構,其他章的最後均總結了該章的內容架構,以便於讀者把握各章節內
容之間的內在聯繫。
●讀者對象
本書適用的讀者,包括:大學校院統計學專業、經濟管理類專業及部
分理工類、農、林、醫、藥類科系的學生,以及從事資料分析的實際工作
者。
●致謝
本書的出版,首先要感謝屏東大學教育系的陳正昌教授,他對書中統
計術語及其他文字的表述認真校對,付出心力。其次要感謝五南圖書出版
公司張毓芬副總編輯與侯家嵐主編對本書出版給予的大力支持。
賈俊平
2016年12月
中國人民大學統計學院‧北京
統計學是一門資料分析學科,已被廣泛應用於生產、生活和科學研究的各個領域。但在電腦時代到來前,由於計算問題使統計學的應用受到極大限制,很多人也由於計算問題對統計學望而卻步。然而,在電腦和網際網路普及的今天,尤其是統計軟體的使用,不僅促進了統計科學的發展,也使得統計學習發生了革命性的變化。軟體的使用,讓我們從繁雜的統計計算中解脫出來,從而有更多的時間去理解統計方法的原理。當我們把繁雜的計算交給電腦「秒殺」的時候,就會發現統計的學習和應用並不困難。R是一種優秀的免費統計軟體,不僅提供了豐富的資料分析技術...
目錄
第1章 資料與統計學
問題與思考:怎樣理解統計結論
1.1 統計學及其應用
1.1.1 什麼是統計學
1.1.2 統計學的應用
1.2 資料及其來源
1.2.1 變數與資料
1.2.2 資料的來源
1.3 R簡介
1.3.1 R的初步使用
1.3.2 資料的錄入、讀入與保存
1.3.3 資料的使用和編輯
1.3.4 資料類型的轉換
1.3.5 函數的編寫
本書圖解:統計方法分類與本書架構
主要術語
思考與練習
第2章 用圖表展示資料
問題與思考:怎樣用圖表看資料
2.1 類別資料的圖表展示
2.1.1 用次數分配表觀察類別資料
2.1.2 用圖形展示類別資料
2.2 數值資料的圖表展示
2.2.1 用次數分配表觀察資料分配
2.2.2 用圖形展示數值資料
2.3 使用圖表的注意事項
本章圖解:資料類型與圖表展示方法
主要術語
思考與練習
第3章 用統計量描述資料
問題與思考:怎樣分析學生的考試成績
3.1 水準的描述
3.1.1 平均數
3.1.2 中位數和分位數
3.1.3 水準代表值的選擇
3.2 差異的描述
3.2.1 全距和四分位距
3.2.2 變異數和標準差
3.2.3 變異係數
3.2.4 標準得分
3.3 分配形狀的描述
3.4 資料的綜合描述
本章圖解:資料分配特徵與描述統計量
主要術語
思考與練習
第4章 隨機變數的機率分配
問題與思考:彩券中獎的機率有多大
4.1 什麼是機率
4.2 隨機變數的機率分配
4.2.1 隨機變數及其概括性量數
4.2.2 隨機變數的機率分配
4.2.3 其他幾個重要的統計分配
4.3 樣本統計量的機率分配
4.3.1 統計量及其分配
4.3.2 樣本平均數的分配
4.3.3 其他統計量的分配
4.3.4 統計量的標準誤差
本章圖解:隨機變數的機率分配
主要術語
思考與練習
第5章 參數估計
問題與思考:科學家做出重大貢獻時的最佳年齡是多少
5.1 參數估計的基本原理
5.1.1 點估計與區間估計
5.1.2 評量估計量的標準
5.2 母體平均數的區間估計
5.2.1 一個母體平均數的估計
5.2.2 兩個母體平均數之差的估計
5.3 母體比例的區間估計
5.3.1 一個母體比例的估計
5.3.2 兩個母體比例之差的估計
5.4 母體變異數的區間估計
5.4.1 一個母體變異數的估計
5.4.2 兩個母體變異數比的估計
5.5 樣本量的確定
5.5.1 估計母體平均數時樣本量的確定
5.5.2 估計母體比例時樣本量的確定
本章圖解:參數估計所使用的分配
主要術語
思考與練習
第6章 假設檢定
問題與思考:你相信飲用水瓶子標籤上的說法嗎
6.1 假設檢定的基本原理
6.1.1 怎樣提出假設
6.1.2 怎樣做出決策
6.1.3 怎樣表述決策結果
6.2 母體平均數的檢定
6.2.1 一個母體平均數的檢定
6.2.2 兩個母體平均數之差的檢定
6.3 母體比例的檢定
6.3.1 一個母體比例的檢定
6.3.2 兩個母體比例之差的檢定
6.4 母體變異數的檢定
6.4.1 一個母體變異數的檢定
6.4.2 兩個母體變異數比的檢定
6.5 非參數檢定
6.5.1 母體分配的檢定
6.5.2 母體位置參數的檢定
本章圖解:假設檢定的內容架構
主要術語
思考與練習
第7章 類別變數分析
問題與思考:網購滿意度與地區有關係嗎
7.1 一個類別變數的適合度檢定
7.1.1 期望次數相等
7.1.2 期望次數不等
7.2 兩個類別變數的獨立性檢定
7.2.1 列聯表與χ2獨立性檢定
7.2.2 應用χ2檢定的注意事項
7.3 兩個類別變數的相關性量數
7.3.1 φ係數和Cramer's V係數
7.3.2 列聯係數
本章圖解:類別變數分析方法75
主要術語
思考與練習
第8章 變異數分析
問題與思考:超市位置和競爭者數量對銷售額有影響嗎
8.1 變異數分析的基本原理
8.1.1 什麼是變異數分析
8.1.2 誤差分解
8.2 單因子變異數分析
8.2.1 數學模型
8.2.2 效果檢定
8.2.3 多重比較
8.3 二因子變異數分析
8.3.1 數學模型
8.3.2 主效果分析
8.3.3 交互效果分析
8.4 變異數分析的假定及其檢定
8.4.1 常態性檢定
8.4.2 變異數同質性檢定
8.5 單因子變異數分析之非參數方法
本章圖解:變異數分析過程
主要術語
思考與練習
第9章 一元線性迴歸
問題與思考:GDP與消費水準有關係嗎
9.1 變數間的關係
9.1.1 確定變數之間的關係
9.1.2 相關關係的描述
9.1.3 關係強度的度量
9.2 一元線性迴歸模型的估計和檢定
9.2.1 一元線性迴歸模型
9.2.2 參數的最小平方估計
9.2.3 模型的適合度
9.2.4 模型的顯著性檢定
9.3 利用迴歸方程進行預測
9.3.1 平均數的信賴區間
9.3.2 個別值的預測區間
9.4 迴歸模型的診斷
9.4.1 殘差與殘差圖
9.4.2 檢定模型假定
本章圖解:一元線性迴歸的建模過程
主要術語
思考與練習
第10章 多元線性迴歸 /367
問題與思考:逾期放款受哪些因素影響
10.1 多元線性迴歸模型
10.1.2 參數的最小平方估計
10.2 適合度和顯著性檢定
10.2.1 模型的適合度
10.2.2 模型的顯著性檢定
10.2.3 模型診斷
10.3 多重共線性及其處理
10.3.1 多重共線性及其識別
10.3.2 變數選擇與逐步迴歸
10.4 相對重要性和模型比較
10.4.1 自變數的相對重要性
10.4.2 模型比較
10.5 利用迴歸方程進行預測
10.6 虛擬變數迴歸
10.6.1 在模型中引入虛擬變數
10.6.2 含有一個虛擬變數的迴歸
本章圖解:多元線性迴歸的建模過程
主要術語
思考與練習
第11章 時間序列預測
問題與思考:如何預測社會消費品零售總額
11.1 時間序列的成分和預測方法
11.1.1 時間序列的成分
11.1.2 預測方法的選擇與評估
11.2 指數平滑預測
11.2.1 指數平滑模型的一般表達
11.2.2 簡單指數平滑預測
11.2.3 Holt指數平滑預測
11.2.4 Winter指數平滑預測
11.3 趨勢外推預測
11.3.1 線性趨勢預測
11.3.2 非線性趨勢預測
11.4 分解預測
本章圖解:時間序列預測的程式和方法
主要術語
思考與練習
附錄 求信賴區間的自助法
各章習題解答
參考文獻
第1章 資料與統計學
問題與思考:怎樣理解統計結論
1.1 統計學及其應用
1.1.1 什麼是統計學
1.1.2 統計學的應用
1.2 資料及其來源
1.2.1 變數與資料
1.2.2 資料的來源
1.3 R簡介
1.3.1 R的初步使用
1.3.2 資料的錄入、讀入與保存
1.3.3 資料的使用和編輯
1.3.4 資料類型的轉換
1.3.5 函數的編寫
本書圖解:統計方法分類與本書架構
主要術語
思考與練習
第2章 用圖表展示資料
問題與思考:怎樣用圖表看資料
2.1 類別資料的圖表展示
2.1.1 用次數分配表觀察類別資料
2.1.2 用圖形展示類別資料
2.2 數值資料的...