前言
第1章 回歸分析 1
1.1 回歸模型 1
1.1.1 一般形式及假設 1
1.1.2 線性模型及參數的小二乘估計 1
1.1.3 小二乘估計的性質 3
1.1.4 線性模型的顯著性檢驗 6
1.1.5 不符合回歸模型假設的兩種情況 8
1.2 回歸診斷 11
1.2.1 強影響點 11
1.2.2 異常點 12
1.2.3 多重共線性 14
1.3 有偏估計 15
1.3.1 Stein估計 15
1.3.2 嶺估計 16
1.3.3 Liu估計 16
1.3.4 主成分估計 17
1.3.5 正回歸 18
1.4 回歸分析實例 18
1.4.1 數據的收集與預處理 18
1.4.2 建立多元線性回歸模型 19
1.4.3 模型的檢驗 19
1.4.4 正回歸 23
第2章 變數選擇 25
2.1 傳統變數選擇方法 25
2.1.1 變數選擇標準 25
2.1.2 逐步回歸 26
2.1.3 傳統變數選擇R函數 27
2.2 現代變數選擇方法 27
2.2.1 約束估計 27
2.2.2 平滑調整估計 28
2.2.3 彈性約束估計 29
2.2.4 相關平滑調整估計 29
2.2.5 非負約束估計 30
2.2.6 分組約束估計 31
2.2.7 變數選擇常用R函數 33
2.3 變數選擇實例 36
2.3.1 傳統變數選擇法 36
2.3.2 現代變數選擇法 37
第3章 時間序列 40
3.1 基本概念 40
3.1.1 概率分佈族及其特徵 40
3.1.2 平穩時間序列 42
3.1.3 平穩時間序列的一些性質 42
3.2 平穩時間序列分析 43
3.2.1 平穩性檢驗 43
3.2.2 純隨機性檢驗 44
3.2.3 自回歸移動平均模型 45
3.2.4 Green函數與逆函數 45
3.2.5 ARMA(p,q)模型的建模 46
3.3 非平穩時間序列的確定性分析 48
3.3.1 趨勢擬合法 49
3.3.2 平滑法 49
3.4 非平穩時間序列的隨機分析 50
3.4.1 求和自回歸移動平均模型 50
3.4.2 條件異方差模型 51
3.5 門限自回歸模型 53
3.6 時間序列分析實例 54
第4章 非參數統計 58
4.1 次序統計量及分位數估計 58
4.1.1 次序統計量 58
4.1.2 分位數估計 59
4.2 U統計量 61
4.2.1 單樣本U統計量 61
4.2.2 兩樣本U統計量 65
4.3 秩檢驗 66
4.3.1 線性秩統計量 67
4.3.2 符號秩檢驗 72
4.3.3 非參數檢驗 74
4.4 相關分析 76
4.4.1 Spearman秩相關檢驗 76
4.4.2 Kendall-tau相關檢驗 78
4.4.3 多變數Kendall協同係數檢驗 78
4.5 非參數回歸 79
4.5.1 核光滑 80
4.5.2 局部多項式光滑 81
4.5.3 樣條光滑 82
4.5.4 可加模型與部分線性可加模型 82
4.6 非參數實例 83
4.6.1 非參數檢驗 83
4.6.2 非參數回歸 84
4.6.3 可加模型和部分線性可加模型 85
第5章 聚類分析 95
5.1 相似性度量 95
5.1.1 樣本的相似性度量 95
5.1.2 類與類間的相似性度量 97
5.2 系統聚類法 98
5.3 變數聚類法 99
5.3.1 變數相似性度量 99
5.3.2 變數聚類 100
5.4 動態聚類法 100
5.5 EM聚類 101
5.6 主成分聚類法 102
5.6.1 主成分聚類 102
5.6.2 加權主成分聚類 103
5.6.3 一種加權主成分距離的聚類分析方法 103
5.6.4 加權主成分蘭氏距離的定義 104
5.7 聚類分析實例 104
5.7.1 評價指標 105
5.7.2 傳統聚類分析 105
5.7.3 主成分聚類分析 107
第6章 判別分析 111
6.1 距離判別 111
6.1.1 兩總體情況 111
6.1.2 多總體情況 113
6.2 費希爾判別 113
6.3 貝葉斯判別 114
6.3.1 誤判概率與誤判損失 115
6.3.2 兩總體的貝葉斯判別 116
6.3.3 多總體的貝葉斯判別 118
6.4 穩健的稀疏判別 119
6.5 判別分析實例 121
第7章 邏輯斯諦回歸與支援向量機 123
7.1 邏輯斯諦回歸 123
7.1.1 二分類問題 123
7.1.2 多分類問題 124
7.1.3 順序類別問題 125
7.2 支持向量機 126
7.2.1 硬間距SVM模型 126
7.2.2 軟間距SVM模型 129
7.2.3 非線性SVM模型 129
7.3 邏輯斯諦回歸與支援向量實例 131
7.3.1 邏輯斯諦回歸實例 132
7.3.2 支援向量實例 133
第8章 主成分分析 135
8.1 主成分 135
8.1.1 基本思想 135
8.1.2 樣本主成分 137
8.1.3 特徵值因數的篩選 139
8.2 稀疏主成分分析 140
8.3 主成分分析實例 142
第9章 因數分析 152
9.1 因數分析模型 152
9.1.1 因數旋轉 153
9.1.2 因數得分 155
9.2 稀疏因數分析模型 156
9.3 因數分析實例 157
第10章 縱向數據分析 164
10.1 縱向數據 164
10.2 縱向數據線性模型 165
10.3 廣義線性模型 169
10.3.1 廣義線性模型的定義 169
10.3.2 廣義線性模型中的參數估計 170
10.4 邊際模型 172
10.5 縱向數據分析實例 175
附錄A 翻轉課堂案例彙編 178
A.1 案例1:數據視覺化的探索 178
A.1.1 摘要 178
A.1.2 改進措施 178
A.1.3 數據來源和採集時間 178
A.1.4 程式分析結果 178
A.1.5 結論和展望 180
A.2 案例2:函數型數據的聚類分析 180
A.2.1 摘要 180
A.2.2 改進措施 180
A.2.3 數據來源和採集時間 180
A.2.4 程式分析結果 180
A.2.5 結論和展望 181
A.3 案例3:基於SCAD懲罰的SFPLR-Logistic模型 181
A.3.1 摘要 181
A.3.2 改進措施 182
A.3.3 數據來源和採集時間 182
A.3.4 程式分析結果 182
A.3.5 結論和展望 183
A.4 案例4:基於稀疏主成分的關鍵字提取 183
A.4.1 摘要 183
A.4.2 改進措施 183
A.4.3 數據來源和採集時間 183
A.4.4 程式分析結果 183
A.4.5 結論和展望 185
A.5 案例5:基於稀疏主成分的強影響點診斷 185
A.5.1 摘要 185
A.5.2 改進措施 186
A.5.3 數據來源和採集時間 186
A.5.4 程式分析結果 186
A.5.5 結論和展望 187
A.6 案例6:高維多重共線性問題 187
A.6.1 摘要 187
A.6.2 改進措施 187
A.6.3 數據來源和採集時間 188
A.6.4 程式分析結果 188
A.6.5 結論和展望 189
附錄 BR應用程式 190
參考文獻 191