統計學描繪了一套包括觀察事物現象、收集測量資料、處理所得資料的體系,是指導我們進行資料分析的優秀的方法論;而新的統計分析軟體的出現,為我們把這套方法應用到實際生活中提供了極大的便利。把統計分析方法和電腦結合起來的較好範例就是SPSS,它既適用於對資料分析感興趣的初級使用者,也適用於不同領域的統計分析專家。
本書是一本實用的參考手冊,對於讀者關心的各種模型參數含義及其設置方法,力求講解詳盡;從軟體操作步驟到行業案例分析,都配有圖形指示和樣本資料實例分析;對於數理統計和分析方法的相關背景,書中做簡單鋪陳後,給出演算法的基本思想或關鍵步驟,重點介紹軟體操作方法和參數設置,讀者可以透過本書理解和應用相關統計方法的目的;若讀者參考有關統計分析的專業書籍或不同背景知識的書籍,再加上不斷的操作演練和實踐,就能做更深入的演算法改進、應用創新等研究性工作。
本書適合對資料分析感興趣的初級使用者,也適用於不同領域的統計分析專家。
作者序
前言
統計學描繪了一套包括觀察事物現象、收集測量資料、處理所得資料的體系,是指導我們進行資料分析的優秀的方法論;而新的統計分析軟體的出現,為我們把這套方法應用到實際生活中提供了極大的便利。把統計分析方法和電腦結合起來的較好範例就是SPSS,它既適用於對資料分析感興趣的初級使用者,也適用於不同領域的統計分析專家。
在資料採集、機器學習、智慧決策等領域欣欣向榮的同時,SPSS 軟體也積極跟進、不斷發展。2009 年7 月,IBM 宣佈收購SPSS, 優秀的統計分析軟體SPSS 結合IBM 的資源優勢,必將為用戶提供更加實用的分析體驗。隨後推出的IBM SPSSStatistics 18.0 和19.0,其操作友善性、模型可靠性和與其他平臺的相容性等,都有了
非常大的提升。
與SPSS 15.0 相比,SPSS 19.0 增加了許多新的功能:增加了拔靴法(Bootstrapping)、直銷(Direct Marketing)等模組,極大地方便了分析專家和市場研究人士應用相關功能;新模組IBM SPSS Statistics Developer 使SPSS 可以與R 軟體合作;增加了部分更新的分析方法(廣義線性模式,Generalized linear model)和報告方式(輕量表);對於從外部來源讀取的資料以及在會話中創建的新變數,改進了確定其默認測量級別的方法;增強的語法編輯器,可將編輯器視窗拆分為上下兩個,支援語法加亮和自動完成等功能;加入支持salesforce.com 的資料庫驅動程式;改進了軟體架構和性能,如樞紐
表的顯示效果與交互性能、描述性分析過程的性能等。
本書是一本實用的參考手冊,對於讀者關心的各種模型參數含義及其設置方法,力求講解詳盡;從軟體操作步驟到行業案例分析,都配有圖形指示和樣本資料實例分析;對於數理統計和分析方法的相關背景,書中做簡單鋪陳後,給出演算法的基本思想或關鍵步驟,重點介紹軟體操作方法和參數設置,讀者可以透過本書理解和應用相關統計方法的目的;若讀者參考有關統計分析的專業書籍或不同背景知識的書籍,再加上不斷的操作演練和實踐,就能做更深入的演算法改進、應用創新等研究性工作。
由於編寫水準有限,統計理論和軟體的發展非常迅速,書中難免會存在紕漏和不足之處,懇請廣大讀者提出批評與指正,我們真誠希望與大家相互交流,共同進步。
前言
統計學描繪了一套包括觀察事物現象、收集測量資料、處理所得資料的體系,是指導我們進行資料分析的優秀的方法論;而新的統計分析軟體的出現,為我們把這套方法應用到實際生活中提供了極大的便利。把統計分析方法和電腦結合起來的較好範例就是SPSS,它既適用於對資料分析感興趣的初級使用者,也適用於不同領域的統計分析專家。
在資料採集、機器學習、智慧決策等領域欣欣向榮的同時,SPSS 軟體也積極跟進、不斷發展。2009 年7 月,IBM 宣佈收購SPSS, 優秀的統計分析軟體SPSS 結合IBM 的資源優勢,必將為用戶提供更加實用的分析體驗...
目錄
01 SPSS 19.0 概述
1.1 SPSS 簡介
1.2 SPSS 的安裝、啟動和結束
1.2.1 SPSS 19.0 的安裝
1.2.2 SPSS 19.0 的啟動
1.2.3 SPSS 19.0 的結束
1.3 SPSS 19.0 的介面及設定
1.3.1 常用介面
1.3.2 一般選項參數
1.3.3 瀏覽器選項參數
1.3.4 檔案位置選項參數
1.3.5 輸出選項參數
1.3.6 圖表選項參數
1.3.7 多個插補選項參數
1.3.8 樞軸表選項參數
1.3.9 資料選項參數
1.3.10 貨幣選項參數
1.3.11 程式檔選項參數
1.3.12 語法編輯器選項參數
02 資料檔案的建立與操作
2.1 資料編輯器與資料檔案
2.1.1 資料編輯器
2.1.2 資料檔案
2.2 常數、變數、操作符號和運算式
2.2.1 常數與變數
2.2.2 操作符號與運算式
2.2.3 如何定義一個變數
2.2.4 機率事件
2.3 輸入資料
2.3.1 輸入資料的方法
2.3.2 查看檔案資訊和變數資訊
2.4 編輯資料檔案
2.4.1 在儲存格中編輯資料
2.4.2 插入變數與刪除變數
2.4.3 插入觀察值與刪除觀察值
2.4.4 資料的剪下、複製和貼上
2.4.5 復原操作
2.5 對資料檔案的操作
2.5.1 資料檔案的開啟與儲存
2.5.2 資料庫檔的轉換
習題2
03資料檔案的操作
3.1 資料檔案的一般操作
3.1.1 數據排序
3.1.2 資料檔案的分割
3.1.3 資料檔案的合併
3.1.4 資料檔案的轉置
3.1.5 變數值的排序
3.1.6 變數值的重新編碼
3.1.7 計算新變數
3.2 分類整合
3.2.1 資料描述
3.2.2 分類整合的參數設定
3.2.3 分類整合的結果
3.3 觀察值的加權
3.4 資料檔案的結構重組
3.4.1 選擇資料重組方式
3.4.2 變數組到觀察值組的重組
3.4.3 觀察值組到變數組的重組
3.4.4 轉置重組
習題3
04基本統計分析功能
4.1 OLAP 線上分析過程
4.1.1 資料描述
4.1.2 OLAP 過程的操作和設定
4.2 觀察值摘要分析
4.2.1 觀察值摘要分析的參數設定
4.2.2 輸出結果
4.3 按列和欄的摘要分析
4.3.1 按列摘要過程
4.3.2 按欄摘要分析過程
4.4 次數分析
4.4.1 資料描述
4.4.2 對分類變數的次數分析
4.4.3 對連續變數的次數分析
4.5 描述性統計分析
4.5.1 資料描述
4.5.2 描述分析過程
4.6 探索性分析過程
4.6.1 資料描述
4.6.2 探索分析實例
4.7 列聯表分析過程
4.7.1 資料描述
4.7.2 列聯表分析的參數設定
4.7.3 列聯表分析的輸出結果
4.8 自助法(拔靴法,Bootstrap)簡介與設定
4.8.1 Bootstrap 簡介
4.8.2 Bootstrap 參數設定
習題4
05 平均數比較和T 檢定
5.1 平均數分析過程
5.1.1 原理與方法
5.1.2 SPSS 實例分析
5.2 單一樣本T 檢定
5.2.1 原理與方法
5.2.2 SPSS 實例分析
5.3 獨立樣本T 檢定
5.3.1 原理與方法
5.3.2 SPSS 實例分析
5.4 配對樣本T 檢定
5.4.1 原理與方法
5.4.2 SPSS 實例分析
習題5
06 無母數檢定
6.1 無母數檢定的簡介
6.1.1 無母數檢定與有母數檢定
6.1.2 無母數檢定的優點
6.1.3 無母數檢定的缺點
6.2 卡方檢定
6.2.1 原理與方法
6.2.2 資料和問題描述
6.2.3 卡方檢定實例分析
6.3 二項式檢定
6.3.1 原理與方法
6.3.2 資料和問題描述
6.3.3 二項檢定實例分析
6.4 連檢定
6.4.1 原理與方法
6.4.2 資料和問題描述
6.4.3 連檢定實例分析
6.5 Kolmogorov-Smirnov 單樣本檢定
6.5.1 原理與方法
6.5.2 資料和問題描述
6.5.3 K-S 單樣本檢定實例分析
6.6 兩獨立樣本檢定
6.6.1 原理與方法
6.6.2 資料和問題描述
6.6.3 兩獨立樣本檢定實例分析
6.7 k 個獨立樣本的檢定
6.7.1 原理與方法
6.7.2 資料和問題描述
6.7.3 k 個獨立樣本檢定實例分析
6.8 兩個相關樣本的檢定
6.8.1 原理與方法
6.8.2 資料和問題描述
6.8.3 兩個相關樣本檢定的實例分析
6.9 k 個相關樣本的檢定
6.9.1 原理與方法
6.9.2 資料和問題描述
6.9.3 k 個相關樣本檢定的實例分析
習題6
07 多重反應分析
7.1 多重反應概述
7.2 多重反應變數集的定義
定義多重反應變數集的實例
7.3 多重反應變數集的次數分析
多重反應變數次數分析的實例
7.4 多重反應變數集的交叉表分析
多重反應變數交叉表分析的實例
7.5 用表格過程研究多重反應變數集
7.5.1 多重反應變數集的定義
7.5.2 建立包含多重反應變數集的表格
習題7
08 迴歸分析
8.1 線性迴歸
8.1.1 簡單線性迴歸的基本原理
8.1.2 多元線性迴歸的基本原理
8.1.3 模型假設的其他檢定
8.1.4 問題描述和資料準備
8.1.5 線性迴歸分析的設定和操作
8.1.6 觀察值的結果分析
8.2 曲線迴歸
8.2.1 曲線迴歸的基本原理
8.2.2 問題描述和資料準備
8.2.3 曲線迴歸分析的設定和操作
8.2.4 觀察值的結果分析
8.3 非線性迴歸
8.3.1 非線性迴歸簡介
8.3.2 問題描述和資料準備
8.3.3 非線性迴歸的參數設定
8.3.4 觀察值的結果分析
8.4 二元Logistic 迴歸
8.4.1 二元Logistic 迴歸的數學原理
8.4.2 問題描述和資料準備
8.4.3 二元Logistic 迴歸的參數設定
8.4.4 觀察值的結果分析
8.5 多項式Logistic 迴歸分析
8.5.1 多項式Logistic 迴歸的原理簡介
8.5.2 問題描述和資料準備
8.5.3 多項式Logistic 迴歸參數設定
8.5.4 觀察值的結果分析
8.6 次序迴歸
8.6.1 問題描述和資料準備
8.6.2 次序迴歸的參數設定
8.6.3 觀察值的結果分析
8.7 機率單位迴歸分析
8.7.1 機率單位迴歸分析簡介
8.7.2 問題描述和資料準備
8.7.3 機率單位迴歸的參數設定
8.7.4 觀察值的結果分析
8.8 加權迴歸分析
8.8.1 加權迴歸分析簡介
8.8.2 問題描述和資料準備
8.8.3 加權迴歸的參數設定
8.8.4 觀察值結果分析
8.9 二階段最小平方迴歸
8.9.1 二階段最小平方迴歸的基本原理
8.9.2 問題描述和資料準備
8.9.3 二階段最小平方迴歸的參數設定
8.9.4 觀察值的結果分析
8.10 最適尺度迴歸
8.10.1 最適尺度迴歸原理
8.10.2 問題描述和資料準備
8.10.3 最適尺度迴歸的參數設定
8.10.4 觀察值的結果分析
習題8
09變異數分析
9.1 變異數分析簡介
9.1.1 t 檢定與變異數分析的比較
9.1.2 變異數分析的基本原理
9.2 單因子變異數分析
9.2.1 原理與方法
9.2.2 單因子變異數分析實例
9.3 多因子變異數分析過程
9.3.1 原理與方法
9.3.2 二因子變異數分析實例
9.3.3 共變數分析實例
9.3.4 交互作用效果中隨機因子的分析
9.4 多變量變異數分析
9.4.1 原理與方法
9.4.2 多變量變異數分析實例
9.5 重複測量設計的變異數分析
9.5.1 原理與方法
9.5.2 SPSS 實例分析
9.6 變異成分分析
9.6.1 原理簡介
9.6.2 SPSS 實例分析
9.7 正交實驗設計
9.7.1 正交實驗設計簡述
9.7.2 SPSS 實例分析
9.7.3 正交實驗設計的變異數分析
習題 9
0 相關分析
10.1 相關分析的基本概念
10.1.1 相關分析的特點和應用
10.1.2 相關係數的計算
10.1.3 SPSS 提供的相關分析功能
10.2 雙變量相關分析
10.2.1 問題描述和資料準備
10.2.2 相關分析的參數設定
10.2.3 觀察值的結果分析
10.3 偏相關分析
10.3.1 偏相關分析的基本原理
10.3.2 偏相關分析實例
10.4 距離分析
10.4.1 距離分析的基本概念
10.4.2 距離分析的參數設定
10.4.3 距離分析實例
習題10
11 因素分析
11.1 因素分析的原理簡介
11.1.1 因素分析的基本思想
11.1.2 因素分析和主成分分析的聯繫
11.1.3 因素分析的基本步驟
11.2 SPSS 因素分析的應用實例
11.2.1 資料描述
11.2.2 SPSS 因素分析過程的設定
11.2.3 結果分析
習題11
12 集群分析
12.1 集群分析的原理簡介
12.1.1 集群分析的基本概念
12.1.2 集群分析的一般原理
12.2 快速樣本集群過程
12.2.1 快速集群簡介
12.2.2 問題描述和資料準備
12.2.3 SPSS 快速集群的設定
12.2.4 觀察值的結果分析
12.3 階層集群
12.3.1 階層集群簡介
12.3.2 問題描述和資料準備
12.3.3 SPSS 階層集群的設定
12.3.4 觀察值的結果分析
12.3.5 對集群結果的進一步分析
12.4 兩步集群分析
12.4.1 兩步集群簡介
12.4.2 問題描述和資料準備
12.4.3 SPSS 兩步集群的設定
12.4.4 觀察值的結果分析
12.5 一般區別分析
12.5.1 區別分析的基本原理
12.5.2 問題描述和資料準備
12.5.3 區別分析的參數設定
12.5.4 觀察值的結果分析
12.6 逐步區別分析實例
12.6.1 問題描述和資料準備
12.6.2 逐步區別的參數設定
12.6.3 觀察值的結果分析
12.7 決策樹分析
12.7.1 決策樹分類的基本原理
12.7.2 決策樹過程的參數設定
12.7.3 問題描述和資料準備
12.7.4 觀察值分析
習題12
13存活分析
13.1 存活分析簡介
13.1.1 存活分析的基本概念
13.1.2 存活分析的資料特性
13.1.3 存活分析的常用方法
13.1.4 SPSS 中的存活分析過程
13.2 生命表分析
13.2.1 生命表分析簡介
13.2.2 生命表分析的基本步驟
13.2.3 生命表實例分析
13.3 Kaplan-Meier 分析
13.3.1 Kaplan-Meier 分析的步驟
13.3.2 存活曲線的比較和檢定
13.3.3 Kaplan-Meier 分析的實例
13.4 Cox 迴歸模型
13.4.1 Cox 迴歸模型的原理簡介
13.4.2 Cox 迴歸實例分析
習題13
14 信度分析
14.1 信度分析
14.1.1 信度分析的基本原理
14.1.2 問題描述和資料準備
14.1.3 信度分析的參數設定
14.1.4 觀察值的結果分析
14.2 多元尺度分析
14.2.1 多元尺度分析簡介
14.2.2 問題描述和資料準備
14.2.3 ALSCAL 過程的參數設定
14.2.4 觀察值的結果分析
習題14
15 時間序列分析
15.1 SPSS 的時間序列分析概覽
15.1.1 建立模型的通用設定選項
15.1.2 套用模式的通用設定選項
15.2 時間序列資料的事前分析
15.2.1 遺漏值置換
15.2.2 定義日期變數
15.2.3 時間序列的平穩化
15.3 指數平滑模型
15.3.1 指數平滑的基本原理
15.3.2 指數平滑模型的參數設定
15.3.3 指數平滑模型實例分析
15.4 ARIMA 模型
15.4.1 ARIMA 模型的基本原理
15.4.2 ARIMA 模型的參數設定
15.4.3 ARIMA 模型實例分析
15.5 週期性分解模型
15.5.1 週期性分解法概述
15.5.2 週期性分解模型實例分析
習題15
16 對數線性模型
16.1 對數線性模型概述
16.1.1 簡單列聯表分析的不足
16.1.2 對數線性模型的基本形式
16.2 一般對數線性模型過程
16.2.1 一般過程概述
16.2.2 問題描述和資料準備
16.2.3 一般過程的參數設定
16.2.4 觀察值的結果分析
16.3 Logit 過程
16.3.1 Logit 過程概述
16.3.2 問題描述和資料準備
16.3.3 Logit 過程的參數設定
16.3.4 觀察值的結果分析
16.4 模型選擇過程
16.4.1 模型選擇過程概述
16.4.2 問題描述和資料準備
16.4.3 層次對數線性模型的操作過程
16.4.4 觀察值的結果分析
習題16
17 對應分析
17.1 對應分析的基本原理
17.1.1 對應分析與因素分析
17.1.2 SPSS 中的對應分析
17.1.3 使用對應分析的注意事項
17.2 簡單對應分析
17.2.1 簡單對應分析的數學原理
17.2.2 SPSS 簡單對應分析實例
17.3 多元對應分析
17.3.1 多元對應分析基本概念及其特性
17.3.2 多元對應分析的參數設定
17.3.3 實例的結果分析
習題17
18 遺漏值分析
18.1 遺漏值分析的概念
18.1.1 遺漏值的表現方式
18.1.2 SPSS 中的遺漏值處理方法
18.2 遺漏值分析的參數設定
18.3 遺漏值分析的實例
習題18
19 統計圖形
19.1 概述
19.1.1 資料和變數的準備
19.1.2 圖表建立器的基本操作
19.1.3 歷史對話記錄作圖
19.1.4 圖形的編輯
19.2 長條圖
19.2.1 資料和問題描述
19.2.2 用圖表建立器作長條圖
19.2.3 用歷史對話記錄建立長條圖
19.3 線型圖
19.3.1 資料和問題描述
19.3.2 用圖表建立器作線型圖
19.3.3 用歷史對話記錄建立線型圖
19.4 面積圖
19.4.1 資料和問題描述
19.4.2 用圖表建立器作面積圖
19.4.3 用歷史對話記錄建立面積圖
19.5 圓餅圖
19.5.1 資料和問題描述
19.5.2 用圖表建立器作圓餅圖
19.5.3 用歷史對話記錄建立圓餅圖
19.6 高低圖
19.6.1 資料和問題描述
19.6.2 用圖表建立器作高低圖
19.6.3 用歷史對話記錄建立高低圖
19.7 柏拉圖
19.7.1 資料和問題描述
19.7.2 用對話方塊建立柏拉圖
19.8 控制圖
19.8.1 資料和問題描述
19.8.2 用對話方塊建立控制圖
19.9 箱型圖
19.9.1 資料和問題描述
19.9.2 用圖表建立器作箱型圖
19.9.3 用歷史對話記錄建立箱型圖
19.10 誤差條圖
19.10.1 資料和問題描述
19.10.2 用歷史對話記錄建立誤差條圖
19.11 散佈圖
19.11.1 資料和問題描述
19.11.2 用圖表建立器作散佈圖
19.11.3 用歷史對話記錄建立散佈圖
19.12 直方圖
19.12.1 資料和問題描述
19.12.2 用圖表建立器作直方圖
19.13 P-P 機率圖
19.13.1 資料和問題描述
19.13.2 用對話方塊建立P-P 機率圖
19.14 Q-Q 機率圖
19.14.1 資料和問題描述
19.14.2 用對話方塊建立Q-Q 機率圖
19.15 時間序列圖
19.15.1 普通序列圖
19.15.2 自相關序列圖
19.15.3 互相關序列圖
19.16 雙軸線型圖
19.16.1 資料和問題描述
19.16.2 用圖表建立器作雙軸線型圖
習題19
20 上市公司財務危機預警分析
20.1 財務危機預警的應用簡介
20.1.1 財務危機的定量定義方法
20.1.2 財務危機預警的模型選擇
20.2 資料描述
20.2.1 資料說明
20.2.2 指標選擇
20.2.3 補充說明
20.3 分析方法概述
20.3.1 區別分析
20.3.2 logistic 迴歸方法
20.4 SPSS 建模過程和結論分析
20.4.1 SPSS 資料篩選操作
20.4.2 SPSS 區別分析建模與分析
20.4.3 logistic 迴歸建模與分析
20.5 進一步的分析與應用
20.5.1 分類結果的應用分析
20.5.2 建模方法的改進
20.6 建議和推廣
20.6.1 時間序列研究
20.6.2 資料的有效預警期
20.6.3 指標的簡化方法
21 影響匯率的因素分析
21.1 匯率影響因素的簡介
21.2 資料描述
21.3 分析方法概述
21.3.1 探索性分析
21.3.2 多元迴歸分析
21.4 SPSS 建模過程和結論分析
21.4.1 數據準備
21.4.2 探索性分析
21.4.3 多元迴歸分析
21.5 進一步的分析與應用
21.5.1 剔除存在共線性的外匯儲備變數
21.5.2 迴歸模型的進一步改善
21.5.3 兩個迴歸模型的比較
21.6 建議和推廣
21.6.1 時間序列研究
21.6.2 匯率影響因素的定性分析
22 因素分析在成績綜合評價中的應用
22.1 學生成績的綜合評價簡介
22.2 資料描述
22.3 分析方法概述
22.3.1 應用因素分析進行成績綜合評價的步驟
22.3.2 應用因素分析法進行成績綜合評價的注意事項
22.4 SPSS 建模過程和結論分析
22.4.1 數據準備
22.4.2 SPSS 因素分析建模與分析
22.5 進一步的分析與應用
22.6 建議和推廣
22.6.1 高中生的成績綜合評價
22.6.2 對遺漏資料的處理
22.6.3 多種方法結合的綜合評價模型
23高等教育辦學條件的集群分析
23.1 資料描述
23.1.1 關於基本辦學條件指標合格與否的判定
23.1.2 指標選取
23.1.3 資料格式
23.2 集群分析法簡述
23.3 SPSS 建模過程和結論分析
23.3.1 對專科院校進行集群的設定操作
23.3.2 對本科院校的分析
23.4 建議和推廣
24 試卷信度的檢定與分析
24.1 試卷信度檢定的背景簡介
24.1.1 測驗內容的自身方面
24.1.2 施測過程
24.1.3 受試者的自身因素
24.2 資料描述
24.3 分析方法概述
24.3.1 試卷信度的基本計算公式
24.3.2 試卷信度的估計方法
24.4 SPSS 建模過程和結論分析
24.4.1 SPSS 信度分析的參數設置
24.4.2 結果分析
24.5 建議和推廣
25 多因素試驗的設計與分析
25.1 試驗設計簡介
25.1.1 試驗設計的應用
25.1.2 試驗設計問題的解決步驟
25.2 資料描述
25.3 分析方法概述
25.3.1 正交設計方法
25.3.2 綜合評分方法
25.4 SPSS 建模過程和結論分析
25.4.1 數據標準化
25.4.2 性能指標權重的確定
25.4.3 利用權重求綜合指標
25.4.4 對綜合得分的進一步分析
25.5 建議和推廣
習題提示
01 SPSS 19.0 概述
1.1 SPSS 簡介
1.2 SPSS 的安裝、啟動和結束
1.2.1 SPSS 19.0 的安裝
1.2.2 SPSS 19.0 的啟動
1.2.3 SPSS 19.0 的結束
1.3 SPSS 19.0 的介面及設定
1.3.1 常用介面
1.3.2 一般選項參數
1.3.3 瀏覽器選項參數
1.3.4 檔案位置選項參數
1.3.5 輸出選項參數
1.3.6 圖表選項參數
1.3.7 多個插補選項參數
1.3.8 樞軸表選項參數
1.3.9 資料選項參數
1.3.10 貨幣選項參數
1.3.11 程式檔選項參數
1.3.12 語法編輯器選項參數
02 資料檔案的建立與操作
2.1 資料編輯器與資料檔案
2.1.1 資料編輯器
2.1.2 資...