本書特色:
◎從統計概念基礎教起,搭配實證範例練習,結合理論與應用性。
◎使用SPSS V25介面操作,從使用者角度整理編排,讓學習過程更輕鬆。
◎本書包含範例分析,讀者可實際操作,快速了解SPSS分析的程序與應用。
◎高等統計適用於生物學、經濟學、市場行銷、工程學、遺傳學、醫學、教育學、心理學、社會科學、生產管理、風險管理、人資管理、航運管理、財務金融、會計和公共衛生等學術領域。
隨書附贈資料檔光碟
一般研究者從事研究時,常有的難題包括:應該採用哪一種統計方法來檢定研究假定及假設?統計程式所輸出的數據所代表的意義為何?又該如何解釋?本書乃針對這些問題,將各種類型的統計方法,以學習者與使用者的觀點歸納整理,並以範例呈現,使讀者在了解統計方法之後能快速學會使用SPSS,做最有效率的統計分析。
本書介紹的高等統計內容,包含統計學回顧、假定的偵測及補救法、勝算比、卡方檢定、邏輯斯迴歸、兩組平均數之比較、獨立樣本變異數分析、重複測量變異數分析、共變數分析、線性迴歸及其診斷、工具變數及兩階段最小平方法。過統計軟體SPSS探討,結合理論、方法與統計從基礎統計知識引導,讀者可以獲得最佳學習效果。
作者簡介:
張紹勳
學歷:國立政治大學資訊管理博士
現任:國立彰化師大專任教授
經歷:致理技術專任副教授
林秀娟
學歷:國立臺灣師範大學教育心理研究所碩士
現職:臺北市立成功高中專任教師
章節試閱
1-1-1 單變量vs. 多變量統計
1. 單變量分布(Univariate):若我們指關心母體的某項特性﹐如產品之抗拉強度、個人滿意度⋯⋯﹐則此母體分布稱為單變量分布。
2. 雙變量分布(Bivariate):若我們關心母體的兩項特性﹐如產品的抗拉強度與重量的關係、個人滿意度與離職意願的因果關係⋯⋯﹐則此母體分布稱為雙變量分布。
3. 多變量分布(MultiVariate):若我們關心母體兩項以上的特性﹐如「產品的抗拉強度、重量與抗壓強度」、「個人滿意度、組識承諾與離職意願的因果關係」,則此母體分布稱為多變量分布。
一、醫學統計經常混淆的名詞
在應用統計分析作學術研究的各個領域中,醫學領域可說是其中的非常大宗,據統計目前全世界約有3 萬種的醫學期刊,約占了科技期刊的四分之一之多。而在這塊這麼大的市場中,我觀察到在醫學領域所使用的統計名詞,經常與統計教科書有相當多的出入,本篇文章擬將這些常見的混淆之處作個釐清。
1. 單變量或多變數迴歸分析
假使我們現在要進行依變數(dependent variable) 的預測,如果我們的自變數(independent variable) 只有一個,那麼這種迴歸模式稱之為簡單迴歸(Simpleregression) ,不過在醫學期刊常見以單變量迴歸(Univariate regression) 來表達;倘若我們的自變數是2 個以上,那麼我們稱之為多元迴歸(Multiple regression),但在醫學期刊則部分稱之為多變數迴歸(Multivariable regression) 或多變量迴歸(Multivariate regression)。特別值得說明的是,「多變量」(Multivariate) 在一般統計教科書是專門指同時有2個以上的依變數的統計方法,例如主成分分析、因素分析、集群分析、結構方程模式、典型相關等;但在醫學領域中,不管依變數有多少個,只要自變數2個以上,就會稱之為多變量分析( 比較正確來說應該是多變數分析) ,這是蠻特別的一點。
2. 自變數、依變數或控制變數
統計教科書皆把依變數定義為dependent variable ,不過實際醫學期刊比較常見以結果變數(outcome) 來稱呼之;如果我們的模式有許多個(2 個以上) 自變數,而所關注的是其中一個變數,那麼此時其他變數便稱作控制變數(Control variable) ,但在醫學期刊的習慣來說,並非主要研究變數的控制變數都叫做共變量(Covariate)。
1-1-1 單變量vs. 多變量統計
1. 單變量分布(Univariate):若我們指關心母體的某項特性﹐如產品之抗拉強度、個人滿意度⋯⋯﹐則此母體分布稱為單變量分布。
2. 雙變量分布(Bivariate):若我們關心母體的兩項特性﹐如產品的抗拉強度與重量的關係、個人滿意度與離職意願的因果關係⋯⋯﹐則此母體分布稱為雙變量分布。
3. 多變量分布(MultiVariate):若我們關心母體兩項以上的特性﹐如「產品的抗拉強度、重量與抗壓強度」、「個人滿意度、組識承諾與離職意願的因果關係」,則此母體分布稱為多變量分布。
一、醫學統計經常混淆的名詞
在應用統...
作者序
SPSS 是社會科學有名的統計軟體,迄今亦在生物醫學大流行。特別是最近幾年,各大學研究生人數逐年大增,基於學位學術撰寫的需要,多變量統計更是不可或缺。
一般研究者從事研究時,常有的難題包括:
(1) 應該採用哪一種統計方法來檢定研究假定(assumptions)及假設(hypothesis)? (2) 如何使用電腦統計程序,以正確且快速的分析研究資料?
(3) 統計程式所輸出的數據所代表的意義為何?又該如何解釋?
筆者在從事研究與教學之際,乃針對此問題,將各種類型的統計方法,以學習者與使用者的觀點歸納整理,並以範例呈現,期使讀者在了解統計方法之後能快速學會使用SPSS,做最有效率的統計分析。
高等統計分析主要應用在:社會科學、生物學(Biology)、經濟學(Economics)、工程學(Engineering)、遺傳學(Genetics)、市場行銷(Marketing)、醫學(Medicine)、精神病學(Psychiatry)、教育學、心理學、人管、生產管理;系所包含:經濟系、風險管理系、航運管理、財務金融、會計、公共衛生、工業工程、土木等。
有鑑於國內統計使用者眾多,可是目前較缺「理論、統計及方法論」系統性的書,加上SPSS v25 市面上鮮少有教科書來介紹新統計功能,於是開始著手撰寫SPSS 統計分析,一系列的書。並附上範例之資料檔供讀者實作:
一、《高等統計:應用SPSS 分析》一書,該書內容包括:描述性統計、樣本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量⋯⋯。
二、《多變量統計之線性代數基礎:應用SPSS 分析》,該書內容包括:平均數之假設檢定、MANOVA)、典型相關分析(canonical correlation analysis)、判別分析(discriminant analysis)、主成分分析、因素分析(factor analysis)、集群分析、多向度量尺/多維標度法。
三、《邏輯斯迴歸分析及離散選擇模型:應用SPSS》一書,該書內容包括:邏輯斯迴歸、Probit 迴歸、多項式邏輯斯迴歸、Ordinal 迴歸、Poisson 迴歸、負二項迴歸⋯⋯。
四、《多層次模型(HLM) 及重複測量:使用SPSS 分析》一書,該書內容包括:線性多層次模型、panel-data 迴歸⋯⋯。
五、《存活分析及ROC:應用SPSS》一書,該書內容包括:類別資料分析(無母數統計)、logistic 迴歸、存活分析、流行病學、配對與非配對病例對照研究資料、勝出比(Odds Ratio)的計算、篩檢工具與ROC 曲線⋯⋯Cox 比例危險模型、Kaplan-Meier 存活模型、參數存活分析有六種模型⋯⋯。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統計概念等,都是實證研究中很重要的內涵,這也是本書撰寫的目的之一。本書內文盡量結合「理論、方法、統計」,期望研究者能在其領域中得到良好的研究成果。
張紹勳 林秀娟 敬上
SPSS 是社會科學有名的統計軟體,迄今亦在生物醫學大流行。特別是最近幾年,各大學研究生人數逐年大增,基於學位學術撰寫的需要,多變量統計更是不可或缺。
一般研究者從事研究時,常有的難題包括:
(1) 應該採用哪一種統計方法來檢定研究假定(assumptions)及假設(hypothesis)? (2) 如何使用電腦統計程序,以正確且快速的分析研究資料?
(3) 統計程式所輸出的數據所代表的意義為何?又該如何解釋...
目錄
Chapter01 統計學回顧
1-1 統計學回顧
1-1-1單變量vs. 多變量統計
1-1-2統計分析法
1-1-3統計公式之重點整理
1-1-4檢定與信賴區間之關係
1-2 常態曲線(normal curve)
1-3 樣本大小的決定(sample size)
1-4 Type I 誤差α 及Type II 誤差β:ROC 圖切斷點的由來
Chapter02 假定(assumption) 的偵測及補救法 5
2-1 自定SPSS 介面( 自己習慣的介面)
2-2 資料分析前之檢查(examining data)
2-2-1散布圖(ggraph 指令):最小平迴歸法錯用的4 情況?
2-2-2直方圖(ggraph 指令)
2-2-3莖葉圖(EXAMINE /plot stemleaf 指令)
2-2-4二個次序變數(vocab、educ) 之散布圖
2-3 假定(assumption) 的偵測及補求法:變數變換(transforming data)
2-3-1用線形圖檢視連續變數是否符合常態性的假定(assumption)
2-3-2曲線關係就違反直線性假定:改用加權(weighted)OLS 迴歸
2-3-3變數變換( 迴歸分析):違反誤差常態性的假定就做log(x) 變換
2-3-4 ANOVA:盒形圖發現變異數異質性:改用Welch 法
Chapter03 勝算比(odds ratio)、卡方檢定、Logistic迴歸 3-1 適用條件
3-2 卡方檢定:關聯性分析
3-2-1 卡方檢定之介紹
3-2-2 卡方檢定之實作( 獨立性檢定、百分同質性)
3-3 卡方檢定包含於logistic 迴歸:勝算比
3-3-1 odds ratio 之意義
3-3-2 列聯表(contingency table)、相對風險、勝算比(odds ratio) 及卡方檢定(crosstabs、 logistic regression 指令)
3-3-3卡方logistic 迴歸:同意人類可實驗貓大腦注入藥物嗎(logistic regression、crosstabs 指令)
Chapter04 兩組平均數之比較:t 檢定值≒ Meta 的效果量
4-1 t 檢定之簡介
4-2 t 檢定之解說:comparing group means
4-2-1 單變量:Student’s t-distribution
4-2-2 t 檢定的條件:假定(assumption)
4-2-3 單變量:Student’s t 檢定(t-test)
4-2-4 獨立樣本t 檢定vs. 單因子變異數分析
4-2-5 t檢定、ANOVA,使用STaTa、SAS 和SPSS 之差別
4-2-6 t檢定資料檔的編碼安排
4-3 t 檢定(t考驗):三種型t-test 實作
4-4 t 檢定、ANOVA、判別分析、迴歸的關係(t-test、oneway、regression、discriminant 指令)
Chapter 05 獨立樣本ANOVA、重複測量
5-1 變異數分析(ANOVA) 之簡介
5-1-1 ANOVA【基本概念】
5-1-2 ANOVA【重點整理】
5-2 one way ANOVA 分析(oneway、oneway /contrast、oneway /posthoc、unianova /print = etasq、oneway /polynomial 指令)
5-2-1 one way ANOVA:四種教學法的教學效果比較(oneway 指令)
5-2-2單因子ANOVA:A 因子( 四組) 在連續變數Y 的平均數比較(oneway、oneway /contrast、oneway /posthoc、unianova /print =etasq、oneway /polynomial 指令)
5-3 two way ANOVA 分析
5-3-1 two way ANOVA:教室氣氛(a) 和教學方法(b) 對學習成就(y):交互作用項(MANOVA 指令)
5-4 單層次:重複測量的混合效果模型(mixed effect model for repeated measure)
5-4-1重複量測(repeated measurement)ANOVA 的重點整理
5-4-2重複測量ANOVA 之F 檢定公式
5-4-3重複測量ANOVA 之主要效果/ 交互效果檢定(雙層MIXEDvs.單層GLM 指令)
5-5 雙層次(MIXED 指令):重複測量的混合效果模型
5-5-1 雙層次vs.二因子混合設計ANOVA:wide 格式(雙層MIXEDvs.單層GLM 指令)
5-5-2雙層次vs.二因子混合設計ANOVA:long格式(MIXED指令)
Chapter06 共變數分析(ANCOVA)
6-1 單變量:ANCOVA(共變數分析)
6-1-1單因子ANCOVA 之原理
6-1-2單因子MANCOVA 之重點整理
6-1-3單因子ANCOVA vs. 調整用途的共變數( 連續變數) 分割為類別變數,再進行ANOVA
6-2 為何要MANCOVA 取代MANOVA 呢?ANCOVA ≠ ANOVA(UNIANOVA、GLM 指令)
6-2-1單因子MANCOVA:3 個檢定(GLM 指令)
6-2-2二因子MANOVA 與MANCOVA 平均數及效果比較(交互作用顯
著)(UNIANOVA、GLM 指令)
Chapter07 線性迴歸的診斷
7-1 自變數與依變數是直線關係(linearity),此假定若違反,則取log()、開根號
7-2 檢定變異數的非線性及同質性(tests on nonlinearity and homogeneity of
variance)
7-2-1殘差非線性(nonlinearity):迴歸式「預測值vs. 殘差」散布圖
7-2-2殘差異質性(homoscedasticity):迴歸式「預測值vs.殘差」散布圖
7-3 殘差的常態性:P-P 圖、Q-Q 圖、Shapiro-Wilk W 常態檢定
7-4 模型界定:如何篩選足夠的預測變數們?
7-5 誤差的獨立性(independence):(EXAMINE VARIABLES=×× BY ×× /
PLOT=BOXPLOT 指令)
7-6 共線性(multicollinearity) 診斷
7-7 偵測不尋常且有影響力的觀察值(graph /scatterplot(bivar)=×× with ×× by 指令)
Chapter08 線性迴歸
8-1 t檢定、ANOVA、判別分析、迴歸的隸屬關係 (t-test、oneway、regression、discriminant 指令)
8-2 簡單線性迴歸(simple linear gression)
8-3 多元線性迴歸(regression 指令)
8-4 如何挑選預測變數的最佳組合:用Mallow’s Cp值及Adjusted R2 來比較模型
Chapter09 內生的共變:工具變數及兩階段最小平方法(2SLS)
9-1 工具變數及兩階段最小平方法(2sls 指令)
9-1-1進行OLS 統計分析時應注意之事項
9-1-2工具變數(IV) 之重點整理
9-1-3隨機解釋變數X(random regressor) 與工具變數Z(instrumental variable)
9-1-5為何需要多個工具變數?
9-1-6工具變數(instrumental variables) 在教育應用
9-2 兩階段最小平方法(2SLS) 分析七步驟(2sls y with x /instruments z 指令)
9-2-1兩階段最小平方法(2SLS) 迴歸:消費者行為(2sls y with x /
instruments z 指令)
9-2-2練習題:兩階段迴歸vs. 最小平方法迴歸
參考文獻
Chapter01 統計學回顧
1-1 統計學回顧
1-1-1單變量vs. 多變量統計
1-1-2統計分析法
1-1-3統計公式之重點整理
1-1-4檢定與信賴區間之關係
1-2 常態曲線(normal curve)
1-3 樣本大小的決定(sample size)
1-4 Type I 誤差α 及Type II 誤差β:ROC 圖切斷點的由來
Chapter02 假定(assumption) 的偵測及補救法 5
2-1 自定SPSS 介面( 自己習慣的介面)
2-2 資料分析前之檢查(examining data)
2-2-1散布圖(ggraph 指令):最小平迴歸法錯用的4 情況?
2-2-2直方圖(ggraph 指令)
2-2-3莖葉圖(EXAMINE /plot stemleaf 指令)...