本書具體言之,是反映如下的讀者需求為目的所撰寫的。
1. 在學校中曾學習過統計學與多變量分析,想利用SPSS軟體來計算的人。
2. 對於如何判讀SPSS的輸出,未有足夠知識的人。
3. 想了解SPSS基本用法的人。
4. 想透過SPSS使用實際的資料學習操作方法的人。
5. 對於論文或研究報告中出現的統計資料分析結果不知如何解釋而感到苦惱的人。
本書是就資料分析的各種手法包括統計方法、多變量分析的具體計算方法以及SPSS基本操作方法,盡可能以容易理解的方式來撰寫,適用於醫護相關學系與研究所的授課教材,以及研究人士實務上進行資料分析時作為輔助工具。
作者簡介:
楊秋月
弘光科技大學健康事業管理系副教授兼系主任
國立成功大學基礎醫學研究所博士
陳耀茂
東海大學企管系所教授
日本(國立)電氣通信大學經營工學研究所工學博士
章節試閱
利用SPSS進行各種分析時,第一步的作業是製作資料檔案。選擇只符合於某條件的觀察值,或從既有的變數製作新變數的技術,即為進行第2章以後分析所需的技術。本章是在資料檔案的製作方法中介紹較具典型者,同時就資料的基本加工進行說明。
1.1 資料檔案的製作法
一、概要
即使想簡單地製作SPSS所使用的資料檔案,仍取決於原先的資料處於何種狀態,作業量是有不同的。圖1.1是以流程圖表示至分析開始前的步驟。如果已經有以SPSS處理格式(.sav)所製作的資料檔案,那麼只是開啟資料即可開始分析,若非如此,就需要以某種方法製作成SPSS格式的資料檔案。
本節主要是說明在SPSS格式的資料檔案中,變數的特性與數值要如何加以表現,雖然容易認為SPSS是只要選擇清單即可分析,但資料檔案如以錯誤的格式製作時,想要使用的解析方法就無法使用。考慮變數的特性之後再製作適合格式的資料檔案是非常重要的。
如圖1.1所示,資料檔案可以使用SPSS所製作的檔案,也可以將其他格式所製作的既有資料檔案轉換成SPSS格式的資料檔案。考慮資料的狀態、有無慣用的軟體等,再選擇作業量或輸入失誤最少的製作方法為宜。
二、資料檔案的製作與變數的表現
資料檔案的構成
已經存在有SPSS格式的資料時,只要連續按兩下資料檔案,SPSS即會啟動。圖1.2(a)是“升學時重視事項. sav”顯示SPSS格式資料的圖像例。圖像的執行檔是“.sav”或者讓SPSS啟動之後選擇【檔案】→【開啟】→【資料】,再選擇資料檔案。要啟動SPSS,可以連按兩下桌面上的捷徑(圖1.2(b)),或從開始清單中選擇【IBM SPSS Statistics 22】。
圖1.3是開啟“升學時重視事項. sav”檔案的狀態。大學生為對象,以3級讓他們回答決定升學對象時有關5個事項是否重視的資料。SPSS的資料檔案是由資料視圖(圖1.3(a))與變數視圖(圖1.3(b))所構成,按下方的標籤(Tab)即可切換顯示。
「資料視圖」中之各列是表示觀察值。如果是意見調查時,一列表示一位回答者的資料。各行表示變數,行的最上方顯示變數名。習慣表格計算軟體的人,會覺得很像試算表(spreadsheet)。但是,表格計算軟體是在一張試算表上表現變數的特性與數值兩者,但在SPSS的資料視圖中所表現的只有數值而已,變數的特性則表現在變數視圖中。「變數視圖」是一列表示一個變數,各行所表現的則是「名稱」、「類型」等的變數特性。
變數的特性與變數視圖
於變數視圖中所記述之變數的特性之中,「類型」與「測量」是表示變數依據何種的規則所測量的,亦即表示尺度(scale)。表1.1中是說明「尺度」的種類與變數視圖的「類型」與「測量」相對應的指定。表1.2表示變數視圖中除「類型」與「測量」以外有關主要特性之說明及注意事項。
像性別或鄉鎮村里名,即為以某基準將測量對象所具備的特質予以分類的尺度,稱為名義尺度(nominal scale),在變數視圖的「測量」中是指定「名義」。至於「類型」,如使用「男性」、「女性」等的文字列時,是指定「字串」。如將「男性」設為1、「女性」設為2那樣以數值化處理時,則指定「數值型」。被數值化的名義尺度,只是為了分類性質方便而分配數值而已,數值的大小並無意義。
像喝酒的尺度「完全不喝」、「有時喝」、「常喝」、「每天喝」那樣,回答時有順序關係之尺度,稱為順序尺度(ordinal scale),變數視圖的「測量」水準是指定「次序」。SPSS是將「完全不喝」設為0,「有時喝」設為1,…,如此地對應順序關係與數值的大小來設定,一般是當作「數值型」來處理。如照著用詞輸入當作「字串」處理時,無法表現順序關係。順序尺度即使計算「3.每日喝」-「1.有時喝」=「2」,也無法設定2此值的意義。值的順序(大小)雖有意義,但差卻是沒有意義的尺度。
以數值所表現的變數之中,譬如,距離的500M與800M之差具有明確的意義,而且,距離0是指完全相同的地點。對於重量、時間、金額也是一樣。像這樣,數值之差與零之值均具有意義的尺度,稱為比例尺度(ratio scale)。溫度雖然也是以數值表示的變數,然而即使說是溫度0度,並非溫度不存在。像這樣,數值之差雖有意義,但零之值並無意義的尺度稱為間隔尺度(interval scale)。不管是「比例尺度」或是「間隔尺度」,變數視圖的「類型」指定「數值型」,「測量」則指定「尺度」。
表1.3中顯示“升學時重視事項. sav”(圖1.3)所包含的變數與尺度的種類及回答選項。由A1到A5的變數是以3等級評分。嚴格來說是順序尺度,可是,在問卷中以「1.不重視」、「2.很難說」、「3.重視」選項中加上數字的狀態回答,因之1與2之差異、2與3之差異幾乎視為相同,可當作間隔尺度來處理。資料檔案中變數的表現
變數視圖(圖1.3(b))中,依據表1.3中所顯示的變數的尺度種類,可以指定「類型」與「測量」。
對於從A1到A5的變數,在變數視圖的「標記」欄中有詳細的說明。如按一下各列的「數值」方框右側的“…”時,即出現「數值標記」視窗(圖1.4),顯示出數值與性質的對應。圖1.4是按一下變數視圖的第一列的「數值」方框右側的“…”後所出現的「數值標記」視窗,顯示出1對應於“男性”,2對應於“女性”的情形。
另外,後面分析的各過程中畫面所出現的視窗,稱為「視窗」的時候也有。
資料視圖(圖1.3(a))中任一方框均顯示有數值,但由清單選擇【檢視】→【數值標記】於【數值標記】中點選時,對於已數值化的名義尺度與順序尺度來說,從變數視圖的【數值標記】的指定,即可改變成利用文字的顯示(圖1.5)。
或於資料視圖上方的圖像 按一下亦可切換顯示。
像意見調查等問卷調查的資料,因為拒絕回答或忘記記入而無法得到數值的情形也有。在變數視圖中的「遺漏值」方格中如未特別指定時,資料有遺漏的部分,如果是數值型的變數時,資料視圖的該方格中即顯示“.”(句點),如果是字串型變數時該方格即成為空白。
變數視圖的「遺漏值」方格中如指定有數值(譬如99)時,資料視圖的外表上顯示有99的方格,必須視為遺漏值。
利用SPSS進行各種分析時,第一步的作業是製作資料檔案。選擇只符合於某條件的觀察值,或從既有的變數製作新變數的技術,即為進行第2章以後分析所需的技術。本章是在資料檔案的製作方法中介紹較具典型者,同時就資料的基本加工進行說明。
1.1 資料檔案的製作法
一、概要
即使想簡單地製作SPSS所使用的資料檔案,仍取決於原先的資料處於何種狀態,作業量是有不同的。圖1.1是以流程圖表示至分析開始前的步驟。如果已經有以SPSS處理格式(.sav)所製作的資料檔案,那麼只是開啟資料即可開始分析,若非如此,就需要以某種方法製作成SPSS格式...
作者序
本書是以想利用SPSS的讀者為對象,就量化分析的各種方法,包括統計方法、多變量分析的具體計算方法,盡可能以容易理解的方式來撰寫,適用於醫護相關學系及研究所的授課教材,以及研究人士實務上進行資料分析時作為輔助工具。本書列舉許多實務上的例題,希望讓讀者在學習上能更加容易。本書的基本架構如下:
1. SPSS的基本操作放在第1篇當作基本篇,包括分割檔案、選擇觀察值、加權觀察值、聚集、計算變數、重新編碼變數、自動編碼、visual binning等之資料整理與加工方法。
2. 統計的分析方法放在第2篇當作統計篇,內容包括資料的表徵方法(描述性統計)、統計的推論(估計及檢定)、變異數分析、迴歸分析、無母數統計等一般統計分析的方法。
3. 多變量分析方法放在第3篇當作應用篇,包括測量的信度與效度、主成分分析、因素分析、集群分析、區別分析、Logistic迴歸分析、對數線性模型、典型相關分析、多元尺度法、多變量變異數分析、多變量共變數分析、Poisson迴歸、Probit分析、路徑分析、結構方程模型等較為廣泛的方法。
此外,第2篇及第3篇內文中的Q&A中,記述各種方法的數學原理,除揭示SPSS的用法外,也記載各種方法的原理、應用方法、分析結果的解釋。對SPSS的操作上有不明白之處,可提供快速導覽。
本書具體言之,是反映如下的讀者需求為目的所撰寫的。
(1) 在大學中曾學習過統計學,想利用軟體來計算的人。
(2) 對於如何判讀SPSS的輸出,未有足夠知識的人。
(3) 想了解SPSS基本用法的人。
(4) 想透過SPSS使用實際的資料學習多變量分析的基本原理的人。
(5) 對於論文或研究報告中出現的統計資料分析結果卻不知如何解釋而感到苦惱的人。
本書最大的特色在於各篇中均安排有Q&A,在SPSS及資料分析的用法上感到困擾時,可提供協助,此外,本書中所舉的案例也提供數據檔提供讀者方便使用。
本書所記述的解析例,原則上是使用SPSS中文22.0版計算的。本書的主要目的是在於讓讀者理解統計學的基礎而使用SPSS作為計算的手段。因此,讀者使用的版本只要不要太舊,基本上都不會有問題。一般來說,學習量化方法不一定經常需要最新的版本。
SPSS包含有多種分析模組,如將各種分析模組全部包含在內時,會使本書增厚不少,筆者認為與其網羅SPSS的全部方法,不如將重點放在泛用性較高的分析方法進行解說,其他則請參閱相關書籍。
使用本書時在統計學的授課中,「統計篇」的部分約略相當於半年的課程,而在多變量分析的授課中,「應用篇」的部分也約略相當於半年的課程,而「統計篇」加上「應用篇」的部分則相當於一年。在大學中對「敘述統計」、「統計檢定」、「變異數分析」、「複迴歸分析」等的基礎統計已有足夠的知識及對實際的資料有過應用的研究生,則可跳過「統計篇」直接進入「應用篇」。當然,如使用上有不明之處,也可多活用Q&A的說明。
最後,希望能透過本書的學習來提升您資料分析的能力是作者的期待與榮幸。書中若有謬誤之處尚請不吝指正。
楊秋月、陳耀茂 謹誌
本書是以想利用SPSS的讀者為對象,就量化分析的各種方法,包括統計方法、多變量分析的具體計算方法,盡可能以容易理解的方式來撰寫,適用於醫護相關學系及研究所的授課教材,以及研究人士實務上進行資料分析時作為輔助工具。本書列舉許多實務上的例題,希望讓讀者在學習上能更加容易。本書的基本架構如下:
1. SPSS的基本操作放在第1篇當作基本篇,包括分割檔案、選擇觀察值、加權觀察值、聚集、計算變數、重新編碼變數、自動編碼、visual binning等之資料整理與加工方法。
2. 統計的分析方法放在第2篇當作統計篇,內容包括資料的表徵方...
目錄
SPSS基本用法
1.1 資料檔案的製作法
1.2 資料的加工法
資料的表徵
2.1 次數分配表
2.2 簡單累計的圖形表現
2.3 資料檔案的製作法
2.4 交叉表與圖形表現
2.5 相關係數
2.6 層別的分析
統計推論
3.1 有關平均值的推論
3.2 關於變異數的推論
3.3 有關相關係數的推論
3.4 有關交叉表的推論
3.5 比率的推論
變異數分析
4.1 單因子變異數分析(一元配置變異數分析)
4.2 多重比較
4.3 二因子變異數分析(二元配置變異數分析)
4.4 多因子變異數分析(多元配置變異數分析)
4.5 直交表
複迴歸分析
5.1 簡單迴歸分析
5.2 複迴歸分析
5.3 非線性迴歸分析
5.4 多項式迴歸
無母數統計
6.1 簡介
6.2 適合度檢定
6.3 獨立性檢定
6.4 一致性檢定
6.5 Wilcoxon的等級和檢定
6.6 Wilcoxon的符號等級檢定
6.7 Kruskal.Wallis的檢定與多重比較
6.8 Friedman檢定與多重比較
6.9 Kendall一致性係數
6.10 Kappa一致性係數
6.11 常態性檢定(Shapiro-Wilk test)
6.12 兩組獨立樣本K-S檢定
測量的信度與效度
7.1 測量的信度
7.2 測量的效度
7.3 組內相關係數
主成分分析
8.1 主成分分析的概要
8.2 基於相關矩陣的主成分分析
8.3 基於共變異數矩陣的主成分分析
8.4 利用主成分分析檢出多變量偏離值
因素分析
9.1 因素分析的概要
9.2 因素的擷取
9.3 因素的轉軸
9.4 其他的分析
集群分析
10.1 觀察值的集群
10.2 變數的集群
區別分析
11.1 區別分析的概要
11.2 解析例1(3組的情形)
11.3 解析例2(2組時)
11.4 關於區別分析其他問題Q&A
Logistic迴歸分析
12.1 二元Logistic迴歸
12.2 多元Logistic迴歸
次序迴歸分析
13.1 簡介
13.2 案例
13.3 次序迴歸分析
對數線性模型
14.1 基本模型
14.2 Logit對數線性模型
存活分析
15.1 簡介
15.2 Kaplan-Meier Method
15.3 比例風險模型
典型相關分析
16.1 概要
16.2 解析例
多元尺度法
17.1 簡介
17.2 多元尺度法
多變量變異數分析
18.1 多變量變異數分析
18.2 多重比較
18.3 兩因子MANOVA
多變量共變數分析
19.1 簡介
19.2 獨立樣本單因子多變量共變數分析(一個共變量)
19.3 獨立樣本單因子多變量共變數分析(兩個共變量)
19.4 獨立樣本二因子多變量共變數分析(交互作用不顯著)
19.5 獨立樣本二因子多變量共變數分析(交互作用顯著)
廣義線性模型
20.1 廣義線性模型
20.2 廣義估計方程式
卜瓦松(Poisson)迴歸
21.1 簡介
21.2 Poisson迴歸模型
21.3 Poisson迴歸分析的步驟
機率單位(Probit)分析
22.1 Probit分析簡介
22.2 解析例
22.3 probit分析的步驟
神經網路—多層感知器
23.1 簡介
23.2 解析例
23.3 階層型神經網路的分析步驟
神經網路—放射狀基底函數
24.1 簡介
24.2 解析例
路徑分析
25.1 簡介
25.2 解析例
25.3 路徑分析
結構方程模型
26.1 結構方程模型基本概念
26.2 應用結構方程模型的理由
26.3 模型驗證的前提假設
26.4 模型架構與理論
26.5 SEM建構流程
26.6 分析結果的評估
26.7 解析例
26.8 共變異數構造分析
決策樹
27.1 簡介
27.2 解析例
24.3 決策樹的分析步驟
類別迴歸分析
28.1 簡介
28.2 案例
28.3 類別迴歸分析
PROCESS—調節變數與中介變數
29.1 簡介
29.2 Process軟體的下載
參考文獻
SPSS基本用法
1.1 資料檔案的製作法
1.2 資料的加工法
資料的表徵
2.1 次數分配表
2.2 簡單累計的圖形表現
2.3 資料檔案的製作法
2.4 交叉表與圖形表現
2.5 相關係數
2.6 層別的分析
統計推論
3.1 有關平均值的推論
3.2 關於變異數的推論
3.3 有關相關係數的推論
3.4 有關交叉表的推論
3.5 比率的推論
變異數分析
4.1 單因子變異數分析(一元配置變異數分析)
4.2 多重比較
4.3 二因子變異數分析(二元配置變異數分析)
4.4 多因子變異數分析(多元配置變異數分析)
4.5 直...