非常熱門的統計方法──邏輯斯迴歸分析!
邏輯模型(Logit model)為離散選擇法模型,且屬於多項變數分析。在我們周圍,邏輯迴歸的資料常出現在不同領域中,例如:生物醫學領域中憂鬱症狀之影響因子分析、法學研究中犯罪的因素,以及商業領域中,客戶關係管理、公司企業存活、客戶忠誠度分析等等,還可延伸到眾多領域!
本書以STaTa介紹相關知識及理論,各章皆有實際案例分析,配合光碟資料檔與書中圖文指示練習,可讓學習者及研究者快速熟悉統計軟體的操作、強化基本功。本書適用科系包括:財務金融、會計、公共衛生、生物醫學、工業工程、土木、醫學管理、航運管理、公共行政、人管、生產管理、行銷管理、教學及心理系、風險管理系、社會系、法學院、經濟系…等。
•本書介紹分析二分類依變數時,最常使用的統計分析模型──邏輯斯迴歸模型。
•本書提供精闢的實作例題分析,並結合計算機統計軟體使用,詳細闡述邏輯斯模型原理及應用,深入淺出,讓您有效率地學習。
•以STaTa介紹相應離散選擇的模型適配方法,把離散選擇模型相關理論知識和軟體應用方法做系統性的整理。
•統計常用41種軟體及大型資料庫之檔案格式,都可轉成STaTa來分析,功能十分龐大,您不可不知!
•隨書附贈資料檔光碟
作者簡介:
張紹勳
學歷:國立政治大學資訊管理博士
現任:國立彰化師大專任教授
經歷:致理技術專任副教授
作者序
本書旨在介紹分析二分類依變數時最常使用的統計分析模型之Logistic迴歸模型,及其擴充模型包括:「邏輯斯迴歸搭配ROC曲線、多項邏輯斯迴歸、Alternative-specific multinomial probit regression、、Alternative-specific multinomial邏輯斯迴歸、邏輯斯迴歸搭配ROC曲線來做工具之分類準確性、Exact邏輯斯迴歸、異質機率模型、Ordered Logit迴歸分析、多層次ordered logistic 迴歸、Rank-ordered logistic迴歸、特定方案Rank-ordered logistic迴歸、零膨脹ordered probit regression迴歸、配對資料的條件邏輯斯迴歸、特定方案conditional logit model、離散選擇模型、分式多項式(Fractional polynomial)迴歸、多層次邏輯斯迴歸、巢狀邏輯斯迴歸、panel-data邏輯斯迴歸…」。透過例題分析,結合計算機統計軟體的使用,詳細闡述該模型原理及其應用;同時,還介紹了如何將Logistic迴歸模型擴展到序次Logistic迴歸模型和多項Logit模型,以分析序次變數和多分類名義變數為因變數的數據。
本書第一章介紹SAS、R和SPSS如何轉成STaTa,坊間常見的41種軟體及大型資料庫之檔案格式,都可轉至STaTa來分析。
在統計學中,邏輯斯迴歸分析或logit模型是一個迴歸模型,其中依變數(DV)是分類的。本文涵蓋二進制因變數的情況,即輸出只能取兩個值“0”和“1”,這些值代表:通過/失敗,贏/輸,活/死或健康/生病。依變數具有兩個以上結果類別的情況可以在多項Logistic迴歸中進行分析,或者如果多個類別被排序,則在順序邏輯迴歸中。在經濟學術語中,邏輯迴歸是定性反應/離散選擇模型的一個例子。
本書適合的科系包括:財務金融、會計、公共衛生、生物醫學、工業工程、土木、醫學管理、航運管理、公共行政、人管、生產管理、行銷管理、教學/心理系、風險管理系、社會系、法學院、經濟系…等。
在google scholar學術搜尋中,查詢「logistic regression analysis」會出現1,930,000篇以上論文。可見邏輯斯迴歸分析係非常熱門的統計法。
在我們週圍,logit迴歸的資料常出現在不同領域中,包括:
(1)公共衛生領域:某傳染病的死亡因素。
(2)生物醫學領域:癌患者放射線治療對產生副作用、腎虛症與骨質疏鬆症關聯性、憂鬱症狀之影響因子等Logistic分析…。
(3)工程類中的建物地震損害程度評估模型、絕緣礙子火花偵測系統。
(4)商業領域:客戶關係管理、公司企業的存活。市場研究之消費者對特定商品購買時間,客戶忠誠度。或則商業上客戶資料管理、行銷、企業倒閉、員工離職。
(5)財務金融領域:個人消費性貸款、法人金融預警分析等。
(6)保險統計學及人口統計學中的投保與否。
(7)社會學中的事件歷史分析,研究女性婚姻抉擇因素、高齡人口選擇未來養老居住方式…。
(8)法學研究:犯罪的因素等。
(9)工業領域:可靠度分析、工業製成、產品cycle。
(10)經濟研究:失業的因素,從就業時間到失業時間,到再就業時間等。
(11)教育領域:老師離職、學生休退學/吸毒的因素等。
(12)財管領域:財務危機與轉投資活動關係、貸款授信違約風險評估、銀行放款信用評、應收帳款呆帳預測等。
(13)行銷/企管類:旅客參與觀光旅遊線之消費型態、汽車保險續保、.投資型保險商品購買預測等。
有鑑於STaTa分析功能龐大,故作者將撰寫一系列的STaTa的書,包括:
7.多層次模型 (共15種多層次模型之類型可選擇)
社會科學、生物醫學、財金等領域,其統計學係採用統計學、運籌學、經濟、數學等領域之定量方法。社會科學及自然科學二大領域中各個學科,它們有許多共通之研究設計及統計分析法,都與作者在五南出版STaTa一序列書名有關,包括:
一、《STaTa與高等統計分析的應用》一書,該書內容包括:
描述性統計、樣本數的評估、變異數分析、相關、迴歸建模及診斷、重覆測量…。
二、「STaTa在結構方程模型及試題反應理論」一書,該書內容包括:路徑分析、結構方程模型、測量工具的信效度分析、因素分析…。
三、《STaTa在生物醫學統計分析》一書,該書內容包括:
類別資料分析(無母數統計)、logistic迴歸、存活分析、流行病學、配對與非配對病例對照研究資料、盛行率、發生率、相對危險率比、勝出比(Odds Ratio)的計算、篩檢工具與ROC曲線、工具變數(2SLS)…Cox比例危險模型、Kaplan-Meier存活模型、脆弱性之Cox模型、參數存活分析有六種模型、加速失敗時間模型、panel-data存活模型、多層次存活模型…
四、《Meta統計分析實作:使用Excel與CMA程式》一書,該書內容包括:統合分析(meta-analysis)、勝出比(Odds Ratio)、風險比、4種有名效果量(ES)公式之單位變換等。
五、《Panel-data迴歸模型:STaTa在廣義時間序列的應用》一書,該書內容包括:多層次模型、GEE、工具變數(2SLS)、動態模型…。
六、《總體經濟與財務金融:STaTa時間序列分析》一書,該書內容包括:誤差異質性、動態模型、序列相關、時間序列分析、VAR、共整合…等。
七、《多層次模型(HLM)及重複測量:使用STaTa》一書,該書內容包括:線性多層次模型、vs.離散型多層次模型、計數型多層次模型、存活分析之多層次模型、非線性多層次模型…。
八、《模糊多準評估法及統計》一書,該書內容包括:AHP、ANP、TOPSIS、Fuzzy理論、Fuzzy AHP…等理論與實作。
九、《邏輯斯迴歸及離散選擇模型:應用STaTa統計》一書,該書內容包括:邏輯斯迴歸、vs. 多元邏輯斯迴歸、配對資料的條件Logistic迴歸分析、Multinomial Logistic Regression、特定方案Rank-ordered logistic迴歸、零膨脹ordered probit regression迴歸、配對資料的條件邏輯斯迴歸、特定方案conditional logit model、離散選擇模型、多層次邏輯斯迴歸…。
十、《有限混合模型(FMM):STaTa分析(以EM algorithm做潛在分類再迴歸分析)》一書,該書內容包括:FMM:線性迴歸、FMM:次序迴歸、FMM:Logit迴歸、FMM:多項Logit迴歸、FMM:零膨脹迴歸、FMM:參數型存活迴歸…等理論與實作。
十一、《多變量統計:應用STaTa分析》一書,書內容包括:MANOVA、囷素分析、典型相關、區別分析、MDS…。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統計概念等,都是實証研究中很重要的內涵,這也是本書撰寫的目的之一。為了讓研究者能正確且精準使用panel迴歸,本書內文儘量結合「理論、方法、統計」,期望能夠對產學界有拋磚引玉的效果。
最後,特感謝全傑科技公司(http://www.softhome.com.tw),提供STaTa軟體,晚學才有機會撰寫STaTa一系列的書,以嘉惠學習者。
張紹勳 敬上
本書旨在介紹分析二分類依變數時最常使用的統計分析模型之Logistic迴歸模型,及其擴充模型包括:「邏輯斯迴歸搭配ROC曲線、多項邏輯斯迴歸、Alternative-specific multinomial probit regression、、Alternative-specific multinomial邏輯斯迴歸、邏輯斯迴歸搭配ROC曲線來做工具之分類準確性、Exact邏輯斯迴歸、異質機率模型、Ordered Logit迴歸分析、多層次ordered logistic 迴歸、Rank-ordered logistic迴歸、特定方案Rank-ordered logistic迴歸、零膨脹ordered probit regression迴歸、配對資料的條件邏輯斯迴歸、特定方案conditional logi...
目錄
第1章 二元(Binary)依變數:邏輯斯迴歸(logit指令)
1-1 STaTa如何讀入各種資料格式之資料
1-1-1 資料輸入的方法:問卷、Excel檔的讀入
1-1-2 SPSS資料檔(*.sav)轉成STaTa格式
1-1-2 SAS格式轉成STaTa
1-1-3 R軟體之格式轉成STaTa
1-1-4 Logistic迴歸的應用領域
1-1-5 STaTa之binary regression選擇表之對應指令
1-2 簡單邏輯斯迴歸的入門
1-2-1 簡單邏輯斯迴歸(Logistic Regression Model)的介紹
1-2-2a 簡單Logistic迴歸分析:年齡與罹患冠心病(CHD)關係
1-2-2b Logistic迴歸之練習題:年齡與罹患冠心病(CHD)關係
1-3 邏輯斯迴歸分析
1-3-1二元依變數之Logistic迴歸分析:大學申請入學之關鍵條件?
1-3-2 如何挑選最佳解釋變數們:影響早產兒之危險因子有那些?
1-4 邏輯斯迴歸分析(logit、glm指令)
1-4-1 邏輯斯迴歸分析一(母蟹crab):(logit、prvalue、glm指令)
1-4-2 質性自變數之Logit迴歸(AZT處理對AIDS效果)(logit指令)
1-5 邏輯斯迴歸之建模法(logit、lrtest、tab1、lowess、fp/fracpoly指令)
1-5-1 評比敵對模型,適配指標有7種
1-5-2a羅輯斯迴歸之共變數係數調整法(Fractional polynomial regression)(fp或fracpoly指令)
分式多項式迴歸(Fractional polynomial regression):練習題(fp或fracpoly指令)
1-6 邏輯斯迴歸搭配ROC曲線來做篩檢工具之分類準
1-6-1 Type I誤差α及Type II誤差β:ROC圖切斷點的由來
1-6-2 ROC曲線、敏感度/特異性:不同篩檢工具之分類準確性比較
1-7 Logit+ROC曲線來評比敵對logit模型,那個好?
1-7-1 ROC曲線、cut-off點
1-7-2 Logit模型搭配ROC曲線來找最佳cut-off點(logit、estat classification、lsens、lroc、graph指令)
1-8 小數據:Exact logistic regression(是否染愛滋病毒之二種血清檢測值)(exlogistic指令)
第2章 Logit迴歸的診斷(diagnostics)
2-1 Logit迴歸的假定(assumption)
2-1-1 Logit迴歸的假定(assumption)
2-1-2 橫斷面Hausman檢定:OLS vs. 2SLS誰優?(hausman指令)
2-2界定誤差(Specification Error)
2-2-1 多元(複)線性迴歸診斷(diagnostics)之重點整理
2-2-2 線性迴歸的診斷
2-2-3 Logit迴歸的界定適當嗎?優質辦校之因素(logit、boxtid、linktest指令)
2-3 Logit模型適配度有三方法?優質辦校之因素(logit、lfit、fitstat指令)
2-4共線性(Multicollinearity)診斷:優質辦校之因素(logit、***指令)
2-5偵測異常且有影響力的觀察值:優質辦校之因素(***指令)
2-6 邏輯迴歸的常見數值問題(***指令)
2-7 有用指令之歸納
第3章 離散選擇模型(Discrete Choice Models)
3-1離散選擇模型(Discrete Choice Models, DCM)
3-2 多項機率迴歸分析(Multinomial probit regression):3種保險的選擇(mprobit指令)
3-3多項式概率模型來進行離散選擇建模(discrete choice modeling using multinomial probit model)(asmprobit指令)
3-3-1 Alternative-specific multinomial probit regression:三種保險計畫的選擇(asmprobit指令)
3-3-2使用多項式概率模型進行離散選擇建模:四種旅行方式的選擇(asmprobit指令)
第4章 Logit迴歸、Linear Probability、Probit、Cox迴歸之比較
4-1 Probit迴歸模型之解說
4-2 Binary依變數:Linear Probability, Probit及Logit迴歸分析之比較
4-3 Logit模型、 Cox迴歸、probit模型的概念比較
4-4 異質機率模型:模擬資料(Heteroskedastic probit model)(hetprobit指令)
4-5 Bivariate probit迴歸vs.二個似乎無相關依變數「private, vote」模型,誰優?(biprobit指令)
4-6調查法交叉效度:邏輯斯迴歸(Application of Logistic Regression with Different Sampling Models)(svy: logit指令)***
4-6-1 Stata提供的「svy:」前置指令
4-6-2 交叉效度
4-6-3調查法交叉效度:邏輯斯迴歸(Application of Logistic Regression with Different Sampling Models)(svy: logit指令)***
第5章多分類依變數(Multinomial)的邏輯斯迴歸分析 (mlogit指令)
5-1多項邏輯斯模型(Multinominal Logit Model, MNL)
5-1-1多項邏輯斯模型(Multinominal Logit Model, MNL)之概念
5-1-2多項邏輯斯模型之應用****
5-1多項(Multinomial) Logit迴歸之多項選擇
5-2 Multinomial Logit迴歸之解說(mlogit指令)
5-3 Multinomial Logit迴歸分析:職業選擇種類(mlogit指令)
5-4 多項邏輯斯迴歸分析:乳房攝影(mammograph)經驗的影響因素(mlogit指令)
5-5羅輯斯迴歸之共變數係數調整法(fractional multinomial logit model):6種行政預算編列比例之因素(fmlogit外掛指令)
5-5 多項邏輯斯迴歸分析:12地區宗教信仰3選擇之因素(mlogit指令)
第6章 單層vs多層次:Ordered Logit、Ordered Probit Analysis及擴充模型(ologit、eoprobit、meologit、meoprobit指令)
6-1 Ordered Logit及Ordered Probit模型之概念
6-2 Ordered Logit及Ordered Probit迴歸分析:影響親子親密關係的因素(reg、listcoef、prgen、ologit、logit)
6-3 Ordered Logit迴歸分析: Copenhagen的住房條件(ologit、lrtest、graph bar、oprobit指令)
6-4 Extended ordered probit regression迴歸分析:內生共變數之二階段機率迴歸(eoprobit指令)
6-4-1 內生共變數:工具變數(IV)之重點整理
6-4-2 Extended ordered probit regression迴歸分析:健康狀況程度之因素(eoprobit指令)
6-5 Multilevel mixed-effects ordered logistic regression:社會抵抗課程的介入對健康概念程度的效果(meologit指令)
6-6 Multilevel mixed-effects ordered probit regression:社會抵抗課程的介入對健康概念程度的效果(meoprobit指令)
6-7 Panel-data Random-effects ordered logistic models:社會抵抗課程的介入對健康概念程度的效果(xtologit指令)
6-8 等級-次序迴歸:四種方案偏好排名(Rank-ordered logistic regression(rologit指令)
6-9 Alternative-specific rank-ordered probit regression:四種工作特性偏好之影響因素(asroprobit指令)
6-10 Zero-inflated Poisson迴歸vs. Zero-inflated ordered probit regression(zip、zioprobit指令)
6-10-1 零膨脹(Zero-inflated)Poisson分布
6-10-2 Count依變數:零膨脹Poisson迴歸 vs負二項迴歸(zip、nbreg、prgen指令)
6-10-3 Zero-inflated ordered probit regression練習:釣魚(zip指令)
6-10-4 零膨脹ordered probit迴歸分析(zioprobit指令)
第7章 配對資料的條件邏輯斯迴歸(clogit指令)
7-1配對資料的條件邏輯斯迴歸:案例-控制研究(clogit指令)
7-2 配對的條件邏輯斯迴歸分析: McFadden's choice模型(clogit指令)
7-3 Alternative-specific conditional logit(McFadden's choice):汽車銷售調查法(asclogit指令)
7-4 Alternative-specific conditional logit model:選擇四種釣魚模式(asclogit指令)
7-5Alternative-specific conditional logit(McFadden's choice) model: 避孕3種選擇(asclogit指令)
第8章 多層次邏輯斯迴歸(multilevel logistic regression)
8-1分層隨機抽樣
8-2 多層次Logistic迴歸(xtmelogit指令)
8-2-1 雙層次混合logistic 迴歸(xtmelogit 指令)
8-2-2 三層次logistic 迴歸(xtmelogit 指令)
8-2-3 混合效果logistic 迴歸(xtmelogit 指令)
8-2-4 Alternative-specific mixed logit regression(asmixlogit 指令)
8-3 Multilevel mixed-effects ordered logistic regression:社會抵抗課程的
介入對健康概念程度的效果(meologit 指令)
8-4 雙層巢狀模型:巢狀結構的餐廳選擇(nested model,nestreg 指令)
第9章Panel-data 邏輯斯迴歸(xtgee、xtlogit 指令)
9-1 Panel-data 迴歸 (xtgee、xtlogit 指令)
9-2 追蹤資料(panel-data) 分析之STaTa 相關指令
9-3 追蹤資料(panel-data) 之基本模型
9-3-1 panel 資料型態及其模型分類
9-3-2 追蹤資料(panel-data) 四模型:線性vs. 非線性模型
9-3-3 追蹤資料(panel-data) 模型認定(identify) 與假設
9-4 Panel-data logit 迴歸分析(xtgee、xtlogit 指令)
9-5 Panel-data random-effects ordered logistic models (xtologit 指令)
9-6 Random-effects ordered probit models:社會抵抗課程的介入對健康概念程度的效果(xtoprobit 指令)
9-7 互補log-log 迴歸(Random-effects and population-averaged cloglogmodels):加入工會嗎(xtcloglog 指令)
9-7-1 對數邏輯分布(log-logistic):偏態分布
9-7-2 Random-effects complementary log-log model:加入工會嗎
(xtcloglog 指令)
參考文獻
第1章 二元(Binary)依變數:邏輯斯迴歸(logit指令)
1-1 STaTa如何讀入各種資料格式之資料
1-1-1 資料輸入的方法:問卷、Excel檔的讀入
1-1-2 SPSS資料檔(*.sav)轉成STaTa格式
1-1-2 SAS格式轉成STaTa
1-1-3 R軟體之格式轉成STaTa
1-1-4 Logistic迴歸的應用領域
1-1-5 STaTa之binary regression選擇表之對應指令
1-2 簡單邏輯斯迴歸的入門
1-2-1 簡單邏輯斯迴歸(Logistic Regression Model)的介紹
1-2-2a 簡單Logistic迴歸分析:年齡與罹患冠心病(CHD)關係
1-2-2b Logistic迴歸之練習題:年齡與罹患冠心病(CHD)關係 ...