⊙以Python的模擬方法來輔助或取代數學證明,有效掌握計量經濟學。
⊙理論與實作兼具,操作步驟清楚易懂。
⊙內容包含以簡單線性迴歸(SLR)模型說明OLS與Python操作、比較古典與新古典線性迴歸模型的基本假定、介紹MLR模型/NLRM基本假定、說明變異數異質結果以及使用穩健的標準誤、檢視模型設定問題等。
⊙附贈光碟提供書中完整原始程式碼,幫助學習理解、迅速進入狀況。
本書以熱門程式語言Python實際操作,帶領讀者認識以及運用計量經濟學。
內容循序漸進,從第1章介紹基礎理論、檔案數據資料,手把手教學。第2章利用簡單線性迴歸(SLR)模型說明計量經濟學的主要方法:OLS,以及如何於Python下操作。第3章比較古典與新古典線性迴歸模型的基本假定。第4章介紹MLR模型。第5章介紹NLRM的基本假定。第6章進一步說明迴歸模型的大樣本推論以及OLS估計式之漸近有效性。第7章討論MLR模型的特殊函數型態(如對數函數、二次式以及交互變數型態),以及估計迴歸模型的預測部分。第8章檢視迴歸模型下的質性變數。第9章說明變異數異質的結果、使用穩健的標準誤,以及如何使用WLS方法與應用。第10章檢視模型設定問題,其中包括代理變數、因變數與自變數之衡量誤差、離群值與最小絕對誤差等。
書中範例所呈現任何計算、模擬、估計、編表或甚至於繪圖等操作,光碟內皆附有完整的Python程式碼供讀者參考使用。
作者簡介:
林進益
學歷:
國立中山大學財務管理博士
國立政治大學經濟學研究所碩士
東海大學經濟學系學士
經歷:
國立屏東大學財務金融學系副教授
國立屏東商業技術學院財務金融系副教授
國立屏東商專財務金融科講師
致理商專國貿科講師
著作:
財金統計學:使用R語言(2016,五南)《財統》
經濟與財務數學:使用R語言(2017,五南)《財數》
衍生性金融商品:使用R語言(2018,五南)《衍商》
財金時間序列分析:使用R語言(2020,五南)《財時》
統計學:使用Python語言(2020,五南)《統計》
時間序列分析下的選擇權定價:使用R語言(2020,Pubu電子書)《時選》
歐式選擇權定價:使用Python語言(2021,五南)《歐選》
資料處理:使用Python語言(2021,五南)《資處》
選擇權交易:使用Python語言(2022,五南)《選擇》
財金計算:使用Python語言(2023,五南)《財計》
選擇權商品模型化導論:使用Python語言(2024,五南)《選模》
Email:
c12yih@gmail.com
章節試閱
第1章 導 論
如序言所述,本書將以Python介紹計量經濟學內屬於橫斷面數據資料(crosssectional data)部分。計量經濟學內較完整介紹屬於橫斷面數據資料部分,應該可參考Wooldridge(2010, 2020),不過Wooldridge(2010)屬於較為「進階的(advanced)」書籍,故可供查詢之用。雖然Wooldridge(2020)屬於基礎或導論型的介紹,但是Wooldridge並未強調實際的操作方式;另一方面,上述書籍也欠缺使用模擬的方法。本書強調除了數學證明之外,使用Python以模擬的方式應該也可以達到異曲同工之妙;有意思的是,利用電腦來模擬並不如想像中的難。有關於Python的使用,除了可閱讀本書的附錄A之外,讀者亦可參考《資處》、《統計》或《財計》等書。
本章介紹計量經濟模型(econometric model)的本質、範圍及其所使用的方法邏輯。全章分成4部分說明,其中第1 部分說明「何謂計量經濟學?」;第2部分則介紹資料的類型(資料結構);第3部分則說明計量經濟學的方法邏輯;第4部分說明本書所使用的檔案數據資料。
1.1 何謂計量經濟學?
我們時常聽到「理論與實際(或實證)」,就經濟學而言,對應的「實證」學科,就是計量經濟學;因此,簡單地說,計量經濟學就是欲拿實際的統計資料驗證經濟學的內容是否符合實際的學科,是故計量經濟學本身就是屬於應用統計學的一環。
經濟學是研究不同變數間相互影響的學科,因此,顧名思義,計量經濟學所檢視的主題就是如何實證不同變數間相互影響的科學;換言之,上述主題可以簡單寫成:
y = f (x1, x2, ⋯, xk , u) (1-1)
其中y表示所欲檢視的標的或稱為被解釋變數(explained variable),而xj ( j = 1, 2, ⋯, k)則稱為解釋變數(explanatory variables)。例如:熟悉的需求函數可以寫成(1-1)式,其中例如:y可以為芒果的消費量,而x1則表示芒果的價格、x2表示所得、x3表示其他水果價格、⋯⋯。
當然,(1-1)式的型態較為籠統,一個較為明確的型態可將(1-1)式寫成:
y = β0 + β1x1 + β2x2 + ⋯ + βkxk + u (1-2)
(1-2)式的特色可以分述如下:
(1-2)式的特色可以分述如下:
(1) 顯然,(1-2)式屬於(1-1)式的一個特例。
(2) 就(1-2)式而言,我們必須先明確定義清楚y與xj ( j = 1, 2, ⋯, k)的意思,然後再蒐集對應的樣本資料。
(3) 就(1-2)式而言,βj稱為參數(parameters),βj通常是我們有興趣的部分,而u則稱為誤差項(error term)或干擾項(disturbance)。明顯地,u扮演著重要的角色,可以想像缺乏u的(1-2)式應該如何解釋?我們是否有足夠的資訊可以找到完整的xj值,透過(1-2)式而以xj來表示y,更何況有些xj值如偏好、素質或社會背景等,其實並不容易實際觀察到。
(4) 即使y與xj可以完整地蒐集或觀察到,但是實際的u值卻不行。一般而言,我們將u視為一種隨機變數(random variable),以彌補y無法由xj充分表示的差距。
(5) 其實,不僅u是一種隨機變數,y與xj亦皆是一種隨機變數,只不過我們希望y與xj皆存在對應的樣本觀察值或實現值,而u則表示y內無法觀察到的部分。因此,就統計學的觀點而言,(1-1)式可視為母體(population)的表現方式,而(1-2)式只是明確地展現母體的型態。
直覺而言,計量經濟學所欲研究的主題應該是熟悉的,例如:需求、供給、消費、成本或失業函數等之估計。不過,若仔細思考,上述熟悉的部分仍太過於狹隘,我們可以思考下列的例子。
第1章 導 論
如序言所述,本書將以Python介紹計量經濟學內屬於橫斷面數據資料(crosssectional data)部分。計量經濟學內較完整介紹屬於橫斷面數據資料部分,應該可參考Wooldridge(2010, 2020),不過Wooldridge(2010)屬於較為「進階的(advanced)」書籍,故可供查詢之用。雖然Wooldridge(2020)屬於基礎或導論型的介紹,但是Wooldridge並未強調實際的操作方式;另一方面,上述書籍也欠缺使用模擬的方法。本書強調除了數學證明之外,使用Python以模擬的方式應該也可以達到異曲同工之妙;有意思的是,利用電腦來模擬並不如想像中...
作者序
計量經濟學(econometrics)是一門相當有意思的學科,早期資訊不發達,我們大部分止於計量理論的探討或只是「跑跑迴歸」而已;不過,真的僅是如此嗎?當代個人電腦或網路已非比尋常,大概是受到「大數據」觀念的影響,如今於網路上,大型或普通的檔案數據資料已相當充斥,若再來檢視計量經濟學,我們發現已不可同日而語了。最明顯的例子已出現在自由軟體如Python 或R 語言上。例如:檢視Python內模組(linearmodels)之wage_panel檔案,於該檔案內竟然有52,320個觀察值!類似的情況在R語言的程式套件如AER或Ecdat內,早已司空見慣了。
於計量經濟學的書籍內,如Gujarati與Porter(2009)、Frees(2010)、Hill et al.(2011)、Wooldridge(2016, 2020)或Stock與Watson(2020)等書亦已隨書提供了大量的數據樣本資料,尤其Wooldridge(2020)更是提供了115檔數據資料,使得我們不得不重視電腦於計量經濟學內所扮演的角色。
計量經濟學屬於應用統計學的一環,顧名思義,就是屬於經濟學內的實證部分,原本就是需要從事資料整理、分析或估計等過程;可惜的是,我們似乎不習慣或不熟悉上述過程。本書的目的就是欲使用Python來重新檢視計量經濟學。以Python來學習計量經濟學至少有下列優點:
(1) 目前學習計量經濟學所使用的輔助工具大多使用如Eviews或Stata等商業套裝軟體。上述套裝軟體的功能當然不如程式語言。例如:閱讀上述計量的書籍,恐怕事先需要過濾、整理或分析所附的檔案數據資料,方能進入狀況。本書使用Python,就是強調Python具有強大的資料處理能力。以Python來學習計量經濟學,的確恰如其分,適得其所。
(2) 利用Python,本書底下介紹的計量經濟學內容將會大量地使用模擬方法,此大概是本書與上述Wooldridge等書最大的不同吧!
(3) 用模擬方法來輔助或取代數學證明,應該是當代書籍的特色之一吧!況且利用模擬的方法,其效果應該會比數學上的證明來得好,也更能讓讀者進入狀況。
(4) 筆者已經用Python寫了一系列財金或統計應用的書籍,如今透過本書,亦可看出Python的應用以及用處。
(5) 也許財金的輔助軟體(或程式語言)需要整合,今後只學一種就好。
於學生時期,每當筆者閱讀計量經濟學往往皆會覺得窒礙難行,究其原因可有:
(1) 我們需要一種閱讀或使用專業書籍內容(如計量經濟學等)的輔助工具,筆者依舊認為該輔助工具就是程式語言。
(2) 為何閱讀或欲使用計量經濟學內的觀念、方法或模型,需要輔助工具?除了數學證明之外,我們(如筆者)總想要進一步以模擬的方式驗證,筆者發現不使用程式語言的確窒礙難行。
(3) 當代計量經濟學如Gujarati與Porter(2009)、Hill et al.(2011)、Stock與Watson(2020)或Wooldridge(2020)等書是好的,但是它們的缺點卻是不強調實際操作;換句話說,初學者應該是一頭霧水,朦朧不清,無法明白(至少筆者當初就是如此)。
(4) Stock與Watson(2020)或Wooldridge(2020)等書應該是使用Stata等商用套裝軟體,但是有些時候,筆者發現上述套裝軟體實在不符所需,更何況許多讀者未必擁有上述套裝軟體。
(5) 就筆者而言,Eviews或Stata等商用套裝軟體應該是給熟悉計量經濟學的人使用,反而初學者使用上述商用套裝軟體往往會陷入「只是跑跑迴歸而已」的錯覺,「反正也不知原理原則,可以run就好了」。
本書將簡稱為《計導I》,希望下一本著作《計導II》不久就會出現。《計導I》的內容大多著重於計量經濟學內屬於橫斷面資料分析的部分,因為屬於計量經濟學導論,故《計導I》、《計導II》的內容適合給初學者使用,只不過因大量使用Python,故讀者最好有操作過Python的經驗。應該是無法避免的,學習計量經濟學的最好方式,就是能實際操作。筆者過去只是檢視理論部分而缺乏實際操作,此應該屬於比較沒有效率的學習方式。類似於筆者的一系列著作,《計導I》、《計導II》的內容是完全可以複製的,這也許是Wooldridge等書當初所忽略的部分吧!
《計導I》全書共分10章。其內容為:第1章說明何謂計量經濟學、資料的類型、計量經濟學的方法邏輯以及本書所使用的檔案數據資料。第2章利用簡單線性迴歸(SLR)模型說明計量經濟學的主要方法:OLS,以及如何於Python下操作。第3章則比較古典與新古典線性迴歸模型的基本假定,該章透過SLR模型簡單說明。第4章介紹MLR模型,該章的特色說明了複迴歸模型無法避免地會遇到線性重合的問題,並且進一步利用模擬的方法以比較解釋變數於存在不同程度的線性重合下的結果。第5章則完整介紹NLRM的基本假定,其中包括多元線性限制下的F檢定之應用。第6章進一步說明迴歸模型的大樣本推論以及OLS估計式之漸近有效性。第7章除了討論MLR模型的一些包括特殊函數型態(如對數函數、二次式以及交互變數型態)之外,該章亦說明了估計迴歸模型的預測部分。第8章檢視迴歸模型下的質性變數,其中包括因變數亦為質性變數的情況。第9章則說明變異數異質的結果以及使用穩健的標準誤;另一方面,該章亦介紹如何使用WLS方法以及應用。第10章檢視模型設定問題,其中包括代理變數、因變數與自變數之衡量誤差、離群值與最小絕對誤差等。
由於是屬於計量經濟學導論,故讀者應該有學過基礎統計學的背景,不過為了能迅速進入狀況,《計導I》亦附有附錄A~F供讀者參考,其中附錄A有簡單介紹Python的一些與計量經濟學內容有關的指令;另一方面,也許讀者對於附錄E與F較不熟悉,但可以先練習看看。換句話說,也許讀者可以先閱讀《計導I》內的附錄,上述附錄的特色是有使用正文內的模擬方法與技巧,此對於正文的瞭解應有助益。
《計導I》的完成應該是筆者實現了多年來的想法,遍尋不到令人滿意的書籍,乾脆由筆者親自「操刀」,此應該也算是《計導I》的特色吧!目前筆者正在撰寫《計導II》,其中panel data的分析是頗吸引人的,期待《計導II》很快就能與讀者見面。隨書亦附有兒子的一些作品,欣見兒子的繪畫風格已逐漸成形,與大家共勉之。感謝內人提供一些意見,筆者才疏識淺,倉促成書,錯誤難免,望各界先進指正。最後,祝 操作順利。
林進益
寫於屏東崁頂
2024/8/10
計量經濟學(econometrics)是一門相當有意思的學科,早期資訊不發達,我們大部分止於計量理論的探討或只是「跑跑迴歸」而已;不過,真的僅是如此嗎?當代個人電腦或網路已非比尋常,大概是受到「大數據」觀念的影響,如今於網路上,大型或普通的檔案數據資料已相當充斥,若再來檢視計量經濟學,我們發現已不可同日而語了。最明顯的例子已出現在自由軟體如Python 或R 語言上。例如:檢視Python內模組(linearmodels)之wage_panel檔案,於該檔案內竟然有52,320個觀察值!類似的情況在R語言的程式套件如AER或Ecdat內,早已司空見慣了。
...
目錄
第1章 導論
1.1 何謂計量經濟學?
1.2 資料的類型
1.3 資料產生過程與其他情況不變
1.4 本書所使用的檔案數據資料
第2章 簡單迴歸模型
2.1 簡單迴歸模型的定義
2.2 OLS估計式
2.2.1 OLS估計式的導出
2.2.2 Python的操作
2.3 迴歸式的特徵
2.3.1 配適值與殘差值
2.3.2 配適度
第3章 簡單的新古典線性迴歸模型
3.1 sCLRM(sNLRM)的假定
3.1.1 線性迴歸模型
3.1.2 條件誤差的假定
3.1.3 其餘假定
3.2 不偏性與一致性
3.2.1 不偏性
3.2.2 一致性
3.3 統計推論
第4章 複線性迴歸模型:線性重合
4.1 MLR模型
4.1.1 MLR模型的特色
4.1.2 OLS之估計
4.1.3 Frisch-Waugh定理
4.1.4 t檢定
4.2 配適度與線性重合
4.2.1 配適度
4.2.2 調整的R2
4.3 線性重合
4.3.1 相關的自變數
4.3.2 再談βj的標準誤
第5章 新古典線性迴歸模型
5.1 NLRM的基本假定
5.1.1 OLS估計式的不偏性
5.1.2 變異數異質
5.1.3 OLS估計式的抽樣分配
5.2 多元線性限制檢定:F檢定
5.2.1 多餘解釋變數的檢定
5.2.2 整體迴歸式顯著性之F檢定
5.2.3 一般的線性限制檢定
第6章 複迴歸分析:OLS之漸近性
6.1 一致性
6.2 漸近常態與大樣本推論
6.3 LM檢定
6.4 OLS的漸近有效性
第7章 複迴歸分析:其他問題
7.1 數據單位對OLS估計的影響
7.1.1 數據單位不同
7.1.2 貝他係數
7.2 一些特殊函數型態的檢視
7.2.1 對數函數型態
7.2.2 二次式模型
7.2.3 交互作用項
7.3 預測
7.3.1 預測區間
7.3.2 因變數是log(y)
第8章 質性資料
8.1 質性資料
8.1.1 單一虛擬自變數
8.1.2 多個虛擬變數
8.2 虛擬變數之交互影響與跨群差異之檢定
8.2.1 虛擬變數之交互影響
8.2.2 跨群差異之檢定(鄒檢定)
8.3 二元因變數
8.3.1 何謂線性機率模型?
8.3.2 應用
第9章 變異數異質性
9.1 變異數為異質與穩健的標準誤
9.2 變異數異質之檢定
9.2.1 Breusch-Pagan檢定
9.2.2 White檢定
9.3 加權最小平方與一般最小平方估計
9.3.1 加權最小平方估計
9.3.2 可行的一般最小平方估計
9.4 再談線性機率模型
第10章 模型設定的問題
10.1 模型設定誤差
10.1.1 函數型態誤設
10.1.2 RESET檢定
10.1.3 非包含模型之檢定
10.2 代理變數
10.2.1 無法觀察到的解釋變數
10.2.2 遞延落後項
10.2.3 隨機斜率模型
10.3 衡量誤差
10.3.1 因變數存在衡量誤差
10.3.2 解釋變數存在衡量誤差
10.4 離群值與最小絕對估計
10.4.1 離群值與有影響力的觀察值
10.4.2 最小絕對估計
附錄A Python導論
A.1 本書的操作方式
A.2 使用模組
A.3 物件
A.3.1 變數
A.3.2 Python內的物件
A.3.3 模組(numpy)內的物件
A.3.4 模組(pandas)內的物件
A.4 迴圈、函數與條件指令
A.4.1 自設函數
A.4.2 迴圈與條件指令
A.5 圖形的繪製
附錄B 基本數學與模擬
B.1 加總操作式與敘述統計量
B.2 線性函數、二次式函數與特殊的函數
B.2.1 線性函數
B.2.2 二次式函數
B.2.3 特殊的函數
B.3 微分
附錄C 基本的機率觀念
C.1 隨機變數
C.1.1 間斷的隨機變數
C.1.2 連續的隨機變數
C.2 聯合分配、條件分配與獨立性
C.2.1 聯合機率分配與獨立性
C.2.2 條件機率分配
C.3 機率分配的特徵
C.3.1 單變量機率分配
C.3.2 聯合機率分配的特徵
C.3.3 條件機率分配的特徵
附錄D 機率分配
D.1 單變量機率分配
D.1.1 常態分配
D.1.2 卡方分配
D.1.3 t分配
D.1.4 F分配
D.2 多變量機率分配
D.2.1 多變量常態分配
D.2.2 多變量t分配
附錄E 估計式
E.1 估計式的特徵
E.1.1 母體、參數值與隨機抽樣分配
E.1.2 估計式的有限樣本特徵
E.1.3 估計式的大樣本特徵
E.1.4 漸近常態
E.2 參數估計的一般方法
E.2.1 動差法
E.2.2 最小平方法
附錄F 矩陣代數
F.1 基本定義
F.2 矩陣的操作
F.3 線性獨立與矩陣的秩
F.4 迴歸模型與OLS
參考文獻
中文索引
英文索引
第1章 導論
1.1 何謂計量經濟學?
1.2 資料的類型
1.3 資料產生過程與其他情況不變
1.4 本書所使用的檔案數據資料
第2章 簡單迴歸模型
2.1 簡單迴歸模型的定義
2.2 OLS估計式
2.2.1 OLS估計式的導出
2.2.2 Python的操作
2.3 迴歸式的特徵
2.3.1 配適值與殘差值
2.3.2 配適度
第3章 簡單的新古典線性迴歸模型
3.1 sCLRM(sNLRM)的假定
3.1.1 線性迴歸模型
3.1.2 條件誤差的假定
3.1.3 其餘假定
3.2 不偏性與一致性
3.2.1 不偏性
3.2.2 一致性
3.3 統計推論
第4章 複線性迴歸模型:線性重合
4.1 MLR模型
4.1.1...