本書是香港珠海學院商學院「新動力、新金融」叢書的第一本,是香港第一本以中文編寫的金融數據建模參考書和學術著作,主要針對高校專業型授課研究生、大學經濟金融類高年級學生或同等學歷的讀者。作者希望在經典金融數據建模理論的基礎上,更偏應用性地關注數據的分析和應用,以達到激發讀者興趣和動手實驗、理論結合實踐的效果。
作者簡介:
劉曉全
上海財經大學博士學歷,研究方向為複雜網路與公司金融,深度學習與實證資產定價。曾任職於華潤,西南證券(香港),愛建集團(香港)等實業和金融業單位。
孔笑微
香港大學經濟金融學博士,本科與碩士研究生畢業於南開大學,香港珠海學院商學院財務金融系主任、副教授,金融創新實驗室主任。研究興趣領域包括金融經濟學、公司治理、資產定價、金融科技以及經濟史。
張俊喜
美國匹茲堡大學經濟學博士,本科與碩士研究生畢業於南開大學,香港珠海學院商學院院長、教授。曾任教於香港中文大學、香港大學、英國鄧迪大學、新加坡國立大學、北京大學、中央財經大學、南開大學。研究興趣領域為金融經濟學、公司治理、貨幣經濟學、開放宏觀經濟學。
索引編輯、代碼特別審核編輯簡介
趙嘉惠
香港都會大學社會科學學士:應用社會研究;現致研金融科技及量化金融學,擁有三年以上為學術期刊出版物調查個人決策的研究經驗,一年於香港金融科技公司參與創建加密貨幣交易平台經驗,以及兩年以上於香港高等教育機構工作經驗。
作者序
作者的話
西諺有云「凡走過必留下痕跡」,人類以收集和分析數據作為理解自然與社會的手段,自文明歷史以來源遠流長。在近代科學革命之後,數據的獲取與處理技術突飛猛進,在方法論意義上,實證科學成為認識與改造世界的最強大工具之一。人類的經濟領域是對數據分析最依賴的社會科學,不同於自然科學在實驗室受控環境中獲得可重複、可檢驗的實驗數據,經濟數據具有被動性、時效性、低識別度和複雜性的特點,對分析方法的要求極高,而經濟價值又巨大,特別是現代金融市場出現之後,海量、高頻率、連續、多維結構化的市場信息流,直接促成了對金融理論顛覆性的變革和衝擊。
數據驅動的深度研究伴隨現代金融理論體系的誕生而興起,自從馬科維茨(Markowitz)於二十世紀五十年代提出資產組合理論開始,到里程碑式的布萊克-斯科爾斯期權定價模型(Black-Scholes Option Pricing Model)金融數據哺育下的實證研究,尤其是統計計量方法和隨機分析方法,逐漸形成為基於金融數據的系統性量化方法論。進入二十一世紀,信息技術革命突破新階段,人工智能與金融科技蓬勃發展,海量而多維的金融數據為以統計為基礎的人工智能展開了巨大施展空間,神經網絡、機器學習、深度學習方法在金融數據分析中立刻找到理論立足點和隨之而來的廣泛應用。
二十一世紀的全球金融格局,一方面迎接以人工智能、區塊鏈等技術為代表的新信息革命帶來的巨大機遇,另一方面正在應對全球政治經濟地緣性矛盾爆發利益格局調整的巨大內生風險。在2024 年中國省級主要領導幹部推動金融高質量發展專題研討班開班式上,總書記指出「金融強國應當基於強大的經濟基礎,具有領先世界的經濟實力、科技實力和綜合國力,同時具備一系列關鍵核心金融要素」,為當下中國金融應對挑戰的大方案奠定了基調。以香港、深圳為核心的大灣區,在金融市場發展與新科創產業兩方面,都堪稱中國積累最深厚、優勢最突出的地區,理應持續培養和輸送新一代兼備金融理論和實踐技術、掌握全球視野和中國優勢的特色人才。《數據分析與金融建模》是香港珠海學院商學院「新動力、新金融」叢書的第一本,是香港第一本針對高校專業型授課研究生,大學經濟金融類高年級學生或同等學歷的讀者,以中文編寫的金融數據建模參考書和學術著作。我們寫作和出版本書的目的是希望在經典金融數據建模理論的基礎上,更偏應用性地關注數據的分析和應用,以達到激發讀者興趣和動手實驗,理論結合實踐的效果。本書既涵蓋了均值方差模型、資本資產定價模型、多因子模型、時間序列和波動性模型等經典內容,也歸納了機器學習和深度學習在金融建模中的前沿學術發展和最新應用,並且探索了生成式人工神經網絡在處理實證資產定價方面的應用案例。
本書的另一個重要特點,考慮到香港作為人民幣國際離岸交易中心的實際需求,將用於香港本地實際操作練習的案例和數據,大部分使用中國地區A 股或港股數據,或者部分使用其他亞洲地區與國家數據,而不像香港類似教學內容或參考書籍目前常規採用的,以美股數據為主進行教學練習。這種做法的目的是便於讀者在使用本書的過程中,直接運用代碼和數據進行人民幣資產的投資管理實踐或者實證定價研究。
本書的案例與習題代碼以Python 語言寫成,這是考慮到Python 在金融業界的使用日益普遍,逐漸成為主流的金融應用計算機語言。本書例題和習題數據,由希施瑪金融科技公司(CSMAR)提供,它是中國金融市場數據知名的數據供應商,也是珠海學院商學院以及金融創新實驗室的戰略合作夥伴,例題的代碼和樣本數據我們將在出版后一定年限內提供讀者免費下載。
本書單列了名詞索引,方便讀者查閱,索引部分的編輯者為香港珠海學院商學院金融創新實驗室研究助理趙嘉惠女士。
本書能順利成書和出版,首先鳴謝香港珠海學院、中華書局的大力資助和支持,香港管理學院、上海財經大學、希施瑪數據科技公司也在成書過程中對作者提供了重要協助,在此誠懇致謝。本書錯誤與疏漏由作者負責,希望讀者在閱讀過程中有所收穫,歡迎提出批評建議和反饋,以學術會友,乃是作者最重要的初衷。
作者的話
西諺有云「凡走過必留下痕跡」,人類以收集和分析數據作為理解自然與社會的手段,自文明歷史以來源遠流長。在近代科學革命之後,數據的獲取與處理技術突飛猛進,在方法論意義上,實證科學成為認識與改造世界的最強大工具之一。人類的經濟領域是對數據分析最依賴的社會科學,不同於自然科學在實驗室受控環境中獲得可重複、可檢驗的實驗數據,經濟數據具有被動性、時效性、低識別度和複雜性的特點,對分析方法的要求極高,而經濟價值又巨大,特別是現代金融市場出現之後,海量、高頻率、連續、多維結構化的市場信息流,直接促成了對...
目錄
作者的話 . . . v i i
第一章 概述 . . . 1
數據應用 . . . 3
金融建模 . . . 6
第二章 金融數據介紹、收益率與投資組合有效前沿 . . . 11
與金融建模相關的數據基礎 . . . 1 3
描述性統計 . . . 1 7
收益率計算 . . . 2 1
收益率的分佈統計 . . . 2 5
機會集合與有效前沿 . . . 3 4
第三章 債券數據分析 . . . 5 1
貨幣的時間價值與債券定價 . . . 5 3
到期收益率的計算 . . . 5 6
債券價格與收益率的關係 . . . 5 7
債券價格與到期時間的關係 . . . 5 9
債券價格的波動性與價格彈性 . . . 6 1
債券投資風險控制- 利率掉期工具為例 . . . 7 1
收益率曲線 . . . 7 3
中資美元債與境外人民幣債概覽 . . . 8 0
宏觀市場利率與泰勒規則 . . . 8 8
第四章 迴歸分析 . . . 9 3
最小二乘法(OLS) . . . 9 4
單變量線性迴歸及檢驗 . . . 9 9
多變量線性迴歸及檢驗 . . . 1 0 6
多元迴歸研究案例分析 . . . 1 0 8
邏輯迴歸與案例分析 . . . 1 2 0
第五章 資產定價模型與因子模型 . . . 1 2 5
CAPM 模型〔單因子(市場)模型〕 . . . 1 2 7
多因子模型 . . . 1 3 3
時序迴歸與橫截面迴歸檢驗 . . . 1 3 5
Fama-MacBeth 迴歸檢驗 . . . 1 3 7
因子正交化 . . . 1 3 8
理論定價模型(APT 模型)與定價核 . . . 1 3 9
因子模型的量化實戰應用 . . . 1 4 1
第六章 時間序列及波動率相關模型 . . . 1 5 7
時間序列分析的基本概念介紹 . . . 1 5 9
自迴歸模型(AR 模型) . . . 1 6 1
移動平均模型(MA 模型) . . . 1 6 1
偏自相關函數和信息準則的定階 . . . 1 6 2
ARMA 模型的應用 . . . 1 6 3
向量自迴歸模型(VAR 模型)與脈衝分析 . . . 1 6 6
VAR 脈衝分析與因子收益率預測 . . . 1 7 2
自迴歸異方差模型(ARCH 模型) . . . 1 7 3
自迴歸異方差模型的應用 . . . 1 7 6
第七章 深度學習與實證資產定價 . . . 1 7 9
深度學習發展歷程回顧 . . . 1 8 1
實證資產定價與機器學習 . . . 1 8 6
神經網絡算法基礎 . . . 1 9 9
深度學習融入實證資產定價的前沿探索 . . . 2 0 7
生成式人工神經網絡與A 股實證定價研究 . . . 2 1 0
結束語- 從亞里士多德到現代數理邏輯之思. . . 2 3 3
索引 . . . 2 3 7
作者的話 . . . v i i
第一章 概述 . . . 1
數據應用 . . . 3
金融建模 . . . 6
第二章 金融數據介紹、收益率與投資組合有效前沿 . . . 11
與金融建模相關的數據基礎 . . . 1 3
描述性統計 . . . 1 7
收益率計算 . . . 2 1
收益率的分佈統計 . . . 2 5
機會集合與有效前沿 . . . 3 4
第三章 債券數據分析 . . . 5 1
貨幣的時間價值與債券定價 . . . 5 3
到期收益率的計算 . . . 5 6
債券價格與收益率的關係 . . . 5 7
債券價格與到期時間的關係 . . . 5 9
債券價格的波動性與價格彈性 . . . 6 1
債券投資風險控制- 利率掉期工具為例 . ...