機器學習需要一條脫離過高理論門檻的入門之路。本書繞過理論障礙,打通了一條由淺入深的機器學習之路。豐富的實戰案例講解,介紹如何將機器學習技術運用到股票量化交易、圖片渲染、圖片識別等領域。
本書包含兩部分:機器學習篇和深度學習篇。
機器學習篇,主要從零開始,介紹什麼是資料特徵、機器學習模型,如何訓練模型、偵錯模型,以及如何評估模型的成績。透過一些簡單的工作實例,說明在使用模型時如何分析並處理工作資料的特徵,如何組合多個模型共同完成工作,並嘗試將機器學習技術運用到股票交易中,重複熟悉這些技術的同時,感受機器學習技術在落實到專業領域時常犯的錯誤。
深度學習篇,則主要介紹一些很基礎的深度學習模型,如DNN、CNN 等,簡單涵蓋一些RNN 的概念描述。我們更關注模型的直觀原理和背後的生物學設計理念,希望讀者能夠帶著這些了解,直接上手應用深度學習架構。
本書適合有Python程式設計能力的讀者。如果讀者有簡單的數學基礎,了解機率、矩陣則更佳。使用過Numpy、pandas 等資料處理工具的讀者讀起來也會更輕鬆,但這些都不是必需的。
本書所附程式可在http://www.topteam.cc 佳魁官網下載
作者簡介:
阿布:多年互聯網金融技術經驗,曾就職於奇虎360、百度互聯網證券、百度金融等互聯網型金融公司,現為自由職,個人量化交易者,擅長個人中小資金量化交易領域系統開發,以及為中小型量化私募資金提供技術解決方案、技術支援、量化培訓等工作。|
胥嘉幸:北京大學碩士,先後任職百度金融證券、百度糯米搜索部門。致力於大數據機器學習方面的研究,有深厚的數學功底和理論支撐。將機器學習技術融於傳統金融量化領域方面頗有研究。
作者序
前言
越來越多的人期待能擠進機器學習這一領域,這些人常常有一些程式設計和自學能力,但數學等基礎理論能力不足。對於這些人群,從頭開始學習機率統計等基礎學科是痛苦的,如果直接上手使用機器學習工具常常又感到了解不足,缺少點什麼。本書就是針對這一人群,避過數學推導等複雜的理論推衍,介紹模型背後的一些簡單直觀的了解,以及如何上手使用。
本書希望能夠獲得這些人的喜愛。
全書包含兩部分:機器學習篇和深度學習篇。
機器學習篇(1 ∼ 3章)主要從零開始,介紹什麼是資料特徵、機器學習模型,如何訓練模型、偵錯模型,以及如何評估模型的成績。透過一些簡單的工作實例,說明在使用模型時如何分析並處理工作資料的特徵,如何組合多個模型共同完成工作,並在第3章初步嘗試將機器學習技術運用到股票交易中,重複熟悉這些技術的同時,感受機器學習技術在落實到專業領域時常犯的錯誤。
深度學習篇(4 ∼ 9章)主要介紹一些很基礎的深度學習模型,如DNN、CNN等,簡單涵蓋一些RNN的概念描述。我們更關注模型的直觀原理和背後的生物學設計理念,希望讀者能夠帶著這些了解,直接上手應用深度學習架構。
說一點關於閱讀本書的建議。本書在撰寫時不關注模型技術的數學推導及嚴謹表述,轉而關注其背後的直觀原理了解。建議讀者以互動執行程式的方式學習,所有範例使用IPython Notebook撰寫。讀者可在Git找到對應章節的內容,一步步執行書中說明的基礎知識,直觀感受每一步的執行效果。本書官網所附程式在http://www.topteam.cc下載,為繁體中文版,作者簡體中文程式下載網址則為:https://github.com/bbfamily/abu。簡體中文程式會不時更新,讀者們可以隨時去github查看。
本書適合有Python程式設計能力的讀者。如果讀者有簡單的數學基礎,了解機率、矩陣則更佳。使用過Numpy、pandas等資料處理工具的讀者讀起來也會更輕鬆,但這些都不是必需的。如果讀者缺乏Python程式設計能力,或希望進一步獲得Numpy、pandas等工具使用相關的知識,可以關注公眾號:abu_quant,獲得一些技術資料及文章。
感謝出版社提供機會讓我們撰寫本書,感謝編輯不辭辛苦地和我溝通排版等細節問題。
本書的完成同樣需要感謝我的幾位朋友:吳汶(老虎美股)、劉兆丹(百度金融),感謝你們在本書撰寫作過程中提供的有力支援。感謝本書的試讀人員:蔡志威、李寅龍。
前言
越來越多的人期待能擠進機器學習這一領域,這些人常常有一些程式設計和自學能力,但數學等基礎理論能力不足。對於這些人群,從頭開始學習機率統計等基礎學科是痛苦的,如果直接上手使用機器學習工具常常又感到了解不足,缺少點什麼。本書就是針對這一人群,避過數學推導等複雜的理論推衍,介紹模型背後的一些簡單直觀的了解,以及如何上手使用。
本書希望能夠獲得這些人的喜愛。
全書包含兩部分:機器學習篇和深度學習篇。
機器學習篇(1 ∼ 3章)主要從零開始,介紹什麼是資料特徵、機器學習模型,如何訓練模型、偵錯模型,以及...
目錄
前言
第一篇 機器學習篇
第1章 初識機器學習
1.1 機器學習——指定機器「學習」的靈魂
1.2 KNN——相似的鄰居請投票
1.3 邏輯分類I:線性分類模型
1.4 邏輯分類II:線性分類模型
第2章 機器學習進階
2.1 特徵工程
2.2 偵錯模型
2.3 分類模型評估指標
2.4 回歸模型
2.5 決策樹模型
2.6 模型融合
第3章 實戰:股票量化
3.1 第一步:建置童話世界
3.2 第二步:應用機器學習
3.3 第三步:在真實世界應用機器學習
第二篇 深度學習篇
第4章 深度學習:背景和工具
4.1 背景
4.2 深度學習架構簡介
4.3 深度學習架構快速上手
4.4 Caffe 實現邏輯分類模型
第5章 深層學習模型
5.1 解密生物智慧
5.2 DNN神經網路模型
5.3 神經元的深層網路結構
5.4 典型的DNN 深層網路模型:MLP
5.5 Caffe 實現MLP
第6章 學習空間特徵
6.1 前置處理空間資料
6.2 描述圖片的空間特徵:特徵圖
6.3 CNN 模型I:旋積神經網路原理
6.4 CNN 模型II:圖片識別
6.5 CNN 的實現模型
6.6 微訓練模型(Fine-Tuning)
第7章 Caffe 實例:狗狗品種辨別
7.1 準備圖片資料
7.2 訓練模型
7.3 使用產生的模型進行分類
第8章 漫談時間序列模型
8.1 Embedding
8.2 輸出序列的模型
8.3 深度學習:原理篇歸納
第9章 用深度學習做個藝術畫家:模仿實現prisma
9.1 機器學習初探藝術作畫
9.2 實現秒級藝術作畫
附錄A 機器學習環境部署
附錄B 深度學習環境部署
附錄C 隨書程式執行環境部署
前言
第一篇 機器學習篇
第1章 初識機器學習
1.1 機器學習——指定機器「學習」的靈魂
1.2 KNN——相似的鄰居請投票
1.3 邏輯分類I:線性分類模型
1.4 邏輯分類II:線性分類模型
第2章 機器學習進階
2.1 特徵工程
2.2 偵錯模型
2.3 分類模型評估指標
2.4 回歸模型
2.5 決策樹模型
2.6 模型融合
第3章 實戰:股票量化
3.1 第一步:建置童話世界
3.2 第二步:應用機器學習
3.3 第三步:在真實世界應用機器學習
第二篇 深度學習篇
第4章 深度學習:背景和工具
4.1 背景
4.2 深度學習架構簡介
4.3 ...