從事資料科學方面的工作時,活用各種相關函式庫、軟體框架、模組、工具包是很好的做法,但如果原本完全不懂資料科學,從頭開始也是一種不錯的做法。本書將採取土法煉鋼從頭學起的方式,帶領讀者認識與資料科學相關的許多工具與演算法。
你只要具備基本的數學能力,以及程式設計的基礎,本書就可以幫你在遇到相關的數學與統計知識時,不至於感到害怕,而且還能讓你學會一個資料科學家所需具備的相關駭客技術。如今到處充斥著各種雜亂的數據資料,其中包含許多問題的解答,但也有很多微妙之處,甚至連問題本身都還沒被提出來過。如果你真心想要挖掘問題的解答,本書將可以提供你一些相關的知識。
.首先來一堂Python速成班
.學習線性代數、統計、機率的基礎知識——並學會何時、如何在資料科學領域中靈活運用這些知識
.搜集、探索、清理、轉換、處理各種數據資料
.深入理解機器學習的基礎
.靈活運用像是k最近鄰、單純貝氏、線性與邏輯迴歸、決策樹、神經網路、集群等種種模型
.探討推薦系統、自然語言處理、網路分析、MapReduce與資料庫的相關知識
名人推薦
「Joel帶領我們領略探索資料科學,讓我們從一般的好奇心,進入到更深入的理解,並學會所有資料科學家都應該知道的各種實用演算法。」 ——Rohit Sivaprasad, Soylent公司資料科學家