內容簡介:從事資料科學方面的工作時,活用各種相關函式庫、軟體框架、模組、工具包是很好的做法,但如果原本完全不懂資料科學,從頭開始也是一種不錯的做法。本書將採取土法煉鋼從頭學起的方式,帶領讀者認識與資料科學相關的許多工具與演算法。
你只要具備基本的數學能力,以及程式設計的基礎,本書就可以幫你在遇到相關的數學與統計知識時,不至於感到害怕,而且還能讓你學會一個資料科學家所需具備的相關駭客技術。如今到處充斥著各種雜亂的數據資料,其中包含許多問題的解答,但也有很多微妙之處,甚至連問題本身都還沒被提出來過。如果你真心想要挖掘問題的解答,本書將可以提供你一些相關的知識。
.首先來一堂Python速成班
.學習線性代數、統計、機率的基礎知識——並學會何時、如何在資料科學領域中靈活運用這些知識
.搜集、探索、清理、轉換、處理各種數據資料
.深入理解機器學習的基礎
.靈活運用像是k最近鄰、單純貝氏、線性與邏輯迴歸、決策樹、神經網路、集群等種種模型
.探討推薦系統、自然語言處理、網路分析、MapReduce與資料庫的相關知識
名人推薦
「Joel帶領我們領略探索資料科學,讓我們從一般的好奇心,進入到更深入的理解,並學會所有資料科學家都應該知道的各種實用演算法。」
—— Rohit Sivaprasad, Soylent公司資料科學家
「對於想要了解機器學習的工程師而言,這是一本奠定基礎的最佳入門書。」
-- Tom Marthaler, Amazon專案經理
「要將資料科學的概念轉換為程式碼並不容易,這本書讓它變簡單了。」
-- William Cox, Grubhub機器學習工程師
目錄
章節說明:第1章 簡介
第2章 Python速成班
第3章 資料視覺化
第4章 線性代數
第5章 統計學
第6章 機率
第7章 假設與推論
第8章 梯度遞減
第9章 取得資料
第10章 處理資料
第11章 機器學習
第12章 k最近鄰
第13章 單純貝氏
第14章 簡單線性迴歸
第15章 多元迴歸
第16章 邏輯迴歸
第17章 決策樹
第18章 神經網路
第19章 深度學習
第20章 集群
第21章 自然語言處理
第22章 網路分析
第23章 推薦系統
第24章 資料庫與SQL
第25章 MapReduce
第26章 資料道德規範
第27章 勇往直前,資料科學做就對了
章節說明:第1章 簡介
第2章 Python速成班
第3章 資料視覺化
第4章 線性代數
第5章 統計學
第6章 機率
第7章 假設與推論
第8章 梯度遞減
第9章 取得資料
第10章 處理資料
第11章 機器學習
第12章 k最近鄰
第13章 單純貝氏
第14章 簡單線性迴歸
第15章 多元迴歸
第16章 邏輯迴歸
第17章 決策樹
第18章 神經網路
第19章 深度學習
第20章 集群
第21章 自然語言處理
第22章 網路分析
第23章 推薦系統
第24章 資料庫與SQL
第25章 MapReduce
第26章 資料道德規範
第27章 勇往直前,資料科學做就對了