本書特色
通俗易懂、零基礎也能學機器學習、快速入門人工智慧領域
►完整的工具,包括Numpy, Pandas, Matplotlib
►經典的演算法,包括回歸、決策樹、集成、特徵工程、SVM、推薦系統、
降維、聚類
►深度學習,包括神經網路、CNN、LSTM、RNN等
►真正專案實作,包括信用卡詐欺、氣溫預測、新聞分類、音樂推薦系統、TensorFlow、影評情感分析等
本書主要內容
結合機器學習、資料分析和Python語言,透過實際案例以通俗易懂的方式講解如何將演算法應用到實際工作。
全書共20章,大致分為4個部分:
第1部分 介紹Python的工具套件,包括科學計算函數庫Numpy、資料分析函數庫Pandas、視覺化函數庫Matplotlib
第2部分 講解機器學習中的經典演算法,例如回歸演算法、決策樹、整合演算法、特徵工程、支援向量機、推薦系統、降維演算法、分群演算法等
第3部分 介紹深度學習中的常用演算法,包括神經網路、卷積神經網路、遞迴神經網路
第4部分 專案實戰,從零開始結合Python工具套件與機器學習演算法,以真實資料集為基礎,將演算法模型應用到實際業務中。
適合讀者群 對人工智慧、機器學習、資料分析,感興趣的初學者和愛好者。
作者簡介:
唐宇迪
電腦博士,網易雲課堂人工智慧認證行家,51CTO學院講師,CSDN博客專家、講師。多年人工智慧領域培訓經驗,帶領研發團隊開發60多種AI課程,涵蓋當下人工智慧熱門領域。以豐富的教學講解經驗,通俗易懂的授課風格,幫助讀者進入人工智慧領域。
作者序
前言
人工智慧的高速發展,帶來了豐富的機遇與挑戰。機器學習演算法工程師、資料採擷工程師、大數據工程師等職位的薪資在IT 企業也頗豐。面對高薪與前端技術的誘惑,越來越多的大學畢業生準備投身其中,但苦於缺乏指導性教材進行系統學習,非專業出身的大學畢業生更是缺乏相關數學基礎。
本書最大的特色就是以接地氣的方式向大家通俗地說明演算法原理與應用方法,讓讀者能夠更輕鬆地去了解其中每一個複雜的演算法。學習的目的一定要在實際工作中發揮作用,希望更多讀者能將理論與實戰方法應用到自己的業務中,所以本書整體風格是以實戰為主,透過案例來解讀如何將機器學習應用在實際的資料採擷工作中。
✤ 本書針對的讀者
本書主要針對對人工智慧、機器學習、資料分析等方面有強烈興趣的初學者和同好,透過本書的學習,讀者能夠掌握機器學習中經典演算法原理推導、整體流程以及其中數學公式與各種參數的作用。案例全部採用當下流行的Python 語言,從最基礎的工具套件開始講起,讓大家熟練使用Python 及其資料科學工具套件進行機器學習和資料採擷領域的專案實戰工作,並處理其中遇到的種種問題。
✤ 路線圖
歸納起來比較合適的學習路線如下。
第①步:Python 工具套件的使用,先把稱心如意的「兵器」準備好,它們是實戰中的好幫手。
第②步:了解機器學習演算法,建模分析的核心就是其中的演算法了,打牢基礎才能走得更遠。
第③步:專案實戰應用,將演算法模型應用到實際業務中,透過實際工作來進行提升。可能很多讀者都覺得應當先把Python 的基礎打牢固再進行後續的學習,我覺得這樣可能會花費較多時間,進一步擔誤後續重點內容學習,建議讀者對於程式語言透過實際案例邊練邊學,把重點放在機器學習原理與應用中。
✤ 閱讀本書需要準備什麼 / 如何使用本書
對初學者來說,可能在學習路線以及職業規劃上有些迷茫,這裡結合機器學習與資料科學領域的了解來進行說明分析。首先無論從事人工智慧中哪個方向,一定要從工程師做起,那手裡一定得有一個稱心如意的「兵器」,本書選擇的是Python 語言,基於3.x 版本進行實戰示範。讀者如果具備大學數學基礎,學習起來會相對更容易一些,在學習過程中,難免遇到各種難以了解的演算法問題,建議大家先對其整體流程進行通俗了解,再結合實際案例進行思考,很多時候數學上的描述十分複雜,而程式中的解釋卻淺顯容易。專案實戰的目的一方面是從應用的角度說明如何進行實際工作建模與分析,另一方面也是一個累積的過程。人工智慧企業發展迅速,不要停下學習的腳步,每天都要學習新的知識來充實自己。
✤ 搭配資源
請至本公司官網https://www.deepmind.com.tw/ 搜尋本書,並且前往對應的頁面下載即可。本書作者為中國大陸人士,為維持程式碼執行正確,本書原始程式碼將保持簡體中文,請讀者對照書中內容執行。
✤ 建議與回饋
由於作者水準有限,書中難免有錯誤和不當之處,歡迎讀者指正。如果讀者遇到問題需要幫助,也歡迎交流(微訊號:digexiaozhushou),我期望與你共同成長。
前言
人工智慧的高速發展,帶來了豐富的機遇與挑戰。機器學習演算法工程師、資料採擷工程師、大數據工程師等職位的薪資在IT 企業也頗豐。面對高薪與前端技術的誘惑,越來越多的大學畢業生準備投身其中,但苦於缺乏指導性教材進行系統學習,非專業出身的大學畢業生更是缺乏相關數學基礎。
本書最大的特色就是以接地氣的方式向大家通俗地說明演算法原理與應用方法,讓讀者能夠更輕鬆地去了解其中每一個複雜的演算法。學習的目的一定要在實際工作中發揮作用,希望更多讀者能將理論與實戰方法應用到自己的業務中,所以本書整體風格是以實...
目錄
前言
01人工智慧入門指南
1.1 AI 時代首選Python
1.2 人工智慧的核心—機器學習
1.3 環境設定
本章歸納
02 科學計算函數庫(Numpy)
2.1 Numpy 的基本操作
2.2 索引與切片
2.3 資料類型與數值計算
2.4 常用功能模組
本章歸納
03 資料分析處理函數庫(Pandas)
3.1 資料前置處理
3.2 資料分析
3.3 常用函數操作
3.4 大資料處理技巧
本章歸納
04 資料視覺化函數庫(Matplotlib)
4.1 正常繪圖方法
4.2 常用圖表繪製
本章歸納
05 回歸演算法
5.1 線性回歸演算法
5.2 梯度下降演算法
5.3 邏輯回歸演算法
本章歸納
06 邏輯回歸專案實戰—信用卡詐騙檢測
6.1 資料分析與前置處理
6.2 下取樣方案
6.3 邏輯回歸模型
6.4 過取樣方案
07 決策樹
7.1 決策樹原理
7.2 決策樹剪枝策略
本章歸納
08 整合演算法
8.1 bagging 演算法
8.2 boosting 演算法
8.3 stacking 模型
本章歸納
09 隨機森林專案實戰—氣溫預測
9.1 隨機森林建模
9.2 資料與特徵對結果影響分析
9.3 模型調參
專案歸納
10 特徵工程
10.1 數值特徵
10.2 文字特徵
10.3 論文與benchmark
本章歸納
11 貝氏演算法專案實戰—新聞分類
11.1 貝氏演算法
11.2 新聞分類工作
專案歸納
12 支援向量機
12.1 支援向量機工作原理
12.2 支援向量的作用
12.3 支援向量機有關參數
12.4 案例:參數對結果的影響
本章歸納
13 推薦系統
13.1 推薦系統的應用
13.2 協作過濾演算法
13.3 隱語義模型
本章歸納
14 推薦系統專案實戰—打造音樂推薦系統
14.1 資料集清洗
14.2 以相似度為基礎的推薦
14.3 以矩陣分解為基礎的推薦
專案歸納
15 降維演算法
15.1 線性判別分析
15.2 主成分分析
本章歸納
16 分群演算法
16.1 K-means 演算法
16.2 DBSCAN 分群演算法
16.3 分群實例
本章歸納
17 神經網路
17.1 神經網路必備基礎
17.2 神經網路整體架構
17.3 網路最佳化細節
本章歸納
18 TensorFlow 實戰
18.1 TensorFlow 基本操作
18.2 架設神經網路進行手寫字型識別
本章歸納
前言
01人工智慧入門指南
1.1 AI 時代首選Python
1.2 人工智慧的核心—機器學習
1.3 環境設定
本章歸納
02 科學計算函數庫(Numpy)
2.1 Numpy 的基本操作
2.2 索引與切片
2.3 資料類型與數值計算
2.4 常用功能模組
本章歸納
03 資料分析處理函數庫(Pandas)
3.1 資料前置處理
3.2 資料分析
3.3 常用函數操作
3.4 大資料處理技巧
本章歸納
04 資料視覺化函數庫(Matplotlib)
4.1 正常繪圖方法
4.2 常用圖表繪製
本章歸納
05 回歸演算法
5.1 線性回歸演算法
5.2 梯度下降演算法
5.3 邏輯回歸演算...