機器學習：最強入門邁向AI高手王者歸來-FindBook 找書網 ISBN:9786267569337

內容簡介

機器學習
最強入門邁向AI高手
王者歸來(全彩印刷)
內容簡介
★★★★★【數學原理 + 演算法 + 真實案例 + 專題實作】★★★★★
★★★★★【數學 x機率 x 統計 x 演算法】★★★★★
★★★★★【機器學習演算法 x AI專題】★★★★★

AI時代的學習革命：用最簡單的方式掌握機器學習。
機器學習已成為當今科技領域的核心技能，但艱澀的數學與複雜的概念常讓人望而卻步。本書以淺顯易懂的白話解釋，結合全彩圖表輔助教學，幫助讀者輕鬆入門、快速掌握機器學習的核心知識與應用技巧。

本書特色

　　◎ 白話解釋機器學習：摒棄晦澀公式，以簡單明瞭的語言說明每個概念，配合豐富的全彩圖表，讓學習變得更輕鬆有趣。
　　◎ 基礎數學起步，實現 AI 場景應用：從基礎數學概念講解機器學習，逐步導入 AI 在生活中的實際應用，橋接理論與實務。
　　◎ 彩色圖解演算法，從小數據開始：用彩色圖像化的方式清晰呈現演算法的運作原理，並從簡單的　　小數據案例帶領讀者進入真實世界的應用。
　　◎ 實用程式碼範例：提供完整的 Python 程式碼範例，將理論知識與實務結合，幫助讀者快速上手，並理解如何將理論轉化為可行的程式解決方案。
　　◎ AI 專題實戰：涵蓋特徵選擇、模型選擇、超參數調整等進階主題，提供解決特定問題的策略與技巧，助力讀者邁向機器學習高手之路。

　　數學場景 × AI 實例
　　◎ 方程式、一元到多元函數
　　★餐廳經營、業務員績效、網路行銷 ... 等。
　　◎ 最小平方法
　　★國際證照考卷銷售、房價預測、便利店銷售 ... 等。
　　◎ 機率與單純貝式理論
　　★疾病分析、客戶購買意願、垃圾郵件 ... 等。
　　◎ 指數、對數與激活函數
　　★廣告效果、回購率分析 ... 等。
　　◎ 基礎統計
　　★超商數據、考試成績 ... 等。
　　◎迴歸分析
　　★臉書行銷、冰品銷售、網站購物 ... 等。
　　◎向量與矩陣
　　★網購行為分析、推薦系統、家庭用電預測 ... 等。

　　演算法原理 × AI 專題
　　◎ 房價預測
　　★ 波士頓房價
　　☆ 加州房價
　　◎ 葡萄酒專題
　　★ 葡萄酒分類與評價
　　◎ 醫療健康
　　★ 糖尿病診斷
　　☆ 乳腺癌檢測
　　★ 醫療保險分析
　　◎ 經典數據集
　　★ 鐵達尼號生存分析
　　☆ Telco 離網預測
　　 ★ 零售數據分析
　　◎ 信用風險與客戶分析
　　★ 信用卡欺詐偵測
　　☆ 購物中心客戶分群
　　◎ 科學與工程
　　★ 小行星撞地球風險預測
　　☆ 汽車燃料效率分析
　　◎ 文字與推薦系統
　　★ 新聞分類
　　☆ 情感分析
　　★ 電影推薦與評論
　　◎ 特色數據
　　★ 鳶尾花分類
　　☆ 蘑菇毒性判斷
　　★ 玻璃性質分析
　　◎ 圖像數據
　　★ 手寫數字識別
　　☆ 人臉數據分析
　　◎ 農業與食品
　　★ 小麥數據研究
　　☆ 老實泉噴發分析
　　◎ 體育與電子郵件
　　★ 足球射門分析
　　☆ 垃圾郵件過濾

　　將理論融入實際，從數據出發探索機器學習的多元應用，這是您邁向 AI 高手的最佳起點！

作者介紹

作者簡介

洪錦魁

　　2023 年博客來10 大暢銷華文作家，多年來唯一獲選的電腦書籍作者，也是一位跨越電腦作業系統與科技時代的電腦專家，著作等身的作家。
　　◆ DOS 時代他的代表作品是「IBM PC 組合語言、C、C++、Pascal、資料結構」。
　　◆ Windows 時代他的代表作品是「Windows Programming 使用 C、Visual Basic」。
　　◆ Internet 時代他的代表作品是「網頁設計使用 HTML」。
　　◆ 大數據時代他的代表作品是「R 語言邁向 Big Data 之路」。
　　◆ AI 時代他的代表作品是「機器學習 Python 實作」。
　　◆ 通用 AI 時代第 1 本「ChatGPT、Copilot、無料 AI、AI 職場、AI 行銷」作者。

　　作品曾被翻譯為簡體中文、馬來西亞文，英文，近年來作品則是在北京清華大學和台灣深智同步發行：
　　1：C、Java、Python、C#、R 最強入門邁向頂尖高手之路王者歸來
　　2：Python 網路爬蟲/ 影像創意/ 演算法邏輯思維/ 資料視覺化 - 王者歸來
　　3：網頁設計HTML+CSS+JavaScript+jQuery+Bootstrap+Google Maps 王者歸來
　　4：機器學習基礎數學、微積分、真實數據、專題Python 實作王者歸來
　　5：Excel 完整學習、Excel 函數庫、AI 助攻學Excel VBA 應用王者歸來
　　6：Python 操作Excel 最強入門邁向辦公室自動化之路王者歸來
　　7：Power BI 最強入門 – AI 視覺化+ 智慧決策+ 雲端分享王者歸來
　　8：無料AI、AI 職場、AI 行銷、AI 繪圖的作者

　　他的多本著作皆曾登上天瓏、博客來、Momo 電腦書類，不同時期暢銷排行榜第1 名，他的著作特色是，所有程式語法或是功能解說會依特性分類，同時以實用的程式範例做說明，不賣弄學問，讓整本書淺顯易懂，讀者可以由他的著作事半功倍輕鬆掌握相關知識。

▌第1章機器學習基本觀念
1-1 人工智慧、機器學習、深度學習
1-2 認識機器學習
1-3 機器學習的種類
1-3-1 監督學習
1-3-2 無監督學習
1-3-3 強化學習
1-4 機器學習的應用範圍
1-5 深度學習

▌第2章機器學習的基礎數學
2-1 用數字描繪事物
2-2 變數觀念
2-3 從變數到函數
2-4 用數學抽象化開餐廳的生存條件
2-4-1 數學模型
2-4-2 經營數字預估
2-4-3 經營績效的計算
2-4-4 情境分析 - 變數變化的影響
2-5 基礎數學的應用與總結
2-5-1 基礎數學的應用範例
2-5-2 基礎數學的總結

▌第3章認識方程式、函數與座標圖形
3-1 認識方程式
3-2 方程式文字描述方法
3-3 一元一次方程式
3-4 函數
3-5 座標圖形分析
3-5-1 座標圖形與線性關係
3-5-2 斜率與截距的意義
3-5-3 細看斜率
3-5-4 細看y截距
3-5-5 細看x截距
3-6 將線性函數應用在機器學習
3-6-1 再看直線函數與斜率
3-6-2 機器學習與線性迴歸
3-6-3 相同斜率平行移動
3-6-4 不同斜率與相同截距
3-6-5 不同斜率與不同截距
3-7 二元函數到多元函數
3-7-1 二元函數基本觀念
3-7-2 二元函數的圖形
3-7-3 等高線圖
3-7-4 多元函數
3-8 Sympy 模組
3-8-1 定義符號
3-8-2 name 屬性
3-8-3 定義多個符號變數
3-8-4 符號的運算
3-8-5 將數值代入公式
3-8-6 將字串轉為數學表達式
3-8-7 Sympy 模組支援的數學函數
3-8-8 解一元一次方程式

▌第4章從聯立方程式看機器學習的數學模型
4-1 數學觀念建立連接兩點的直線
4-1-1 基礎觀念
4-1-2 聯立方程式
4-1-3 使用加減法解聯立方程式
4-1-4 使用代入法解聯立方程式
4-1-5 使用Sympy 解聯立方程式
4-2 機器學習使用聯立方程式推估數據
4-2-1 推導餐廳經營績效函數
4-2-2 餐廳經營績效數據推估
4-2-3 聯立方程式在線性模型中的應用
4-3 從2 條直線的交叉點推估科學數據
4-3-1 雞兔同籠
4-3-2 達成業績目標
4-4 兩條直線垂直交叉
4-4-1 基礎觀念
4-4-2 求解座標某一點至一條線的垂直線
4-5 本章總結與下一步展望

▌第5章從畢氏定理看機器學習
5-1 驗證畢氏定理
5-1-1 認識直角三角形
5-1-2 驗證畢氏定理
5-2 將畢氏定理應用在性向測試
5-2-1 問題核心分析
5-2-2 數據運算
5-3 將畢氏定理應用在三維空間
5-4 將畢氏定理應用在更高維的空間
5-5 電影分類
5-5-1 規劃特徵值
5-5-3 專案程式實作
5-5-4 電影分類結論
5-6 計算兩個向量的歐幾里德距離
5-7 本章總結與應用展望

▌第6章聯立不等式與機器學習
6-1 聯立不等式與機器學習
6-2 再看聯立不等式的基本觀念
6-3 聯立不等式的線性規劃
6-3-1 案例分析
6-3-2 用聯立不等式表達
6-3-3 在座標軸上繪不等式的區域
6-3-4 目標函數
6-3-5 平行移動目標函數
6-3-6 將交叉點座標代入目標函數
6-4 Python 計算
6-5 聯立不等式的商業應用
6-5-1 廣告投入最佳分配
6-5-2 產品生產成本最小化
6-6 本章總結與應用展望

▌第7章機器學習需要知道的二次函數
7-1 二次函數的基礎數學
7-1-1 解一元二次方程式的根
7-1-2 繪製一元二次方程式的圖形
7-1-3 一元二次方程式的最小值與最大值
7-1-4 一元二次函數參數整理
7-1-5 一元三次函數的圖形特徵
7-1-6 二次函數在機器學習中的應用價值
7-2 從一次到二次函數的實務
7-2-1 呈現好的變化
7-2-2 呈現不好的變化
7-3 認識二次函數的係數
7-4 使用3個點求解一元二次函數
7-4-1 手動求解一元二次函數
7-4-2 程式求解一元二次函數
7-4-3 繪製一元二次函數
7-4-4 使用業績回推應有的拜訪次數
7-5 一元二次函數的配方法
7-5-1 基本觀念
7-5-2 配方法
7-5-3 從標準式計算一元二次函數的最大值
7-5-4 從標準式計算一元二次函數的最小值
7-6 一元二次函數與解答區間
7-6-1 行銷問題分析
7-6-2 一元二次函數分析增加業績的臉書行銷次數
7-6-3 將不等式應用在條件區間
7-6-4 非實數根

▌第8章機器學習的最小平方法
8-1 最小平方法基本觀念
8-1-1 基本觀念
8-1-2 數學觀點
8-2 簡單的企業實例
8-3 機器學習建立含誤差值的線性方程式
8-3-1 觀念啟發
8-3-2 三項和的平方
8-3-3 公式推導
8-3-4 使用配方法計算直線的斜率和截距
8-4 Numpy 實作最小平方法
8-5 線性迴歸
8-6 便利商店飲料銷售實務應用
8-7 模型評估指標
8-7-1 認識模型評估指標
8-7-2 手工計算與程式執行房價模型評估
8-7-3 用模型評估指標檢視便利商店飲料銷售

▌第9章機器學習必須懂的集合
9-1 使用Python 建立集合
9-1-1 使用{ } 建立集合
9-1-2 集合元素是唯一
9-1-3 使用set( ) 建立集合
9-1-4 集合的基數(cardinality)
9-1-5 建立空集合要用set( )
9-1-6 大數據資料與集合的應用
9-2 集合的操作
9-2-1 交集(intersection)
9-2-2 聯集(union)
9-2-3 差集(difference)
9-2-4 對稱差集(symmetric difference)
9-3 子集、宇集與補集
9-3-1 子集
9-3-2 宇集
9-3-3 補集

▌第10章機器學習必須懂的排列與組合
10-1 排列基本觀念
10-1-1 實驗與事件
10-1-2 事件結果
10-1-3 機器學習應用場景
10-2 有多少條回家路
10-2-1 計算有多少條回家的路
10-2-2 回家的路於機器學習的應用場景
10-3 排列組合
10-4 階乘的觀念
10-5 重複排列
10-6 組合

▌第11章機器學習需要認識的機率
11-1 機率基本觀念
11-2 數學機率與統計機率
11-3 事件機率名稱
11-4 事件機率規則
11-4-1 不發生機率
11-4-2 機率相加
11-4-3 機率相乘
11-4-4 常見的陷阱
11-4-5 Python 模擬事件重複發生的機率計算
11-5 抽獎的機率 – 加法與乘法綜合應用
11-6 餘事件與乘法的綜合應用
11-7 條件機率
11-7-1 基礎觀念
11-7-2 擲骰子的其他實例
11-8 貝氏定理
11-8-1 基本觀念
11-8-2 用實例驗證貝氏定理
11-8-3 疾病診斷模型
11-8-4 客戶購買意願預測
11-9 COVID-19 的全民普篩準確性推估
11-9-1 COVID-19 準確性推估
11-9-2 再看一個醫學實例
11-10 垃圾郵件篩選
11-10-1 貝氏定理篩選垃圾電子郵件基礎觀念
11-10-2 垃圾郵件分類專案實作

▌第12章二項式定理
12-1 二項式的定義
12-2 二項式的幾何意義
12-3 二項式展開與規律性分析
12-4 找出xn-kyk 項的係數
12-4-1 基礎觀念
12-4-2 組合數學觀念
12-4-3 係數公式推導與驗證
12-5 二項式的通式
12-5-1 驗證頭尾係數比較
12-5-2 中間項係數驗證
12-6 二項式到多項式
12-7 二項分佈實驗
12-8 用二項式分析國際證照考試業務
12-9 二項式機率分佈Python 實作
12-10 Numpy 隨機數模組的binomial( ) 函數
12-10-1 視覺化模組Seaborn
12-10-2 Numpy 的二項式隨機函數binomial
12-11 二項分佈的創新應用與機器學習實踐
12-11-1 品質控制中的不良品檢測
12-11-2 臨床試驗中的藥物療效
12-11-3 廣告轉換率的預測
12-11-4 機器學習場景 - 二項分佈在二分類問題中的應用

▌第13章指數觀念與指數函數
13-1 認識指數函數
13-1-1 基礎觀念
13-1-2 指數增長的數據預測 – 用戶增長/ 病毒式行銷
13-1-3 指數衰減的數據預測 – 學習率衰減/ 活躍度衰減
13-1-4 用指數觀念看iPhone 容量
13-2 指數運算的核心規則與應用
13-2-1 指數運算規則
13-2-2 指數運算 - 數據標準化
13-2-3 指數運算 - 激活函數的應用
13-3 指數函數的圖形
13-3-1 底數是變數的指數函數圖形
13-3-2 指數冪是實數變數

▌第14章機器學習中的對數運算與應用
14-1 機器學習中對數概念與應用背景
14-1-1 對數的由來
14-1-2 從數學看指數的運作觀念
14-1-3 再看對數函數
14-1-4 天文數字的處理
14-1-5 Python 的對數函數應用
14-1-6 機器學習 - 對數運算在特徵縮放中的應用
14-1-7 機器學習 - 對數變換處理異常值
14-1-8 機器學習 - 交叉熵損失函數中的對數應用
14-2 對數表的歷史與數據科學應用
14-2-1 對數表基礎應用
14-2-2 更精確的對數表
14-3 對數運算與指數問題的簡化
14-3-1 用指數處理相當數值的近似值
14-3-2 使用對數簡化運算
14-3-3 簡化大數據的乘法與指數操作
14-3-4 對數控制指數增長的數據範圍
14-4 對數特性與機器學習應用
14-5 對數的運算規則與驗證
14-5-1 等號兩邊使用對數處理結果不變
14-5-2 對數的真數是1
14-5-3 對數的底數等於真數
14-5-4 對數內真數的指數可以移到外面
14-5-5 對數內真數是兩數據相乘結果是兩數據各取對數後再相加
14-5-6 對數內真數是兩數據相除結果是兩數據先取對數後再相減
14-5-7 底數變換

▌第15章指數函數與激活函數的應用
15-1 認識歐拉數
15-1-1 認識歐拉數
15-1-2 歐拉數的緣由
15-1-3 歐拉數使用公式做定義
15-1-4 計算與繪製歐拉數的函數圖形
15-1-5 指數衰減策略中的歐拉數應用
15-2 邏輯斯函數
15-2-1 認識邏輯斯函數
15-2-2 x 是正無限大
15-2-3 x 是0
15-2-4 x 是負無限大
15-2-5 繪製邏輯斯函數
15-2-6 Sigmoid 函數
15-3 logit 函數
15-3-1 認識Odds
15-3-2 從Odds 到logit 函數
15-3-3 繪製logit 函數
15-4 邏輯斯函數的應用
15-4-1 事件說明與分析
15-4-2 從邏輯斯函數到logit 函數
15-4-3 使用logit 函數獲得係數
15-4-4 邏輯斯函數在二元分類模型中的延伸應用
15-5 Softmax 函數的應用

▌第16章機器學習數據處理與統計基礎
16-1 機器學習視角 - 母體與樣本
16-1-1 母體與樣本
16-1-2 機器學習視角看母體與樣本
16-2 數據加總與聚合操作
16-2-1 符號運算規則、驗證與活用
16-2-2 數據加總
16-2-3 數據的聚合操作
16-3 認識數據分佈與其在機器學習中的應用
16-3-1 認識數據分佈
16-3-2 數據分佈在機器學習中的應用
16-3-3 數據分佈與演算法選擇
16-3-4 對數轉換應用於偏態分佈數據
16-4 數據中心趨勢與機器學習應用
16-4-1 平均數(mean)
16-4-2 中位數(median)
16-4-3 眾數(mode)
16-4-4 機器學習角度執行工資數據分析
16-4-5 分數分佈圖
16-5 數據分散指標 – 變異數與標準差
16-5-1 變異數
16-5-2 標準差
16-5-3 數據分散指標的應用

▌第17章機器學習的迴歸分析
17-1 背景與概念介紹
17-2 相關係數(Correlation Coefficient)
17-2-1 認識相關係數
17-2-2 相關係數在迴歸模型中扮演的角色
17-3 建立線性迴歸模型與數據預測
17-3-1 建立迴歸模型
17-3-2 數據預測
17-4 二次函數的迴歸模型
17-5 三次函數的迴歸曲線模型
17-6 使用scikit-learn 模組評估迴歸模型
17-6-1 迴歸模型選擇的基礎觀念
17-6-2 更完整解釋評估模型與scikit-learn方法支援
17-6-3 預測估計時間的銷售預測
17-7 不適合的迴歸分析的實例
17-7-1 繪製三次函數迴歸線
17-7-2 計算R平方判定係數
17-8 不同次數多項式擬合對模型表現的影響

▌第18章機器學習的向量
18-1 向量的基礎觀念
18-1-1 機器學習的向量知識
18-1-2 認識純量
18-1-3 認識向量
18-1-4 向量表示法
18-1-5 計算向量分量
18-1-6 相對位置的向量
18-1-7 不同路徑的向量運算
18-2 向量加法與機器學習的應用
18-2-1 認識向量加法規則
18-2-2 向量加法在機器學習的應用
18-3 向量的長度
18-4 向量方程式
18-4-1 直線方程式
18-4-2 Python 實作連接2點的方程式
18-4-3 使用向量建立迴歸方程式的理由
18-5 向量內積/餘弦相似度 – 推薦系統設計
18-5-1 協同工作的觀念
18-5-2 計算B所幫的忙
18-5-3 向量內積的定義
18-5-4 兩條直線的夾角
18-5-5 向量內積的性質
18-5-6 餘弦相似度
18-5-7 音樂推薦系統設計
18-5-8 向量內積的應用
18-6 皮爾遜相關係數原理 – 特徵篩選應用
18-6-1 網路購物問卷調查案例解說
18-6-3 向量內積計算係數
18-6-4 皮爾遜相關係數的應用

▌第19章機器學習的矩陣
19-1 矩陣的表達方式與機器學習應用場景
19-1-1 矩陣的行與列方式
19-1-2 矩陣變數名稱
19-1-3 常見的矩陣表達方式
19-1-4 矩陣元素表達方式
19-1-5 行列的定義在機器學習中的應用
19-2 矩陣相加/相減與機器學習場景應用
19-2-1 基礎觀念
19-2-2 Python 定義矩陣
19-2-3 機器學習矩陣加法運算場景
19-2-4 機器學習矩陣減法運算場景
19-3 矩陣乘以實數與機器學習場景應用
19-4 矩陣乘法與在機器學習的場景
19-4-1 乘法基本規則
19-4-2 乘法案例
19-4-3 矩陣乘法規則
19-4-4 機器學習場景的應用
19-5 方形矩陣
19-6 單位矩陣
19-7 反矩陣與轉置矩陣
19-7-1 基礎觀念
19-7-2 用反矩陣解聯立方程式
19-7-3 轉置矩陣基礎觀念
19-7-4 轉置矩陣的規則
19-7-5 轉置矩陣與皮爾遜相關係數
19-8 深度學習框架的數據表示法 - 張量(Tensor)

▌第20章向量、矩陣與多元線性迴歸
20-1 向量和矩陣在多元線性迴歸的重要性
20-2 向量應用在線性迴歸
20-3 向量應用在多元線性迴歸
20-4 矩陣應用在多元線性迴歸
20-5 將截距放入矩陣
20-6 簡單的線性迴歸
20-7 多元線性迴歸矩陣方程式的推導
20-8 專題 - 業績預測/用電量預測
20-8-1 廣告與銷售
20-8-2 家庭用電量預測

▌第21章數據預處理使用Scikit-learn
21-1 Scikit-learn 的歷史
21-2 機器學習的數據集
21-2-1 Scikit-learn 內建的數據集
21-2-2 Kaggle 數據集
21-2-3 UCI 數據集
21-2-4 scikit-learn 函數生成數據
21-3 scikit-learn 生成數據實作
21-3-1 線性分佈數據 - make_regression
21-3-2 集群分佈數據 - make_blobs
21-3-3 交錯半月群集數據 - make_moons
21-3-4 環形結構分佈的群集數據– make_circles
21-3-5 產生n-class 分類數據集
21-4 Scikit-learn 數據預處理
21-4-1 標準化數據StandardScaler
21-4-2 設定數據區間MinMaxScaler
21-4-3 特殊數據縮放RobustScaler

▌第22章機器學習使用Scikit-learn 入門
22-1 用Scikit-learn 處理線性迴歸
22-1-1 身高與體重的資料
22-1-2 線性擬合數據LinearRegression
22-1-3 資料預測predict
22-1-4 模型的儲存與開啟
22-1-5 計算線性迴歸線的斜率和截距
22-1-6 R 平方判定係數檢驗模型的性能
22-2 機器學習分類演算法 - 模型的性能評估
22-2-1 計算精確度accuracy_score
22-2-2 召回率recall_score
22-2-3 精確率precision_score
22-2-4 F1 分數f1_score
22-2-5 分類報告classification_report
22-2-6 混淆矩陣confusion_matrix
22-2-7 ROC_AUC 分數
22-3 機器學習必需會的非數值資料轉換
22-3-1 One-hot 編碼
22-3-2 特徵名稱由中文改為英文
22-3-3 資料對應map 方法
22-3-4 標籤轉換LabelEncoder
22-4 機器學習演算法
22-5 使用隨機數據學習線性迴歸
22-5-1 建立訓練數據與測試數據使用train_test_split
22-5-2 迴歸模型判斷
22-5-3 score 和r2_score 方法的差異

▌第23章線性迴歸 - 波士頓房價
23-1 從線性迴歸到多元線性迴歸
23-1-1 簡單線性迴歸
23-1-2 多元線性迴歸
23-2 簡單資料測試
23-2-1 身高、腰圍與體重的測試
23-2-2 了解模型的優劣
23-3 波士頓房價數據集
23-3-1 認識波士頓房價數據集
23-3-2 輸出數據集
23-4 用Pandas 顯示與預處理數據
23-4-1 用Pandas 顯示波士頓房價數據
23-4-2 將房價加入DataFrame
23-4-3 數據清洗
23-5 特徵選擇
23-6 使用最相關的特徵做房價預估
23-6-1 繪製散點圖
23-6-2 建立模型獲得R 平方判定係數、截距與係數
23-6-3 計算預估房價
23-6-4 繪製實際房價與預估房價
23-6-5 繪製3D 的實際房價與預估房價
23-7 多項式迴歸
23-7-1 繪製散點圖和迴歸直線
23-7-2 多項式迴歸公式
23-7-3 生成一元二次迴歸公式的多個特徵項目
23-7-4 多項式特徵應用在LinearRegression
23-7-5 機器學習理想模型
23-7-6 多元多項式的迴歸模型
23-7-7 繪製3D 的實際房價與預估房價
23-8 用所有特徵執行波士頓房價預估
23-9 殘差圖(Residual plot)
23-10 梯度下降迴歸SGDRegressor
23-11 數據洩漏

▌第24章邏輯斯迴歸 - 信用卡/ 葡萄酒/ 糖尿病
24-1 淺談線性迴歸的問題
24-2 邏輯斯迴歸觀念回顧
24-2-1 基礎觀念複習
24-2-2 應用邏輯斯函數
24-2-3 線性迴歸與邏輯斯迴歸的差異
24-3 邏輯斯迴歸模型基礎應用
24-3-1 語法基礎
24-3-2 挽救可能流失的客戶
24-3-3 多分類演算法解說
24-4 台灣信用卡持卡人數據集
24-4-1 認識UCI_Credit_Card.csv 數據
24-4-2 挑選最重要的特徵
24-4-3 用最相關的2 個特徵設計邏輯斯迴歸模型
24-4-4 使用全部的特徵設計邏輯斯迴歸模型
24-5 葡萄酒數據
24-5-1 認識葡萄酒數據
24-5-2 使用邏輯斯迴歸演算法執行葡萄酒分類
24-6 糖尿病數據
24-6-1 認識糖尿病數據
24-6-2 缺失值檢查與處理
24-6-3 用直方圖了解特徵分佈
24-6-3 用箱形圖了解異常值
24-6-4 用所有特徵值做糖尿病患者預估
24-6-5 繪製皮爾遜相關係數熱力圖
24-6-6 用最相關的皮爾遜相關係數做糖尿病預估

▌第25章決策樹 – 葡萄酒/ 鐵達尼號/Telco/Retail
25-1 決策樹基本觀念
25-1-1 決策樹應用在分類問題
25-1-2 分類問題的決策樹數學分割原理
25-1-3 決策樹應用在迴歸問題
25-1-4 決策樹在迴歸問題的數學原理
25-2 從天氣數據認識決策樹設計流程- 分類應用
25-2-1 建立決策樹模型物件
25-2-2 天氣數據實例
25-3 葡萄酒數據 - 分類應用
25-3-1 預設條件處理葡萄酒數據
25-3-2 進一步認識決策樹深度
25-3-3 繪製決策樹圖
25-4 鐵達尼號- 分類應用
25-4-1 認識鐵達尼號數據集
25-4-2 決策樹設計鐵達尼號生存預測
25-4-3 交叉分析
25-5 Telco 電信公司- 分類應用
25-5-1 認識WA_Fn-UseC_-Telco-Customer-Churn.csv 數據
25-5-2 決策樹數據分析
25-5-3 了解特徵對模型的重要性
25-5-4 交叉驗證 - 決策樹最佳深度調整
25-6 Retail Data Analytics - 迴歸應用
25-6-1 用簡單的數據預估房價
25-6-2 Retail Data Analytics 數據

▌第26章隨機森林 – 波士頓房價/ 鐵達尼號/Telco/ 收入分析
26-1 隨機森林基本觀念
26-1-1 Bagging 技術
26-1-2 特徵隨機選擇
26-1-3 隨機森林的應用
26-1-4 隨機森林的優缺點
26-2 波士頓房價 - 迴歸應用
26-2-1 隨機森林RandomForestRegressor( )迴歸函數
26-2-2 隨機森林 - 波士頓房價應用
26-2-3 RandomForestRegressor 的屬性 feature_importances_
26-3 鐵達尼號 – 分類應用
26-4 Telco 客戶流失 – 分類應用
26-5 美國成年人收入分析 – 分類應用
26-5-1 認識adult.csv 數據
26-5-2 使用決策樹處理年收入預估
26-5-3 決策樹特徵重要性
26-5-4 使用隨機森林處理adult.csv 檔案

▌第27章 KNN 演算法 – 鳶尾花/ 小行星撞地球
27-1 KNN 演算法基礎觀念
27-1-1 基礎觀念
27-1-2 K 值的影響
27-2 電影推薦/ 足球射門 - 分類應用
27-2-1 認識語法與簡單實例
27-2-2 電影推薦
27-2-3 足球射門是否進球
27-2-4 交叉驗證
27-2-5 繪製分類的決策邊界(Decision Boundary)
27-2-5 多分類模型的準確率分析
27-3 房價計算/ 選舉準備香腸 – 迴歸應用
27-3-1 認識語法與簡單實例
27-3-2 房價計算
27-3-3 選舉造勢與準備烤香腸數量
27-3-4 KNN 模型的迴歸線分析
27-4 鳶尾花數據 - 分類應用
27-4-1 認識鳶尾花數據集
27-4-2 輸出數據集
27-4-3 用Pandas 顯示鳶尾花數據
27-4-4 映射標籤
27-4-5 繪製特徵變數的散點圖
27-4-6 使用 KNN 演算法進行鳶尾花數據集的分類預測
27-4-7 繪製鳶尾花的決策邊界
27-4-8 計算最優的k 值
27-4-9 交叉驗證
27-5 小行星撞地球 – 分類應用
27-5-1 認識NASA:Asteroids Classification
27-5-2 數據預處理
27-5-3 預測小行星撞地球的準確率

▌第28章支援向量機 – 鳶尾花/ 乳癌/ 汽車燃料
28-1 支援向量機分類應用的基礎觀念
28-1-1 分類應用的基礎觀念
28-1-2 最大區間的分割
28-1-3 認識支援向量/ 決策邊界/ 與超平面
28-1-4 超平面公式
28-2 支援向量機 - 分類應用的基礎實例
28-2-1 繪製10 個數據點
28-2-2 支援向量機的語法說明
28-2-3 推導超平面的斜率
28-2-4 繪製超平面和決策邊界
28-2-5 數據分類
28-2-6 decision_function()
28-3 從2 維到3 維的超平面
28-3-1 增加數據維度
28-3-2 計算3 維的超平面公式與係數
28-3-3 繪製3 維的超平面
28-4 認識核函數
28-4-1 linear
28-4-2 徑向基函數(Radial Basic Function) - RBF
28-4-3 多項式函數(Polynomail function) - poly
28-4-4 支援向量機的方法
28-5 鳶尾花數據 - 分類應用
28-6 乳腺癌數據 - 分類應用
28-6-1 認識數據
28-6-2 線性支援向量機預測乳腺癌數據
28-6-3 不同核函數應用在乳腺癌數據
28-7 支援向量機 – 迴歸應用的基礎實例
28-7-1 SVR() 語法說明
28-7-2 簡單數據應用
28-7-3 電視購物廣告效益分析
28-8 汽車燃耗效率數據集 - 迴歸分析
28-8-1 認識汽車燃耗效率(MPG) 數據集
28-8-2 使用SVR() 預測汽車燃料數據

▌第29章單純貝式分類 – 垃圾郵件/ 新聞分類/ 電影評論
29-1 單純貝式分類原理
29-1-1 公式說明
29-1-2 簡單實例說起
29-1-3 拉普拉斯平滑修正
29-2 詞頻向量模組 - CountVerctorizer
29-3 多項式單純貝式模組 - MultinomialNB
29-3-1 語法觀念
29-3-2 文章分類實作
29-3-3 垃圾郵件分類
29-4 垃圾郵件分類 – Spambase 數據集
29-4-1 認識垃圾郵件數據集Spambase
29-4-2 垃圾郵件分類預測
29-5 新聞郵件分類 – 新聞數據集20newsgroups
29-5-1 認識新聞數據集20newsgroups
29-5-2 新聞分類預測
29-5-3 TfidfVectorizer 模組 - 文件事前處理TF-IDF
29-5-4 輸入文件做新聞分類
29-6 情感分析 – 電影評論IMDB Dataset分析
29-6-1 基礎觀念實例
29-6-2 電影評論IMDB Dataset 數據集
29-7 單純貝式分類於中文的應用
29-7-1 將中文字串應用在CountVectorizer模組
29-7-2 jieba - 結巴
29-7-3 jieba 與CountVectorizer 組合應用
29-7-4 簡單中文情感分析程式
29-8 今日頭條數據集
29-8-1 認識數據集
29-8-2 今日頭條數據集實作

▌第30章集成機器學習 – 蘑菇/ 醫療保險/ 玻璃/ 加州房價
30-1 集成學習的基本觀念
30-1-1 基本觀念
30-1-2 集成學習效果評估
30-2 集成學習 - 投票法Voting( 鳶尾花/ 波士頓房價)
30-2-1 投票法 - 分類應用
30-2-2 投票法 - 迴歸應用
30-3 集成學習 - 裝袋法Bagging( 蘑菇/ 醫療保險)
30-3-1 裝袋法 – 分類應用語法說明
30-3-2 蘑菇數據分類應用
30-3-3 裝袋法 – 迴歸應用語法說明
30-3-4 醫療保險數據迴歸應用
30-4 集成學習 - 適應性提升法AdaBoost
30-4-1 AdaBoost 提升法 - 分類應用語法說明
30-4-2 AdaBoost 提升法 - 迴歸應用語法說明
30-5 集成學習 - 梯度提升法Gradient Boosting
30-5-1 Gradient Boosting - 分類應用語法說明
30-5-2 玻璃數據集分類的應用
30-5-3 Gradient Boosting – 迴歸應用語法說明
30-5-4 加州房價數據集迴歸應用
30-6 集成學習 – 堆疊法Stacking
30-6-1 StackingClassifier - 分類應用語法說明
30-6-2 RidgeCV( )
30-6-3 StackingRegressor – 迴歸應用語法說明

▌第31章 K-means 分群 – 購物中心消費/ 葡萄酒評價
31-1 認識無監督學習
31-1-1 回顧監督學習數據
31-1-2 無監督學習數據
31-1-3 無監督學習與監督學習的差異
31-1-4 無監督學習的應用
31-2 K-means 演算法
31-2-1 演算法基礎
31-2-2 Python 硬功夫程式實作
31-3 Scikit-learn 的KMeans 模組
31-3-1 KMeans 語法
31-3-2 分群的基礎實例
31-3-3 數據分群的簡單實例
31-4 評估分群的效能
31-4-1 群內平方和(WCSS)
31-4-2 輪廓係數(Silhouette Coefficient)
31-4-3 調整蘭德係數(Rand Index, ARI)
31-5 最佳群集數量
31-5-1 肘點法(Elbow Method)
31-5-2 輪廓分析(Silhouette Analysis)
31-6 消費分析 - 購物中心客戶消費數據
31-6-1 認識Mall Customer Segmentation Data
31-6-2 收入與消費分群
31-6-3 依據性別分析「年收入 vs 消費力」
31-6-4 依據年齡層分析「年收入 vs 消費力」
31-7 價格 vs 評價 - 葡萄酒Wine Reviews
31-7-1 認識Wine Reviews 數據

▌第32章 PCA 主成份分析 – 手寫數字/ 人臉數據
32-1 PCA 基本觀念
32-1-1 基本觀念
32-1-2 PCA 方法與基礎數據實作
32-1-3 數據白化whiten
32-2 鳶尾花數據的PCA 應用
32-2-1 鳶尾花數據降維
32-2-2 SVC 與PCA 在鳶尾花的應用
32-2-3 PCA 主成份與原始特徵的分析
32-3 數字辨識 - 手寫數字digits dataset
32-3-1 認識手寫數字數據集digits dataset
32-3-2 決策樹與隨機森林辨識手寫數字
32-3-3 PCA 與手寫數字整合應用
32-4 人臉辨識 – 人臉數據Labeled Faces in the Wild
32-4-1 認識人臉數據LFW
32-4-2 人臉辨識預測
32-4-3 加上PCA 的人臉辨識

▌第33章階層式分群 – 小麥數據/ 老實泉
33-1 認識階層式分群
33-2 凝聚型(Agglomerative) 分群
33-2-1 凝聚型分群定義
33-2-2 簡單實例解說linkage( ) 方法
33-2-3 單鏈接法(Single Linkage) 說明
33-2-4 簡單實例解說分群方法
33-2-5 分群方法ward( )
33-2-6 分群數量的方法
33-2-7 凝聚型分群AgglomerativeClustering
33-3 小麥數據集Seeds dataset
33-3-1 認識數據集Seeds dataset
33-3-2 凝聚型分群應用在Seeds dataset
33-4 老實泉數據Old Faithful Geyser Data
33-4-1 認識老實泉數據集
33-4-2 繪製樹狀圖
33-4-3 凝聚型分群應用在老實泉數據

▌第34章 DBSCAN 演算法 – 購物中心客戶分析
34-1 DBSCAN 演算法
34-1-1 DBSCAN 演算法的參數觀念
34-1-2 點的定義
34-1-3 演算法的步驟
34-2 scikit-learn 的DBSCAN 模組
34-2-1 DBSCAN 語法
34-2-2 DBSCAN 演算法基礎實例
34-3 消費分析 - 購物中心客戶消費數據

附錄A 函數與方法索引表

看更多

序

序

　　AI 時代已然到來，機器學習成為當前最受矚目的顯學。然而，傳統的機器學習書籍常充滿艱深難懂的數學推導公式，對許多讀者（包括筆者在內）來說，宛如最佳催眠劑。因此，在撰寫這本書時，筆者秉持以下三大原則：

　　◆ 白話詮釋機器學習知識：用淺顯易懂的語言，讓讀者輕鬆學得會，看得懂。
　　◆ AI 場景融入數學應用：在介紹基礎數學時，即時融入該知識在機器學習中的應用場景。
　　◆ 理論結合實務案例：透過實際案例解說，幫助讀者全面掌握理論背後的實際意義。
與多位機器學習領域的專家討論後，我們一致認為，一本好的機器學習書籍應具備以下特色：
　　◆ 白話解釋數學與演算法：作者應以最淺顯的語言解釋數學原理與演算法，幫助讀者以最簡單的方式掌握機器學習核心。
　　◆ 從基礎數學入門：介紹與機器學習相關的基礎數學，並輔以彩色圖表和程式實例進行解說，同時說明在AI 場景可能應用。
　　◆ 統計與機率應用：以圖表和程式實例講解基礎統計概念，並深入說明基礎機率與貝式理論，將理論轉化為未來AI 場景應用與實際操作。
　　◆ 逐步深入解析演算法：用簡單數據輔助說明演算法原理時，逐步使用 AI 經典數據。
　　◆ 問題解決策略與技巧：除了基礎理論與程式碼，還應提供針對特定問題的實用策略與技巧，如特徵選擇、模型選擇和超參數調整等。
　　◆ 實際案例分析：結合真實世界的案例，展示機器學習在現實場景中的應用，讓讀者更直觀地理解如何將理論與技術應用於解決實際問題。

　　在撰寫本書的過程中，筆者始終以上述特色為指引，力求將這本書打造為目前中文書籍中最完整的機器學習專著。本書共分為34 章，內容架構如下：

　　◆ 第1 ~ 20章：聚焦數學、機率與統計知識，並結合未來AI場景的應用進行講解。
　　◆ 第 21 至 22 章：深入解析 Scikit-learn 模組及數據預處理的相關知識。
　　◆ 第 23 至 34 章：講解機器學習演算法的核心觀念，並透過真實案例進行實務分析。

　　全書包含約431 個Python 程式實例，讀者可以從中系統性地學習與機器學習相關的數學、機率與統計，以及相關AI 場景應用知識，包括但不限於以下內容：
　　◆ 方程式、一元到多元函數：餐廳經營、業務員績效、網路行銷 ... 等。
　　◆ 最小平方法：國際證照考卷銷售、房價預測、便利店銷售 ... 等。
　　◆ 機率與單純貝式理論：疾病分析、客戶購買意願、垃圾郵件 ... 等。
　　◆ 指數、對數與激活函數：廣告效果、回購率分析 ... 等。
　　◆ 基礎統計：超商數據、考試成績 ... 等。
　　◆ 迴歸分析：臉書行銷、冰品銷售、網站購物 ... 等。
　　◆ 向量與矩陣：網購行為分析、推薦系統、家庭用電預測 ... 等。

　　當讀者掌握了前述的知識後，筆者將從簡單的實例開始，逐步介紹以下機器學習演算法。每種演算法均以基礎數據為起點，詳細解說其核心概念，接著延伸至真實數據，並說明如何將這些演算法應用於實際案例中，具體實例如下：
　　◆ 線性迴歸：以波士頓房價為例。
　　◆ 邏輯斯迴歸：信用卡欺詐檢測、葡萄酒品質分析、糖尿病預測。
　　◆ 決策樹：葡萄酒品質、鐵達尼號生存預測、Telco 用戶流失、零售分析。
　　◆ 隨機森林：收入預測、波士頓房價、鐵達尼號、Telco 用戶分析。
　　◆ KNN 演算法：電影推薦系統、足球射門預測、鳶尾花分類、小行星撞地球風險分析。
　　◆ 支援向量機：鳶尾花分類、乳癌診斷、汽車燃料效率預測。
　　◆ 單純貝式分類：垃圾郵件檢測、中英文新聞分類、情感分析、電影評論分類。
　　◆ 集成機器學習：蘑菇分類、醫療保險成本預測、玻璃材料分析、加州房價預測。
　　◆ K-means 分群：購物中心消費行為分析、葡萄酒評價分群。
　　◆ PCA 主成分分析：手寫數字辨識、人臉數據降維。
　　◆ 階層式分群：小麥品種分類、老實泉噴發分析。
　　◆ DBSCAN 演算法：購物中心客戶分群分析。

　　透過這些實例，讀者不僅能深入理解各種演算法的理論與應用，還能學會如何將其靈活運用於現實場景，為後續的進階研究與實務應用打下扎實基礎。在講解上述演算法時，筆者同時介紹下列機器學習應該知道的知識：
　　◆ 特徵選擇
　　◆ 用長條圖了解特徵分佈
　　◆ 用箱型圖了解異常值
　　◆ 數據預處理　
　　◆ 機器學習性能評估
　　◆ 殘差圖 (Residualplot)
　　◆ 過擬合 (overfittng)
　　◆ 欠擬合 (underfittng)
　　◆ 泛化能力 (Generalization Ability)
　　◆ 數據洩漏 (Data leakage)
　　◆ 數據白化 (whiten)
　　◆ 繪製決策樹圖 (Decision tree map)
　　◆ 可視化熱力圖 (Heat map)
　　◆ 決策邊界 (Decision Boundary)
　　◆ 增加數據維度與超平面
　　◆ 交叉驗證 (Cross-validation)　　
　　◆ 弱學習器 (Weaks learners)
　　◆ 強學習器 (Strong learners)
　　◆ 學習模型 (base learner)

　　這本書雖然沒有專門章節介紹機器學習必須會的繪圖知識matplotlib、seaborn，數據預處理numpy、pandas，但是每個程式在解說時，筆者已經用文字和程式實例講解了這方面的相關知識，無形中讀者就可以學會這方面的知識。

　　感謝好友銘傳大學前研發長、前統計系系主任張慶輝博士，協助本書校對工作。

　　寫過許多的電腦書著作，本書沿襲筆者著作的特色，程式實例豐富，相信讀者只要遵循本書內容，必定可以在最短時間，精通使用Python 設計機器學習相關應用的知識。編著本書雖力求完美，但是學經歷不足，謬誤難免，尚祈讀者不吝指正。

洪錦魁2024-11-30
jiinkwei@me.com
教學資源說明
教學資源有教學投影片。
註：教學資源不提供給一般讀者，請原諒。
讀者資源說明
請至本公司網頁https://deepwisdom.com.tw 下載本書程式實例。
臉書粉絲團
歡迎加入：王者歸來電腦專業圖書系列
歡迎加入：iCoding 程式語言讀書會(Python, Java, C, C++, C#, JavaScript, 大數據,人工智慧等不限)，讀者可以不定期獲得本書籍和作者相關訊息。
歡迎加入：穩健精實AI 技術手作坊
歡迎加入：MQTT 與AIoT 整合應用

看更多