本書主要分為兩個部分:機器學習理論與實踐分析。內容以Weka為工具,並透過易於理解的方式帶讀者們學習「機器學習」所需的分析方法,同時結合實踐利用案例一步一步說明使用方法,以及工具的掌握,利用無需撰寫程式的方式,讓你以最輕鬆的方式建立機器學習的基礎。
目錄:
第 1 章 Weka的安裝與主要功能
第 2 章 利用Excel與Weka的簡單操作──機器學習與決策樹
第 3 章 檔案形式與屬性類型的轉換
第 4 章 屬性的選擇
第 5 章 分類分析
第 6 章 集群分析
第 7 章 關聯規則分析
第 8 章 時間序列分析
第 9 章 「實踐篇」:使用Weka的各種例題
第 10 章 貝氏網路模型
第 11 章 Weka API
作者簡介:
劉妘鑏
福建理工大學交通運輸學院智能科學教研室講師。於2022年取得台灣東華大學資訊工程學系博士學位;2005年取得台灣亞洲大學資訊工程學系碩士學位。在產業界擔任程式設計師與資料庫管理師超過10年。有興趣的研究領域有:大數據、決策分析、區塊鏈,以及主動式資料庫。
著作:
1. 動態網頁設計,五南,2023。
2. 大數據的基本觀念與演算法,全華,2018。
3. 商業資料管理的利器:Access資料庫管理系統,松崗,2009。
4. Access 2003商業資料庫應用,松崗,2009。
作者序
隨著新科技的興起和軟硬體的快速進展,在數據分析與機器學習的資訊科學領域中,日新月異的演算法發展始終讓人驚嘆,但要能發揮演算法的效能,往往需要借助於工具的應用以得到時間上的效率,像R、Python以及Weka都是近年來頗受關注的編程工具,然而若要針對特定問題的處理與解決,就必須透過客製化程式才容易達成,這對於沒有程式設計經驗的初學者來說,是會有一定的進入障礙。不過Weka(Waikato Environment for Knowledge Analysis)內建的演算法套件就能協助想要了解數據分析與機器學習的初學者們,能快速掌握數據分析的基礎觀念與應用。
Weka是紐西蘭Waikato大學機器學習實驗室用Java專為「資料探勘與機器學習」所開發的應用軟體,其限制在GNU通用公眾授權條款的條件下發布,是款開源軟體,且幾乎可以運行在所有的作業系統平台上,包括Linux、Windows,以及Mac OS等。它內含完整的資料探勘處理流程:(1)資料預處理工具、(2)機器學習演算法、(3)成效評估方法、以及(4)資訊視覺化報表摘要。其最大的優點在於跟主流的程式語言一樣,兼具圖形化的使用者介面以及輸入指令的操作介面,因此無論是初學的新手或是高手都可以充分運用與使用,甚至進而對既有功能依個人的創建進行改良,讓你能透過維護開源程式碼自我挑戰,因此,Weka的功能套件也持續地藉助於全球各地的編程高手擴充新的演算法。目前Weka的最新版本是3.8.6版。
Weka於2015年獲得SIGKDD資料探勘與知識探勘大獎。所謂知識探勘,就是從資料庫中抽取隱含的、未知的、具有潛在應用價值的資訊的過程。知識探勘是KDD最核心的部分。知識探勘與傳統分析工具不同的是知識探勘使用的是基於發現的方法,運用模式匹配(pattern matching)和其他演算法決定數據之間的重要聯繫。
本書《機器學習入門—Weka》採用簡明的方式講解Weka的應用,讓對數據分析與機器學習有興趣的初學者能在最短的時間內掌握Weka。此外,本書內容難免有不足之處,建議讀者們能再進階深入閱讀其他相關書籍。最後,我要感謝東海大學企管系陳耀茂教授在我撰寫本書的過程中,給予我許多機器學習方法應用上的建議,使得這本書才能順利完成。
隨著新科技的興起和軟硬體的快速進展,在數據分析與機器學習的資訊科學領域中,日新月異的演算法發展始終讓人驚嘆,但要能發揮演算法的效能,往往需要借助於工具的應用以得到時間上的效率,像R、Python以及Weka都是近年來頗受關注的編程工具,然而若要針對特定問題的處理與解決,就必須透過客製化程式才容易達成,這對於沒有程式設計經驗的初學者來說,是會有一定的進入障礙。不過Weka(Waikato Environment for Knowledge Analysis)內建的演算法套件就能協助想要了解數據分析與機器學習的初學者們,能快速掌握數據分析的基礎觀念與應用。...
目錄
第1章 Weka的安裝與主要功能
1.1 何謂Weka
1.2 下載Weka與安裝
1.3 啟動Weka
1.4 Weka的主要功能
第2章 利用Excel與Weka的簡單操作─機器學習與決策樹
2.1 以Excel製作數據,以Weka計算
2.2 以Weka預測
2.3 預測結果的焦點:Kappa統計量(Kappa statistic)
第3章 檔案形式與屬性類型的轉換
3.1 調整檔案編碼為UTF-8
3.2 Weka如何載入CSV檔案
3.3 在ARFF-Viewer中載入CSV文件
3.4 在Weka Explorer中載入CSV文件
3.5 使用Excel中的其他檔案格式
3.6 屬性類型的轉換步驟
3.7 如何將UCI Dataset的副檔名*.data改成*.CSV
第4章 屬性的選擇
4.1 何謂「選擇屬性」
4.2 其他屬性選擇方法
第5章 分類分析
5.1 決策樹(Decision Tree)
5.2 隨機森林(Random Forest)
第6章 集群分析
6.1 K平均法(K-means)
6.2 階層式集群法(Hierarchical Clustering)
6.3 EM法(Expectation Maximization,期望最大化法)
第7章 關聯規則分析
7.1 數據分析中的經典案例
7.2 關聯規則(Association Rule)
第8章 時間序列分析
8.1 時間數列數據的迴歸分析模型
8.2 利用Weka進行的時間序列預測
8.3 Weka提供7種評估指標
第9章 「實踐篇」:使用Weka的各種例題
9.1 將Weka的數據集寫成「CSV格式」
9.2 使用Weka在web上公開的數據集
9.3 使用Weka須知
9.4 各種例題使用Weka
9.5 Fisher的Iris
第10章 貝氏網路模型
10.1 使用數據arff形式的「weather」(數值模型例)
10.2 支持向量機(Support Vector Machine, SVM)中的Kernnel函數
10.3 Weka的Knowledge Flow
第11章 Weka API
11.1 Weka的檔案結構
11.2 Weka重要套件
第1章 Weka的安裝與主要功能
1.1 何謂Weka
1.2 下載Weka與安裝
1.3 啟動Weka
1.4 Weka的主要功能
第2章 利用Excel與Weka的簡單操作─機器學習與決策樹
2.1 以Excel製作數據,以Weka計算
2.2 以Weka預測
2.3 預測結果的焦點:Kappa統計量(Kappa statistic)
第3章 檔案形式與屬性類型的轉換
3.1 調整檔案編碼為UTF-8
3.2 Weka如何載入CSV檔案
3.3 在ARFF-Viewer中載入CSV文件
3.4 在Weka Explorer中載入CSV文件
3.5 使用Excel中的其他檔案格式
3.6 屬性類型的轉換步驟
3.7 如何將UCI Dataset的副檔名*.dat...