★☆★深度學習暢銷好書2025全新改版★☆★
本書專為想掌握深度學習核心概念卻不希望陷入繁瑣數學推導的讀者而設計,以「以程式設計取代定理證明」為宗旨,透過實作引導理解,縮短學習曲線,提升學習趣味與成就感。
內容著重於演算法的觀念理解,輔以大量圖解說明,捨棄冗長的理論鋪陳,讓讀者能夠輕鬆掌握深度學習的核心原理。全書提供完整範例程式與多種演算法的實務應用,強調實用性與延伸性,期盼能激發讀者靈感,將所學應用於實際專案或產品開發中。
本次改版翻修實作的範例程式,並新增更多應用實例及演算法說明,例如Transformer、Diffusion Model等。
《深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇》內容包括:自然語言處理相關演算法、大語言模型、語音辨識、強化學習等,全面涵蓋深度學習的自然語言處理及強化學習領域。
適合讀者
►深度學習的入門者:必須熟悉Python 程式語言及機器學習基本概念。
►資料工程師:以應用系統開發為職志,希望能應用各種演算法,進行實作。
►資訊工作者:希望能擴展深度學習知識領域。
►從事其他領域的工作,希望能一窺深度學習奧秘者。
作者簡介:
陳昭明
曾任職於IBM、工研院等全球知名企業
IT邦幫忙2018年AI組冠軍
多年AI課程講授經驗
作者序
前言
再版說明
初版至今已近3 年,其間AI 發展迅速,各項套件/ 演算法均有重大變革,例如大語言模型(LLM)、生成式AI(Generative AI)、Keras v3、YOLO v11、Gymnasium,全書實作的範例程式幾乎全部翻修,並新增更多應用程式,也包括更多的演算法說明,例如Transformer、Diffusion Model⋯等。
為何撰寫本書
從事機器學習教育訓練已近6 年,其間也在『IT 邦幫忙』撰寫100 多篇的文章(https://ithelp.ithome.com.tw/users/20001976/articles),從學員及讀者的回饋獲得許多寶貴意見,期望能將整個歷程集結成冊,同時,相關領域的進展也在飛速變化,過往的文章內容需要翻新,因此藉機再重整思緒,想一想如何能將演算法的原理解釋得更簡易清晰,協助讀者跨入AI 的門檻,另外,也避免流於空談,盡量增加應用範例,希望能達到即學即用,不要有過多理論的探討。
AI 是一個將資料轉化為知識的過程,演算法就是過程中的生產設備,最後產出物是模型,再將模型植入各種硬體裝置,例如電腦、手機、智慧音箱、自駕車、醫療診斷儀器、⋯等,這些裝置就擁有特殊專長的智慧,再進一步整合各項技術就構建出智慧製造、智慧金融、智慧交通、智慧醫療、智慧城市、智慧家庭、⋯等應用系統。AI 的應用領域如此的廣闊,個人精力有限,當然不可能具備十八般武藝,樣樣精通,惟有從基礎紮根,再擴及有興趣的領域,因此,筆者撰寫這本書的初衷,非常單純,就是希望讀者在紮根的過程中,貢獻一點微薄的力量。
本書主要的特點
由於筆者身為統計人,希望能『以統計/ 數學為出發點』,介紹深度學習必備的數理基礎,但又不希望內文有太多數學公式的推導,讓離開校園已久的在職者看到一堆數學符號就心生恐懼,因此,嘗試以『程式設計取代定理證明』,縮短學習歷程,增進學習樂趣。
TensorFlow 2.x 版有巨大的變動,預設模式改為Eager Execution,並以Keras 為主力,整合TensorFlow 其他模組,形成完整的架構,本書期望對TensorFlow/Keras 架構作完性的介紹。
演算法介紹以理解為主,輔以大量圖表說明,摒棄長篇大論。
完整的範例程式及各種演算法的延伸應用,以實用為要,希望能觸發讀者靈感,能在專案或產品內應用。
介紹日益普及的演算法與相關套件的使用,例如YOLO(物件偵測)、GAN(生成對抗網路)/DeepFake(深度偽造)、OCR(辨識圖像中的文字)、臉部辨識、BERT/Transformer、ChatBot、強化學習、自動語音辨識(ASR)等。
目標對象
深度學習的入門者:必須熟悉Python 程式語言及機器學習基本概念。
資料工程師:以應用系統開發為職志,希望能應用各種演算法,進行實作。
資訊工作者:希望能擴展深度學習知識領域。
從事其他領域的工作,希望能一窺深度學習奧秘者。
閱讀重點
第一章介紹AI 的發展趨勢,鑑古知今,瞭解前兩波AI 失敗的原因,比較第三波發展的差異性。
第二章介紹深度學習必備的統計/ 數學基礎,不僅要理解相關知識,也力求能撰寫程式解題。
第三章介紹TensorFlow/Keras 基本功能,包括張量(Tensor)運算、自動微分及神經網路模型的組成,並說明梯度下降法求解的過程。
第四章開始實作,依照機器學習10 項流程,撰寫完整的範例,包括Web、桌面程式。
第五章介紹TensorFlow 進階功能, 包括各種工具, 如TensorBoard、TensorFlow Serving、Callbacks。
第六~ 八章介紹圖像/ 視訊的演算法及各式應用。
第九~ 十一章介紹生成式AI,包括Encoder-decoder、生成對抗網路(GAN)及擴散模型(Diffusion Model),也說明Stable Diffusion 及Dall-E 實作。
第十二章介紹各種影像應用,包括臉部辨識、OCR、車牌辨識及圖像去背。
第十三~ 十四章介紹自然語言處理及各式應用。
第十五章介紹大型語言模型(Large Language Model, LLM),包括Transformer 演算法、ChatGPT 實作及企業導入實務。
第十六章介紹語音辨識的原理/ 演算法/ 實作/ 應用,包括OpenAI Whisper 實作及應用範例。
第十七章介紹強化學習(Reinforcement Learning, RL)的概念/ 演算法/ 實作/ 應用,包括Gymnasium、Stable Baselines3 套件實作及應用範例。
本書範例程式碼全部收錄在 https://github.com/mc6666/DL_Book2,還包括各章的參考資料及超連結,方便使用者複製。
前言
再版說明
初版至今已近3 年,其間AI 發展迅速,各項套件/ 演算法均有重大變革,例如大語言模型(LLM)、生成式AI(Generative AI)、Keras v3、YOLO v11、Gymnasium,全書實作的範例程式幾乎全部翻修,並新增更多應用程式,也包括更多的演算法說明,例如Transformer、Diffusion Model⋯等。
為何撰寫本書
從事機器學習教育訓練已近6 年,其間也在『IT 邦幫忙』撰寫100 多篇的文章(https://ithelp.ithome.com.tw/users/20001976/articles),從學員及讀者的回饋獲得許多寶貴意見,期望能將整個歷程集結成冊,同時,相關領域的進...
目錄
►第四篇 自然語言處理
第13 章 自然語言處理的介紹
▍13-1 詞袋(BOW)與TF-IDF
▍13-2 詞彙前置處理
▍13-3 詞向量(Word Vector)
▍13-4 GloVe 模型
▍13-5 中文詞向量
▍13-6 spaCy 套件
▍13-7 本章小結
▍參考資料( References)
第14 章 自然語言處理的演算法
▍14-1 循環神經網路(RNN)
▍14-2 長短期記憶網路(LSTM)
▍14-3 LSTM 重要參數與多層LSTM
▍14-4 Gate Recurrent Unit(GRU)
▍14-5 RNN 系列模型應用
▍14-6 股價預測
▍14-7 股價預測與時間序列分析
▍14-8 時間序列分析(Time Series Analysis)
▍14-9 Prophet 套件實作
▍14-10 以ARIMA 預測台股
▍14-11 以Prophet 預測台股
▍14-12 加入技術指標
▍14-13 NLP 其他應用
14-13-1 機器翻譯(NMT)
14-13-2 命名實體識別(NER)8
14-13-3 文本生成(Text generation)
▍14-14 本章小結
▍參考資料( References)
第15 章 大型語言模型(LLM)
▍15-1 Transformer 演算法
▍15-2 Transformer 實作
▍15-3 Transformers 套件實作
▍15-4 Transformers 模型微調
▍15-5 大型語言模型測試
▍15-6 ChatGPT 簡介
15-6-1 ChatGPT 使用者介面
15-6-2 OpenAI API
▍15-7 大型語言模型訓練架構
▍15-8 大型語言模型導入實務
15-8-1 提示工程(Prompt engineering)
15-8-2 RAG(Retrieval Augmented Generation)
15-8-3 AI Agent 5
▍15-9 本章小結
▍參考資料( References)
第16 章 語音辨識
▍16-1 語音基本認識
▍16-2 語音前置處理
▍16-3 TensorFlow/PyTorch 內建語音資料集
▍16-4 語音深度學習實作
▍16-5 自動語音辨識(Automatic Speech Recognition)
▍16-6 GMM-HMM 概念說明
▍16-7 GMM-HMM 實作
▍16-8 深度學習演算法
▍16-9 Whisper 套件測試
▍16-10 本章小結
▍參考資料( References)
►第五篇 強化學習(Reinforcement Learning)
第17 章 強化學習
▍17-1 強化學習的基礎
▍17-2 強化學習模型
▍17-3 簡單的強化學習架構
▍17-4 Gymnasium 套件
▍17-5 貝爾曼方程式(Bellman Equation)
▍17-6 動態規劃(Dynamic Programming)演算法
▍17-7 值循環(Value Iteration)
▍17-8 蒙地卡羅(Monte Carlo)演算法
▍17-9 時序差分(Temporal Difference)
17-9-1 SARSA 演算法
17-9-2 Q-learning 演算法
▍17-10 井字遊戲
▍17-11 倉庫撿貨系統
▍17-12 Deep Q-Learning 演算法
▍17-13 策略梯度(Policy Gradient)演算法
▍17-14 Stable Baselines3 套件
▍17-15 其他研究方向
▍17-16 本章小結
▍參考資料( References)
►第四篇 自然語言處理
第13 章 自然語言處理的介紹
▍13-1 詞袋(BOW)與TF-IDF
▍13-2 詞彙前置處理
▍13-3 詞向量(Word Vector)
▍13-4 GloVe 模型
▍13-5 中文詞向量
▍13-6 spaCy 套件
▍13-7 本章小結
▍參考資料( References)
第14 章 自然語言處理的演算法
▍14-1 循環神經網路(RNN)
▍14-2 長短期記憶網路(LSTM)
▍14-3 LSTM 重要參數與多層LSTM
▍14-4 Gate Recurrent Unit(GRU)
▍14-5 RNN 系列模型應用
▍14-6 股價預測
▍14-7 股價預測與時間序列分析
▍14-8 時間序列分析(Time Serie...