章節說明:第 1 章 吃角子老虎機問題
第 2 章 馬可夫決策過程
第 3 章 貝爾曼方程式
第 4 章 動態規劃法
第 5 章 蒙地卡羅法
第 6 章 TD 法
第 7 章 類神經網路與 Q 學習
第 8 章 DQN
第 9 章 策略梯度法
第 10 章 進階內容
附錄 A 離線策略蒙地卡羅法
附錄 B n 步 TD 法
附錄 C 理解 Double DQN
附錄 D 驗證策略梯度法
購物比價 | 找書網 | 找車網 |
FindBook |
有 4 項符合
Deep Learning 4|用Python進行強化學習的開發實作的圖書 |
圖書館借閱 |
國家圖書館 | 全國圖書書目資訊網 | 國立公共資訊圖書館 | 電子書服務平台 | MetaCat 跨館整合查詢 |
臺北市立圖書館 | 新北市立圖書館 | 基隆市公共圖書館 | 桃園市立圖書館 | 新竹縣公共圖書館 |
苗栗縣立圖書館 | 臺中市立圖書館 | 彰化縣公共圖書館 | 南投縣文化局 | 雲林縣公共圖書館 |
嘉義縣圖書館 | 臺南市立圖書館 | 高雄市立圖書館 | 屏東縣公共圖書館 | 宜蘭縣公共圖書館 |
花蓮縣文化局 | 臺東縣文化處 |
|
內容簡介:本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。
從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。
|