購物比價找書網找車網
FindBook  
 有 1 項符合

強化學習入門:基於Python

的圖書
強化學習入門:基於Python 強化學習入門:基於Python

作者:吳喜之 
出版社:中國人民大學出版社
出版日期:2023-03-01
語言:簡體中文   規格:平裝 / 186頁 / 19 x 26 x 1 cm / 普通級/ 1-1
圖書選購
型式價格供應商所屬目錄
 
$ 256
博客來 博客來
工程技術
圖書介紹 - 資料來源:博客來   評分:
圖書名稱:強化學習入門:基於Python

內容簡介

強化學習是機器學習的重要組成部分。本書採用理論與實踐相結合的寫法,從強化學習的基本概念開始,詳細介紹了強化學習的演算法理論和實踐操作,配有Python代碼實現,完整呈現強化學習演算法的實踐細節。
 
通過這本書你將會:
(1)理解強化學習關鍵方面的問題。
(2)探索瑪律可夫決策過程及動態規劃的過程。
(3)深入理解強化學習的各種方法,包括MC方法,TD方法,深度學習Q方法,SARSA方法等。
(4)通過大量的現實例子及Python實現程式,不斷地實踐,成為強化學習的高手。

 

目錄

第一部分 強化學習基礎與實踐
第1章 引 言
1.1 從迷宮問題談起
1.1.1 人類和動物所面對的迷宮問題
1.1.2 迷宮的說明性例子
1.1.3 例1.1: 獎勵矩陣
1.1.4 例1.1: 訓練以得到關於狀態和行動的獎勵: Q矩陣
1.1.5 例1.1: 使用Q矩陣來得到行動(路徑)
1.1.6 例1.1: 把代碼組合成 class
1.2 熱身: 井字遊戲*
1.2.1 兩個真人的簡單井字遊戲
1.2.2 人和機器的井字遊戲的強化學習實踐
1.2.3 井字遊戲的強化學習代碼解釋
1.2.4 整個訓練過程
1.2.5 使用訓練後的模型做人機遊戲
1.2.6 1.2.1節代碼
1.2.7 附錄: 1.2.3節人和機器的井字遊戲代碼
1.3 強化學習的基本概念
1.4 瑪律可夫決策過程的要素
1.5 作為目標的獎勵
1.6 探索與開發的權衡
1.6.1 探索與開發
1.6.2 強化學習中的優化和其他學科的區別
1.7 本書將會討論和運算的一些例子
1.7.1 例1.3格子路徑問題
1.7.2 例1.4計程車問題
1.7.3 例1.5推車杆問題
1.7.4 例1.6倒立擺問題
1.7.5 例1.7多臂老虎機問題
1.7.6 例1.7和其他例子(例1.3、例1.5及例1.6)的區別

第2章 瑪律可夫決策過程和動態規劃
2.1 瑪律可夫決策過程簡介
2.1.1 瑪律可夫性
2.1.2 策略
2.1.3 作為回報期望的價值函數
2.1.4 通過例 1.3 格子路徑問題理解本節概念
2.2 動態規劃
2.2.1 動態規劃簡介
2.2.2 Bellman方程
2.2.3 策略和價值函數
2.3 強化學習基本方法概述
2.3.1 代理與環境的互動
2.3.2 策略反覆運算: 策略評估和策略改進
2.3.3 價值反覆運算
2.3.4 策略反覆運算與價值反覆運算比較
2.3.5 非同步動態規劃
2.3.6 廣義策略反覆運算
2.3.7 策略梯度
2.3.8 off-policy, on-policy和offline RL
2.4 蒙特卡羅抽樣
2.4.1 MC策略評估
2.4.2 MC狀態-行動值的估計
2.4.3 on-policy: Q價值的MC估計
2.4.4 off-policy: MC預測
2.4.5 MC的策略梯度
2.5 和本章概念相關的例子
2.5.1 例1.3格子路徑問題使用Bellman方程做價值反覆運算
2.5.2 例1.3格子路徑問題的TD函數
第3章 各種機器學習演算法及實例
3.1 暫時差(TD)簡介
3.1.1 TD、DP和MC演算法的比較
3.1.2 TD方法的特點
3.1.3 TD(0)方法的延伸
3.2 TD評估及策略改進
3.2.1 SARSA (on-policy)
3.2.2 Q學習 (off-policy)
3.2.3 加倍Q學習 (off-policy)
3.3 函數逼近及深度學習演算法
3.3.1 基於價值和策略的函數逼近
3.3.2 深度Q學習
3.3.3 TD: 演員-批評者(AC)架構
3.3.4 A2C演算法步驟
3.3.5 A3C 演算法
3.3.6 DDPG 演算法
3.3.7 ES 演算法
3.3.8 PPO 演算法
3.3.9 SAC 演算法
3.4 用第1章的例子理解本章演算法
3.4.1 例1.3格子路徑問題: SARSA
3.4.2 例1.4計程車問題: SARSA
3.4.3 例1.3格子路徑問題: 加倍Q學
3.4.4 例1.5推車杆問題: 深度Q學習
3.4.5 例1.5推車杆問題: A3C
3.4.6 例1.6倒立擺問題: DDPG
3.4.7 例1.5推車杆問題: ES
3.4.8 例1.5推車杆問題: PP

 

詳細資料

  • ISBN:9787300313818
  • 規格:平裝 / 186頁 / 19 x 26 x 1 cm / 普通級 / 1-1
  • 出版地:中國
贊助商廣告
 
金石堂 - 今日66折
愛上鑄鐵鍋:活用中小型STAUB鍋,在家烹調更輕鬆,79道蒸煮、油炸、煙燻、甜點料理天天上桌
作者:今泉久美
出版社:積木文化
出版日期:2022-10-27
66折: $ 251 
金石堂 - 今日66折
南國夢獸
作者:林益彰
出版社:羽翼實業有限公司
出版日期:2024-01-31
66折: $ 238 
金石堂 - 今日66折
寫下歷史的世界500步道
作者:莎拉.貝克斯特
出版社:積木文化
出版日期:2017-08-05
66折: $ 495 
金石堂 - 今日66折
拈花對天窗:龔顯榮詩集
作者:龔顯榮
出版社:羽翼實業有限公司
出版日期:2024-01-31
66折: $ 165 
 
Taaze 讀冊生活 - 暢銷排行榜
你願意,人生就會值得:蔡康永的情商課3
作者:蔡康永
出版社:如何出版
出版日期:2024-08-01
$ 316 
金石堂 - 暢銷排行榜
甜蜜.痛楚-全
作者:椿
出版社:長鴻出版社股份有限公司
出版日期:2024-11-01
$ 119 
Taaze 讀冊生活 - 暢銷排行榜
素食者【亞洲首部榮獲國際曼布克獎作品】
作者:韓江
出版社:漫遊者文化
出版日期:2023-05-10
$ 300 
博客來 - 暢銷排行榜
隱性潛能:華頓商學院最具影響力教授,突破天賦極限的實證科學【博客來獨家版.附人生領航指南書】
作者:亞當.格蘭特
出版社:平安文化
出版日期:2024-07-29
$ 379 
 
金石堂 - 新書排行榜
RIDE ON!放浪車床族(全)
作者:水平線
出版社:台灣角川股份有限公司
出版日期:2024-11-07
$ 111 
博客來 - 新書排行榜
神樂鉢 3 (首刷限定版)
$ 130 
金石堂 - 新書排行榜
東方的神話,四十多年的經濟奇蹟:玄空風水學—商業帝國的黃金定律
作者:吳海揚Master Wu
出版社:柿子文化事業有限公司
出版日期:2024-11-04
$ 356 
金石堂 - 新書排行榜
肌肉魔法使 MASHLE 13
作者:甲本一
出版社:東立出版社
出版日期:2024-12-31
$ 109 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策