購物比價找書網找車網
FindBook  
 有 7 項符合

強化學習導論 

的圖書
強化學習導論【金石堂、博客來熱銷】 強化學習導論【金石堂、博客來熱銷】

出版日期:2021-11-22
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:強化學習導論 

1.本書從假設與理論開始討論,再進入演算法與範例,讓讀者了解整體架構的來龍去脈。
2.每章的開始先綜述該章的主要內容,讓讀者有大方向的了解,再進入細節的討論。
3.相關概念以圖示方式呈現,讀者較易理解與統整。
4.每章搭配範例與程式碼,徹底了解演算法特性。
5.每章結尾作重點回顧,條列該章裡重要概念,方便讀者確認學習重點。
6.本書適用於自學、大學或科大課程教科書與實作專題的輔助教材,以及業界工程師快速奠定強化學習基礎概念與實作能力的教學書籍。
 

近年來因人工智慧興起,帶起許多學生、工程師與學者開始投入相關技術的學習、研究和開發。早期談到人工智慧,大部分會聯想到機器學習中的監督式學習和非監督式學習。然而監督或非監督式學習較難處理動態系統,機器學習技術的另一個分支─強化學習,剛好補足此缺口。強化學習的應用相當廣,最有名的兩個例子為AlphaGo透過資料學習在圍棋比賽上屢獲佳績,以及Google利用強化學習技術,優化資料中心的運作,進而減少40%的冷卻花費。本書以奠定基本功為目的,一步步帶領讀者建構完整的強化學習知識,介紹的相關概念包含:動態規劃、蒙地卡羅法、1步時間差分法、n步時間差分法、近似解法、規劃與學習、資格跡與學習、策略梯度法。
 

目錄
第1章 強化學習框架
1-1 強化學習主要元素與馬可夫決策過程
1-2 範例1.1
1-3 策略和價值函數
1-4 範例1.2
1-5 最佳策略和最佳價值函數
重點回顧
章末練習

第2章 動態規劃
2-1 策略評估
2-2 策略改進
2-3 範例2.1與程式碼
2-4 策略疊代和價值疊代
2-5 動態規劃的優缺點與異步更新
2-6 範例2.2與程式碼
2-7 廣義策略疊代
重點回顧
章末練習

第3章 蒙地卡羅法
3-1 蒙地卡羅預測
3-2 同策略與異策略法
3-3 同策略蒙地卡羅控制
3-4 範例3.1與程式碼
3-5 異策略與重要性抽樣
3-6 異策略蒙地卡羅預測
3-7 異策略蒙地卡羅控制
重點回顧
章末...
顯示全部內容
贊助商廣告
 
金石堂 - 今日66折
周姚萍的小作家書房1:是誰惡作劇
66折: $ 165 
TAAZE 讀冊生活 - 今日66折
成功開店計畫書(增訂版):小資本也OK!從市場分析、店面經營、行銷規劃,你要做的是這23件事
作者:關登元
出版社:PCuSER電腦人文化
出版日期:2020-02-22
66折: $ 250 
金石堂 - 今日66折
迷妹的韓文自學法:零基礎也能無痛養成韓文腦
作者:LJ
出版社:如何出版社
出版日期:2023-01-01
66折: $ 211 
 
金石堂 - 暢銷排行榜
咒術迴戰 (首刷限定版) 28
作者:芥見下々
出版社:東立出版社
出版日期:2024-12-16
$ 119 
金石堂 - 暢銷排行榜
阿斯特莉亞回憶錄(02)正義失墜在地下城尋求邂逅是否搞錯了什麼英雄譚限定版
作者:大森藤ノ
出版社:青文出版社股份有限公司
出版日期:2024-12-18
$ 213 
金石堂 - 暢銷排行榜
緋色誘惑(07)完結特裝版
作者:山根綾乃
出版社:尖端漫畫
出版日期:2024-11-21
$ 699 
Taaze 讀冊生活 - 暢銷排行榜
穴道按壓使用手冊 :史上最好找!立體穿透圖!疼痛立解、疲勞速消、身心都放鬆、百病不上身!
作者:福辻鋭記
出版社:台灣廣廈
出版日期:2017-04-14
$ 197 
 
Taaze 讀冊生活 - 新書排行榜
員工問題之診斷與處理
作者:鄧東濱編著
出版社:布克文化
出版日期:2024-11-30
$ 450 
博客來 - 新書排行榜
失控的焦慮世代:手機餵養的世代,如何面對心理疾病的瘟疫
作者:強納森.海德特 (Jonathan Haidt)
出版社:網路與書出版
出版日期:2024-11-29
$ 379 
金石堂 - 新書排行榜
PASSION(3)
作者:KangJak
出版社:台灣角川股份有限公司
出版日期:2024-12-19
$ 300 
博客來 - 新書排行榜
張忠謀自傳:上冊 一九三一 ── 一九六四
作者:張忠謀
出版社:天下文化
出版日期:2024-11-29
$ 276 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策