購物比價找書網找車網
FindBook
排序:
 
 有 1 項符合

alexander zai

的圖書
深度強化式學習
$ 710 ~ 950
深度強化式學習
作者:Alexander ZaiBrandon Brown / 譯者:黃駿 
出版社:旗標科技股份有限公司
出版日期:2021-04-02
語言:繁體書   
圖書介紹9 查價格、看圖書介紹
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:深度強化式學習

深度強化式學習 (Deep Reinforcement Learning, DRL),就是將深度學習與強化式學習結合的技術。要讓 AI 應用落地,DRL 是必不可缺的技術。近期由兩位劍橋大學博士所帶領的 Wayve 團隊就利用了 DRL 技術,開發出可以自行從新環境中學習的自動駕駛技術,取代以往完全仰賴感測器的做法。除此之外,工廠內的自動化機器人, 或是打敗世界棋王的 AlphaGo 等,背後運作的演算法也都與 DRL 息息相關。

然而 DRL 的演算法五花八門,讓人看了眼花繚亂。事實上,它們都是為了應付各式各樣的任務而發展出來的改良版本,其核心概念的差異不大,都是立足於 DRL 最基本的 DQN (Deep Q-Network) 之上。因此本書會花費較多的篇幅,一步步帶您把 DQN 的架構完全摸透,並時時提點各個技術細節的重點,讓您可以因應不同的任務或問題,加入適當的技術或技巧來克服,再進一步實作出各種進階的演算法。


本書一共分成兩篇:基礎篇及進階篇。在基礎篇中,讀者將學習如何從無到有,建構出自己的第一個RL演算法,並用該演算法來解決多臂拉霸機問題。接著,讀者會認識RL中較為經典的演算法,如DQN、策略梯度法、A2C等。同時,各章節皆搭配數個專案,確保讀者可以在學習理論的過程中,培養實作出演算法的能力,不再只是紙上談兵。

在進階篇中,作者將會介紹較為新穎,也較為複雜的RL演算法。基本上,這些演算法都是以DQN為出發點,再加上特殊的技巧,便能處理現實中的難題。舉個例子,利用平均場DQN,學者們成功模擬出了電子的自旋狀況,進而解決了RL中的多代理人問題。同時,讀者們還將學到如何將attention機制與DQN做結合,進而實作出關聯性DQN(relational DQN),提高演算法的可解釋性。

本書提供了完整的學習架構,循序漸進地介紹各種演算法,包括:
● Deep Q-Network (DQN)
● 策略梯度法(Policy gradient methods)
● 優勢值演員-評論家(Advantage Actor-Critic, A2C)
● 分散式優勢值演員-評論家(Distributional Advantage Actor-Critic, DA2C)
● 進化演算法(Evolutionary algorithm)
● 分散式DQN(Distributional DQN)
● 鄰近Q-Learning(Neighborhood Q-Learning)
● 平均場Q-Learning(Mean field Q-Learning)
● 關聯性DQN(Relational DQN)

除了 RL 相關演算法之外,書中也介紹了近期應用 RL 而發展出來的熱門模型,相信可以提升讀者的硬實力,其中包括:
● 圖神經網路(Graph Neural Network, GNN)
● Transformer模型
● Attention模型(Attention model)

總的來說,本書是最全面、最白話的強化式學習演算法實戰解析。只要您有基本的深度學習知識,並且想要認識強化式學習領域,那麼您就是本書在尋找的合適讀者!
本書特色:
●囊括各種強化式學習的基礎及進階演算法,學習架構完整
●適當地補充數學及統計基礎,必要知識直接回顧,不用東翻西找其他資源
●重點整理深度強化式學習的基本架構,打好基礎、再先進的改良模型也看得懂
●以日常案例來實踐 DRL,理解起來事半功倍
●利用Python+PyTorch實作各章專案,不會只是紙上談兵
●所有程式皆已整理成Colab筆記本,一鍵即可檢驗結果
●本書由施威銘研究室監修,內容易讀易懂,並加入大量「編註」與「小編補充」以幫助理解及補充必要知識。

作者簡介:

Alex Zai 曾任 Codesmith 的首席技術長(Codesmith 為沉浸式 coding bootcamp,Alex 至今仍在其中擔任技術顧問)、Uber 的程式設計師、以及 Banjo 和 Amazon 的機器學習工程師。他同時也是開源深度學習架構Apache MXNet 的貢獻者之一。Alex Zai 還是一名創立了兩間公司的企業家,其中一間為 Y-combinator 的子公司。

Brandon Brown 自幼學習程式設計、並在大學時期兼職當軟體工程師,但最後他選擇進入了醫學行業。目前,他仍在醫療科技領域從事軟體工程工作。Brandon 目前是一名醫生,並從事與計算精神醫學(computational psychiatry,該領域即是受 DRL 啟發)有關的研究。

目錄
第一篇:基礎篇
第1章:強化式學習的基本觀念
1.1 深度強化式學習中的『深度』
12 強化式學習
1.3 動態規劃 vs. 蒙地卡羅法
1.4 強化式學習架構
1.5 強化式學習有什麼應用?
1.6 為什麼要使用『深度』強化式學習?
1.7 有用的說明工具 – 線圖(string diagram)
1.8 未來各章的內容安排

第2章:模型化強化式學習問題:馬可夫決策過程
2.1 多臂拉霸機問題
2.2 利用拉霸機問題的演算法來優化廣告推送策略
2.3 使用PyTorch建構神經網路
2.4 解決廣告推送問題
2.5 馬可夫性質與MDP(馬可夫決策過程)
2.6 策略與價值函數
...
顯示全部內容
贊助商廣告
 
金石堂 - 今日66折
德式酥菠蘿烘焙全書:經典德式奶酥的美味應用!一吃就愛的蛋糕x塔派x酥餅x麵包,奧地利寶盒的家庭烘
作者:奧地利寶盒(傅寶玉)
出版社:台灣廣廈有聲圖書有限公司
出版日期:2024-06-27
66折: $ 449 
金石堂 - 今日66折
韓系石膏設計:第一本石膏創作全技法!擴香石X托盤X燭台X花器,30款簡單的美感生活小物
作者:楊語蕎
出版社:蘋果屋出版社
出版日期:2023-12-28
66折: $ 329 
金石堂 - 今日66折
1本就通 國中英文關鍵字 用法零失誤:用圖鑑輕鬆搞懂關鍵動詞、掌握靈活運用的核心技巧,一次學會再也不用錯!
作者:關正生、煙草谷大地
出版社:國際學村出版社
出版日期:2023-02-09
66折: $ 211 
金石堂 - 今日66折
你不用看別人臉色也可以活得很好:果斷拒絕利用你的善良來剝削感情的人
作者:韓慶銀
出版社:幸福文化
出版日期:2021-04-21
66折: $ 251 
 
Taaze 讀冊生活 - 暢銷排行榜
我可能錯了:森林智者的最後一堂人生課
作者:比約恩.納提科.林德布勞、卡洛琳.班克勒、納維德.莫迪里
出版社:先覺出版
出版日期:2023-02-01
$ 355 
金石堂 - 暢銷排行榜
攀高、續抱、快逃──K線之道:股票要漲,不能純靠題材,更需要資金拉抬。K線比財報早知道,賺到70%漲幅。
作者:林家洋
出版社:大是文化有限公司
出版日期:2025-04-30
$ 379 
金石堂 - 暢銷排行榜
我所看見的未來  完全版 (竜樹諒預言漫畫集)
作者:竜樹諒
出版社:大塊文化出版股份有公司
出版日期:2022-07-01
$ 300 
Taaze 讀冊生活 - 暢銷排行榜
低年級國小國語作業簿
作者:世一文化編輯群
出版社:世一文化事業股份有限公司
出版日期:2024-02-26
$ 19 
 
博客來 - 新書排行榜
學生會也有洞! 7
作者:無知麻呂
出版社:東立
出版日期:2025-04-21
$ 133 
金石堂 - 新書排行榜
調皮好色這些女孩們渴望受人寵愛。 無修正
作者:稲鳴四季
出版社:未來數位有限公司
出版日期:2025-05-02
$ 237 
金石堂 - 新書排行榜
WIND BREAKER–防風少年–(14)
作者:にいさとる
出版社:尖端漫畫
出版日期:2025-04-18
$ 119 
金石堂 - 新書排行榜
女高中生小春在異世界成為娼妓(07)END
作者:山田J太
出版社:青文出版社股份有限公司
出版日期:2025-04-17
$ 126 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策