本書基於備受讀者推崇的王樹森“深度強化學習”系列公開視頻課,專門解決“入門深度強化學習難”的問題。本書的獨特之處在於:第一,知識精簡,剔除一切不必要的概念和公式,學起來輕鬆;第二,內容新穎,聚焦近10年深度強化學習領域的突破,讓你一上手就緊跟最新技術。本書系統講解深度強化學習的原理與實現,但不迴避數學公式和各種模型,原創100多幅精美插圖,並以全彩印刷展示。簡潔清晰的語言+生動形象的圖示,助你掃除任何可能的學習障礙!本書內容分為五部分:基礎知識、價值學習、策略學習、多智能體強化學習、應用與展望,涉及DQN、A3C、TRPO、DDPG、AlphaGo等。
本書面向深度強化學習入門讀者,助你構建完整的知識體系。學完本書,你能夠輕鬆看懂深度強化學習的實現代碼、讀懂該領域的論文、聽懂學術報告,具備進一步自學和深挖的能力。
王樹森,現任小紅書基礎模型團隊負責人,從事搜索和推薦算法研發工作。從浙江大學獲得計算機學士和博士學位,就讀期間獲得“微軟學者”和“百度獎學金”等多項榮譽。在加入小紅書之前,曾任美國加州大學伯克利分校博士后、美國史蒂文斯理工學院助理教授、博導。在機器學習、強化學習、數值計算、分佈式計算等方向有多年科研經驗,在計算機國際頂級期刊和會議上發表30多篇論文。在YouTube、B站開設“深度強化學習”“深度學習”“推薦系統”公開課(ID:Shusen Wang),全網視頻播放量100萬次。
黎彧君,華為諾亞方舟實驗室高級研究員,主要從事AutoML相關的研發工作。上海交通大學博士,研究方向為數值優化、強化學習;攻讀博士學位期間曾前往普林斯頓大學訪問一年。共同翻譯出版“花書”《深度學習》。
張志華,北京大學數學科學學院教授。此前先後執教於浙江大學和上海交通大學,任計算機科學教授。主要從事統計學、機器學習與計算機科學領域的研究和教學。曾主講“統計機器學習”“機器學習導論”“深度學習”“強化學習”,其課程視頻廣受歡迎。