序
2018 年,一位電腦專業的朋友自學機器學習內容,期間遇到諸多困難,尤其是關於機率與統計學方面的內容,這一現象讓我開始關注統計學與機器學習這兩個領域。李航老師的《統計學習方法》可以說是一本與統計學接軌最多的書籍,也讓我萌生了與大家分享統計學與機器學習的想法。雖然機器學習的發展有其獨特的發展歷程,但是很多模型和演算法的理論基礎仍然來自於統計學。因此,我們需要從統計學的角度來理解機器學習模型的本質。
在朋友們的鼓勵下,我決定以《統計學習方法》為藍本,製作知識型影片。入駐 B 站(編按:中國大陸的視訊網站bilibili)後,從最初寥寥的幾十名粉絲,到幾百名粉絲,再到現在的將近三萬名粉絲。這些人中有一部分是學生,如剛畢業的高中生、大學生、碩士生和博士生;還有一部分是從業者,如大專院校教師、企業或公司的在職人員。大家志同道合、匯聚於此。與各位的互動交流讓我加深了理解,開闊了視野,拓寬了想法。真誠地感謝各位朋友們長期以來的支援!是你們的支援讓我有勇氣繼續錄製影片並貫徹始終。
自古以來,學者們便一直在探尋萬物本源,尋找真理。如今,人工智慧已經成為科技領域的一大熱點,機器學習更是其中最為核心的研究方向之一。在機器學習領域,很多人關注演算法的實現和結果,卻忽略了演算法背後的理論基礎。而在這一領域,機率和統計學是不可或缺的。希望本書的出版為展示機器學習背後的統計學原理提供綿薄之力。
為滿足不同年齡和不同專業讀者的需求,我們為大家貼心地準備了主體書與小冊子。主體書以機器學習模型為主,每一章都清晰透徹地解析了模型原理,書中的每一頁都設計了留白,方便讀者批註;小冊子用於查閱碎片化的基礎知識,便於讀者隨時複習需要的數學概念。書中不僅有機器學習的理論知識,還有故事和案例,希望各位讀者在閱讀本書的過程中能夠感受到機器學習中統計思維的魅力,獲得科學思維方法的啟發並具有獨立的創新思辨能力。
最後,我要感謝清華大學出版社的楊迪娜編輯,是她讓我有了寫書的想法,將我累積多年的機器學習中的統計思維知識分享給讀者,更感謝她為本書成立、編校與出版所付出的辛勤勞動,同時感謝清華大學出版社對本書的支援。感謝所有嗶哩嗶哩、公眾號和知乎上的粉絲對我的關注、留言、提問與批評。感謝來自天津大學的馬曉慧幫助整理影片講義。感謝家人帶給我的靈感、快樂與溫暖。
限於本人水準,書中的缺點和不足之處在所難免,熱忱歡迎各位讀者批評指正。
董 平