大數據為什麼不夠聰明?
比機率更強大的思考工具又是什麼?
比機率更強大的思考工具又是什麼?
電腦科學界諾貝爾獎「圖靈獎」得主暨貝氏網路研發先驅Judea Pearl總結畢生研究成果,聯手獲獎的統計學家Dana Mackenzie,提出改變人工智慧及科學界的重要工具!《快思慢想》作者暨諾貝爾獎得主康納曼、《大演算》作者多明哥斯、谷歌網路推廣長文特‧瑟夫、微軟研究實驗室主任艾瑞克‧霍爾維茲等人重磅推薦!
▎大數據看似厲害,其實有很大的侷限
近幾年大數據當紅,加上它在許多領域的成功運用,其地位與能力備受追捧。與大數據密切相關的統計學,是法蘭西斯・高爾頓與卡爾・皮爾森解答對於遺傳的疑問未果,而開發出來的學科,這門學科創立後興盛數十載,其名言「相關不是因果」影響科學界經常止步於探究「關聯」而非「因果」,並且長期受資料本位的歷史所影響,認為資料無所不能,但是朱迪亞・珀爾希望藉此書告訴讀者,資料本身一點也不智慧。
▎要發展出「強AI」,機率思考仍遠遠不夠
一九八○年代初,朱迪亞・珀爾認為不確定性是AI所欠缺的最重要的能力,於是運用機率開發出強大的推理工具——貝氏網路,因而獲得有電腦科學界諾貝爾獎之稱的「圖靈獎」。貝氏網路是首先讓電腦以灰階方式思考的工具,至今仍極受人工智慧界倚重,然而到了一九八○年代末,珀爾認為貝氏網路仍沒有填補人工智慧和人類智慧的差距,於是他轉而研究如何教AI學會「因果推論」,本書便是整理了歷代科學家推展因果革命的努力與成果。
▎從「求得相關性」的舊階段,邁入「釐清因果關係」的新時代
本書最初幾章是有趣的科學史,探討科學家追求因果解釋的過程如何受挫,以致發展出統計學,並讓統計學方法長期引領學界研究。接著書中有大約一半篇幅,作者以實例示範因果語言(圖示模型)如何解決傳統統計學認為無解的難題,逐一揭示「因果階梯」三大分層的能力(越高的層級,認知挑戰越高,越難理出因果關係),並讓讀者了解因果革命路上諸人的努力與進展,以及這些進展的重要性。本書末尾回頭說明因果革命相對於人工智慧各重要發展面向(比如大數據、深度學習、資料探勘、機器學習等),有何勝出之處、能對它們起什麼正面影響,以及最重要的——「因果革命」將會如何改變人工智慧。
▎「因果革命」不只影響人工智慧,還影響各研究領域
現今機器學習運作時仰賴的是「相關性」,而不是「因果」,如果能成功將因果思考導入電腦,將使電腦變成真正的科學家,使它們成為我們的得力伙伴,提供我們更合理的洞見。由於因果思考可以呈現罪責,電腦能因而具備道德感——「具備道德感的強AI」是因果革命在人工智慧領域的終極追求,作者形容這「是人工智慧給人類的第一個、也是最好的禮物」。
因果性研究還釐清了我們多年來對許多知識本質的不解,改變我們對於眾多問題的認識,這些問題牽涉的層面無所不包,舉凡涉及解讀資料以及根據解釋而採取的作法(像是致病因素、醫療資源分配、公共政策擬定等),都能受益。集結眾多領域學人之力才有如今成果的因果革命,亦將回頭影響整個科學界,珀爾形容它「將使科學的體質更加健全,是人工智慧給人類的第二個禮物」。在美國,因果科學已經開始被大學列入課程……
▎我們強烈建議這些人士閱讀這本書:
(1)資料科學家與大數據研究者,以及對大數據深感興趣的人
(2)統計學家、數學家,電腦科學相關從業人員與學習者
(3)對經濟趨勢與科研發展有興趣的一般大眾
(4)希望培養科學素養,了解最新科學方法的學子
▎各章內容簡介請參閱〈目錄〉的引文。
各界盛讚
◎谷歌網路推廣長文特‧瑟夫:
珀爾近三十年來的學術成就,為人工智慧發展提供堅實的理論基礎……同時把「思考機器」提升到另一個境界。
◎《大演算》作者佩德羅‧多明哥斯:
因果如果不是相關,那又是什麼?拜朱迪亞‧珀爾的劃時代研究之賜,現在我們已能精確回答這個問題。想理解世界如何運行,這本引人入勝且讀來愉快的書是理想的起點。
◎微軟研究實驗室科技研究員及主任艾瑞克‧霍爾維茲:
朱迪亞‧珀爾是人工智慧領域、甚至整個電腦科學界革命的核心人物。
◎諾貝爾經濟學獎得主及《快思慢想》作者丹尼爾‧康納曼 :
各位是否曾疑惑「相關」和「因果」究竟是什麼關係?這本精彩著作深入淺出地說明了答案。
◎《紐約時報》喬納山‧尼伊:解說十分詳盡……本書不僅詳盡介紹概念的發展史,也提供概念工具,讓讀者理解大數據的優勢與不足之處。
◎《自然》雜誌:「相關不是因果」這句科學俗語已在社會上造成影響……朱迪亞‧珀爾提出嶄新的數學解決方案……現在已在生物、醫學、社會科學和人工智慧領域開花結果。
◎《猶太日報》:深入淺出……珀爾是有遠見的因果革命領袖,這本書則是他最大的成就。
讀者好評
◎對電腦科學、統計學或人工智慧當今發展有興趣的人都應該讀讀。這本書如同康納曼的《快思慢想》,是作者畢生科學研究的總結,不僅對同領域科學家而言價值非凡,也是全人類的瑰寶。(讀者阿蘭‧約瑟夫‧坎恩)
◎朱迪亞‧珀爾的貝氏網路和因果圖以十分優雅的方式結合統計學、流行病學、決策和電腦科學等領域。他的研究成果賦予並擴大了大數據的潛力。這本書是市面上第一本為一般大眾介紹這主題的書籍,其影響將無以估計。(讀者湯瑪斯 J. 阿拉岡,流行病學家)
◎知名商學研究所都應該用這本書當成教材。我送了一本給我念大學時的院長。為了現在和未來的學生著想,我希望它能成為一門課。(讀者喬治‧莫札奇斯)