「沒有大量資料支撐的人工智慧就是人工智障」
AI是什麼?為什麼熱門?是否已經成熟?
跟著本書搞懂資料科學,跟上未來趨勢!
▎人工智慧用於何處?
2017年是人工智慧(Artificial Intelligence,AI)年,人工智慧技術越來越多的應用到日常生活的各個方面。AlphaGo ZERO替代AlphaGo實現自我學習;百度無人汽車上路;iPhone X開啟Face ID;阿里和小米先後發表智慧音箱;肯德基上線人臉支付……這些背後都是人工智慧技術的驅動!
【人工智慧概述】
首先為讀者解釋了AI的基礎概念,探索其技術的成熟度,並對美國和中國的AI現狀進行比較。此章還概述了AI與雲端運算和大數據的深層關係及歷史發展。
【AI產業、資料及機器學習】
從AI產業的基礎層、技術層到應用層逐層深入,並介紹大數據的基本概念、現狀及其在中國的運算模式。此外,機器學習作為AI的核心,我們著重於其基本概念和資料的預處理方法。
【模型和機器學習的演算法】
從模型的基礎訓練到評估,以及各類型的機器學習演算法,如支援向量機、KNN和決策樹等,這些都為讀者提供了全面的視野。
【探討深度學習】
深度學習是AI的另一個重要分支,本章專門探討此領域,涵蓋從基本神經網路到卷積神經網路的各種技術。
本書特色:本書全面講述人工智慧與大數據涉及的技術,共分7章,包括人工智慧概述、AI產業、資料、機器學習概述、模型、機器學習算法、深度學習等。閱讀完本書後,讀者將對人工智慧技術有全面的理解,並能掌握AI整體知識架構。
作者簡介:
楊正洪,在矽谷從事AI和大數據相關研發工作十餘年,是海外智庫專家顧問,曾擔任在美上市公司CTO、北京某國企CIO和上海某國企高階副總裁等職。出版了《智慧城市》、《大數據技術入門》等多本暢銷書。
郭良越,專職作者。
劉瑋,專職作者。
章節試閱
第1章 人工智慧概述
機器人是人類的古老夢想。希臘神話中已經出現了機械人,至今機器人仍然是眾多科幻小說的重要元素。實現這個夢想的第一步是了解如何將人類的思考過程形式化和機械化。科學家們被這一夢想深深吸引,開始研究記憶、學習和推理。1930年代末到1950年代初,神經學研究發現大腦是由神經元組成的電子網路,克勞德·夏農(Claude Shannon)提出的資訊論則描述了數位訊號,圖靈(Turing)的運算理論證明了一臺僅能處理0和1這樣簡單二元符號的機械設備能夠模擬任意數學推理。這些密切相關的成果暗示了建構電子大腦的可能性。在1956年的達特茅斯會議上,「人工智慧」(Artificial Intelligence,AI)一詞被首次提出,其目標是「製造機器模仿學習的各個方面或智慧的各個特性,使機器能夠讀懂語言,形成抽象思維,解決人們目前的各種問題,並能自我完善」。這也是我們今天所說的「強人工智慧」的概念,其可以理解為,人工智慧就是在思考能力上可以和人做得一樣好。今天所說的「弱人工智慧」是指只處理特定問題的人工智慧,如電腦視覺、語音辨識、自然語言處理,不需要具有人類完整的認知能力,只要看起來像有智慧就可以了。一個弱人工智慧的經典例子就是那個會下圍棋並且僅僅會下圍棋的AlphaGo。
雖然強人工智慧仍然是人工智慧研究的一個目標,但是強人工智慧演算法還沒有真正的突破。大多數的主流研究者希望將解決局部問題的弱人工智慧的方法組合起來實現強人工智慧。業界的共識是,大部分的應用都是弱人工智慧(如有監督式學習),實現近似人類的強人工智慧還需要數十年,乃至上百年。在可見的未來,強人工智慧既非人工智慧討論的主流,也看不到其成為現實的技術路徑。弱人工智慧才是在這次人工智慧浪潮中真正有影響力的主角,本書將聚焦於更具有現實應用意義的弱人工智慧技術。
從各國政府到資本、業界都熱情擁抱人工智慧,以人工智慧驅動的智慧化變革正在引發第4次工業革命。雖然人工智慧在2018年還處於炒作週期的頂峰,但我們可以預測,人工智慧正變得更加實用和有用。在此大背景下,我們有必要知道人工智慧是什麼、紅在哪裡、是否已經成熟。人工智慧技術的壁壘在哪裡?了解商業化的邊界在哪裡,才能更好的理解人工智慧。
1.1 AI是什麼
人工智慧是一門利用電腦模擬人類智慧行為科學的統稱,它涵蓋了訓練電腦使其能夠完成自主學習、判斷、決策等人類行為的範疇。AI是人工智慧的英文Artificial Intelligence的首字母的組合,它是當前人類所面對的最為重要的技術變革。AI技術給予了機器(這裡的機器不僅僅指機器人,還包括消費產品,如音箱、汽車等範圍更廣的物體)一定的視聽感知和思考能力。例如,蘋果Siri和亞馬遜Echo智慧音箱可以幫助我們透過語音控制的方式設定鬧鐘、播放音樂、回覆訊息、詢問天氣,還可以聊天;滴滴出行和Uber應用也是在人工智慧技術的驅動下幫助司機選擇最佳路線。
除了日常生活外,人工智慧在工業、金融、安防、醫療、司法等領域也發揮了強大的作用。工業機器人代替人類完成銲接、鑄造、裝配、包裝、搬運、分發貨物等單調、重複、繁重的工作;在金融領域,人工智慧技術可以幫助金融機構提供投資組合建議,創建高精度的風險控制模型,實現精準行銷等金融活動;對於安防行業,以圖像辨識、人臉辨識為代表的人工智慧技術對攝影鏡頭獲取的大量影片資訊進行解析,已被廣泛應用於門禁系統、車輛檢測、追蹤嫌犯等場景中,對增強安防水準、維護社會穩定、提高刑偵效率等都有重大意義;在醫療領域,IBM的人工智慧系統Watson(華生)已被多家醫療機構採用,它可以幫助醫生更快、更準確的診斷疾病,還能提出對醫療方案的療效及風險的評估,這將有效的彌補有些地區醫療資源不足的缺陷;美國人工智慧律師Rose Intelligence可以理解律師向它提出的問題,收集已有的法律條文、參考文獻和法律案件等資料,進行推論,給出基於證據的高度相關性答案,這樣的系統可以減少法律服務成本,使更多的人能夠獲得法律幫助。
1.1.1 熱門的AI
人工智慧發展到2018年剛好是62年。這62年的發展實際上經歷了三個階段:第一個階段,1956年到1976年,注重邏輯推理。第二個階段,從1976到2006年,以專家系統為主。2006年起進入重視資料、自主學習的認知智慧時代。這是第三個階段,它會持續多長時間,沒有人知道。
最近幾年,在演算法、大數據、運算力等技術的推動下,人工智慧開始真正解決問題,在各行業的應用場景逐漸明朗,並帶來實際商業價值。目前,無論在學術界、投資界,還是在職場,AI異常火熱。根據史丹佛大學2017年12月發表的AI報告,AI論文發表數量激增:自從1996年以來,每年發表的AI論文數量增加了9倍以上。史丹佛大學入學選修人工智慧和機器學習入門課程的學生人數從1996年以來成長了11倍以上。在美國,有資本投資的AI創業公司數量從2000年以來增加了14倍,在美國,投資AI創業的基金數量也在成長,從2000年以來,每年投入AI創業的資本額增加了6倍。美國最近幾年中,每年都有幾十億美元的風險資本(VC)進入AI領域,人工智慧相關職位的需求也在急遽成長。Indeed.com平臺上,從2013年1月份起,AI技術相關工作職位的比例的成長。
在開源軟體使用和生態上,AI軟體也是異常熱門的。AI各個軟體包在GitHub上加星標的次數。排在第一的TensorFlow是排在第二的scikit-learn的4倍左右。
1.1.2 AI的驅動因素
某著名管理顧問公司預計,到2025年,全球AI市場規模將達到3萬億美元。AI持續熱門的驅動力主要來自於技術本身的提高,包括資料、演算法、運算力、大數據和物聯網等技術,而這些正是人工智慧技術發展的基礎。
高品質和大規模的大量資料使得AI成為可能
大量資料為AI技術的發展提供了充足的原料。在資料生成量方面,預計到2020年,將達到44ZB。資料量與醫療圖像準確性的關係,顯示了訓練資料量越大,準確性越高。
運算力提升突破瓶頸
以GPU為代表的新一代運算晶片提供了更強大的運算力,使得運算更快。同時,在集群上實現的分散式運算幫助AI模型可以在更大的資料集上快速運行。
機器學習演算法獲得重大突破
以多層神經網路模型為基礎的演算法,使得機器學習演算法在圖像辨識等領域的準確性獲得了飛躍性的提高。
物聯網和大數據技術為AI技術的發展提供了關鍵要素
物聯網為AI的感知層提供了基礎設施環境,同時帶來了全面的大量訓練資料。大數據技術為大量資料在儲存、清洗、整合方面提供了技術保障,幫助提升了深度學習演算法的性能。
1.2 AI技術的成熟度
顧名思義,AI就是能夠讓機器做一些之前只有「人」才做得好的事情。主要集中在這幾個領域:視覺辨識(看)、自然語言理解(聽)、機器人(動)、機器學習(自我學習能力)等。在技術層面,AI分為感知、認知、執行三個層次。感知技術包括機器視覺、語音辨識等各類應用人工智慧技術獲取外部資訊的技術,認知技術包括機器學習技術,執行技術包括人工智慧與機器人結合的硬體技術以及智慧晶片的運算技術。這些領域目前還比較散,它們正在交叉發展,走向統一的過程中。
很自然的,我們會在同一個任務上將AI系統和人類的表現進行比較。在某些任務中,電腦比人類要優秀得多,例如,1970年代的小運算機就可以比人類更好的完成算術運算。但是,AI系統在處理諸如回答問題、醫學診斷等更通用的任務時更加困難。AI系統的任務往往是在非常窄的背景下進行的,這樣能在特定的問題或應用上獲得進展。雖然機器在特定的任務上表現出卓越的性能,但是有時任務稍微有所改動,系統性能就會大大降低。
第1章 人工智慧概述
機器人是人類的古老夢想。希臘神話中已經出現了機械人,至今機器人仍然是眾多科幻小說的重要元素。實現這個夢想的第一步是了解如何將人類的思考過程形式化和機械化。科學家們被這一夢想深深吸引,開始研究記憶、學習和推理。1930年代末到1950年代初,神經學研究發現大腦是由神經元組成的電子網路,克勞德·夏農(Claude Shannon)提出的資訊論則描述了數位訊號,圖靈(Turing)的運算理論證明了一臺僅能處理0和1這樣簡單二元符號的機械設備能夠模擬任意數學推理。這些密切相關的成果暗示了建構電子大腦的可能性。...
推薦序
前言
2017年是人工智慧(Artificial Intelligence,AI)年,人工智慧技術越來越多的應用到日常生活的各個方面。AlphaGo ZERO替代AlphaGo實現自我學習,百度無人汽車上路,iPhone X開啟Face ID,阿里和小米先後發表智慧音箱,中國肯德基上線人臉支付……這些背後都是人工智慧技術的驅動。2017年7月,中國發表了新一代人工智慧發展規畫,將中國人工智慧產業的發展推向了新高度。
人工智慧技術是繼蒸汽機、電力、網路科技之後最有可能帶來新一次產業革命浪潮的技術,在爆炸式的資料累積、基於神經網路模型的新型演算法與更加強大、成本更低的運算力的促進下,本次人工智慧的發展受到風險投資的熱烈追捧而處於高速發展時期,人工智慧技術的應用場景也在各個行業逐漸明朗,開始帶來實際商業價值。在金融行業,人工智慧可以在風險控制、資產配置、智慧投顧等方向進行應用,預計將帶來約6,000億人民幣的降本增益效益。在汽車行業,人工智慧在自動駕駛上的技術突破,將帶來約5,000億人民幣的價值增益。在醫療行業,透過人工智慧技術,在藥物研發領域可以提高成功率,在醫療服務機構可以提供疾病診斷輔助、疾病監護輔助,預計可以帶來約4,000億人民幣的降本價值。在零售行業,人工智慧在推薦系統上的運用將提高線上銷售的銷量,同時能夠對市場進行精準預測,降低庫存,預計將帶來約4,200億人民幣的降本增益效益。
人工智慧是一個非常廣泛的領域。人工智慧技術涵蓋很多大的學科,包括電腦視覺(模式辨識、圖像處理)、自然語言理解與交流(語音辨識)、認知科學、機器人學(機械、控制、設計、運動規畫、任務規畫等)、機器學習(各種統計的建模、分析和運算的方法)。人工智慧產業鏈條涵蓋了基礎層、技術層、應用層等多個方面,其輻射範圍之大,單一公司無法包攬人工智慧產業的每個環節,深耕細分領域和合作整合多個產業間資源的形式成為人工智慧領域主要的發展路徑。
本書從人工智慧的定義入手,前兩章闡述了人工智慧熱門的成因、發展歷程、產業鏈、技術和應用場景,從第3章開始詳細闡述人工智慧的幾個核心技術(大數據、機器學習、深度學習)和最流行的開源平臺(TensorFlow)。透過本書,讀者既能了解人工智慧的各個方面(廣度),又能深度學習人工智慧的重點技術和平臺工具,最終能夠將人工智慧技術應用到實際工作場景中,共同創建一個智慧的時代。
前言
2017年是人工智慧(Artificial Intelligence,AI)年,人工智慧技術越來越多的應用到日常生活的各個方面。AlphaGo ZERO替代AlphaGo實現自我學習,百度無人汽車上路,iPhone X開啟Face ID,阿里和小米先後發表智慧音箱,中國肯德基上線人臉支付……這些背後都是人工智慧技術的驅動。2017年7月,中國發表了新一代人工智慧發展規畫,將中國人工智慧產業的發展推向了新高度。
人工智慧技術是繼蒸汽機、電力、網路科技之後最有可能帶來新一次產業革命浪潮的技術,在爆炸式的資料累積、基於神經網路模型的新型演算法與更加強大、...
目錄
前言
第1章 人工智慧概述
1.1 AI是什麼
1.2 AI技術的成熟度
1.3 美國AI龍頭分析
1.4 中國AI現狀
1.5 AI與雲端運算和大數據的關係
1.6 AI技術路線
1.7 AI國家策略
1.8 AI的歷史發展
第2章 AI產業
2.1 基礎層
2.2 技術層
2.3 應用層
2.4 AI產業發展趨勢分析
第3章 資料
3.1 什麼是大數據
3.2 中國國內大數據現狀
3.3 大數據的運算模式
3.4 大數據技術
3.5 資料平臺
3.6 大數據的商用途徑
3.7 大數據產業
3.8 政府大數據案例分析
第4章 機器學習概述
4.1 走進機器學習
4.2 機器學習的基本概念
4.3 資料預處理
第5章 模型
5.1 什麼是模型
5.2 誤差和MSE
5.3 模型的訓練
5.4 梯度下降法
5.5 模型的擬合效果
5.6 模型的評估與改進
5.7 機器學習的實現框架
第6章 機器學習演算法
6.1 演算法概述
6.2 支援向量機演算法
6.3 邏輯迴歸演算法
6.4 KNN演算法
6.5 決策樹演算法
6.6 整合演算法
6.7 聚類演算法
6.8 機器學習演算法總結
第7章 深度學習
7.1 走進深度學習
7.2 神經網路的訓練
7.3 神經網路的最佳化和改進
7.4 卷積神經網路
7.5 深度學習的優勢
7.6 深度學習的實現框架
前言
第1章 人工智慧概述
1.1 AI是什麼
1.2 AI技術的成熟度
1.3 美國AI龍頭分析
1.4 中國AI現狀
1.5 AI與雲端運算和大數據的關係
1.6 AI技術路線
1.7 AI國家策略
1.8 AI的歷史發展
第2章 AI產業
2.1 基礎層
2.2 技術層
2.3 應用層
2.4 AI產業發展趨勢分析
第3章 資料
3.1 什麼是大數據
3.2 中國國內大數據現狀
3.3 大數據的運算模式
3.4 大數據技術
3.5 資料平臺
3.6 大數據的商用途徑
3.7 大數據產業
3....