序
2022年是個難過的一年,才剛有國家宣布新冠疫情結束,歐洲就緊接著爆發戰爭。在這動盪的世界,以數學為首的邏輯思維的重要性與日俱增。而邏輯的論據則是數據。不只是大數據,新聞報紙上的內容也必須留意真偽,檢查有無謬誤,仔細思量後再下判斷,否則便有可能做出違逆趨勢變化的決定。尤其是科學思維,不論對蔬果店還是瑜伽老師都很重要。
AI浪潮已打著數位轉型之名生根落地。但另一方面,根據我在第一線的觀察,目前仍有99%的工作沒有引進AI。而範圍擴大到全球,恐怕仍有99.99%的市場還未開拓。我認為就連馬達加斯加的漁夫,也應該引進資料科學。
在大多數的職場,人們仍習慣把資料印出來丟著、進行無用的問卷調查、只使用沒有按ID分類的統計資料。雖然擁有足以稱為大數據的資料量,POS收銀機和總公司的會計仍完全分開,並在系統公司的政治鬥爭下難以無縫整合。
儘管日本數位廳正努力改善現狀,但要做的工作仍堆積如山。在戰爭影響下,網路安全AI和防範犯罪與恐攻的AI等新興領域也隨之出現。AI的工作永無止境。
本書是一本專為有意學習AI者而寫的通識性入門書。在第1、2章,我們將介紹AI的概要,解答「AI是什麼?」這個根本性問題,屬於基礎知識篇。
在第3章,我們會介紹自然語言處理,網羅從基礎的向量空間上的語言圖譜,到最新的Transformer等大型架構。在第4章則會介紹「GAN=生成對抗網路」。GAN源於圖像生成領域,近年也被用於生成音樂和文章(GPT),在最尖端的領域也屬於當紅技術。本章還將介紹包含實驗性質的社會應用在內的各種案例。
第5章將介紹近年發展最快速的圖像辨識領域。這領域的發展引爆點是第三波AI浪潮,在一開始就有很高辨識精度,以自動駕駛為首,許多充滿夢想的社會應用點子都已起步,存在各種不同的架構,發展出五花八門的產品。在第6章,我們將介紹資料科學中非常重要,而且在實務上經常出現的列表資料。諮詢業務和一般企業擁有的資料中最多的就是這種資料。本章將介紹最通用且可應用在眾多場景的知識技巧。
即使完全跨越新冠病毒和歐洲戰事,人類也還有氣候變遷、貧富差距、不治之症、幫助弱勢群體等許多未解的難題要面對。當然,其中有些問題更適合從社會學或哲學脈絡來解決。但是,如果輔以邏輯學和資料科學的話,無疑將有更好的證據支持,更容易成功。
大家因為興趣而做的拉麵店圖像分析和Netflix的節目評價分析等,也跟上述的項目同樣有意義。沒有什麼比找出自己的主題,並努力分析它們更有樂趣了。如果本書能成為你投入研究的契機,那就再好不過了。
得益於技術評論社的宮崎主哉先生,以及共筆的高橋海渡先生、立川裕之先生、小西功記先生、小林寬子小姐幾位出色成員幫助,本書才得以問世。誠心感謝他們。另外,我想在此一併向內人留衣和執筆期間誕生的小女晴表達感謝。
2022年11月 祈願烏克蘭與世界和平的杉並區民
合著者代表 石井大輔