人工智能(AI),尤其是生成式語言模型和生成式人工智能(AIGC)模型,正以驚人的速度改變着我們的世界。駕馭這股潮流的關鍵,莫過於探究自然語言處理(NLP)技術的深奧秘境。本書將帶領讀者踏上一段扣人心弦的探索之旅,讓其親身感受,並動手搭建語言模型。本書主要內容包括N-Gram,詞袋模型(BoW),Word2Vec(W2V),神經概率語言模型(NPLM),循環神經網絡(RNN),Seq2Seq(S2S),注意力機制,Transformer,從初代GPT到ChatGPT再到GPT-4等一系列突破性技術的誕生與演進。
本書將以生動活潑的筆觸,將枯燥的技術細節化作輕鬆幽默的故事和繽紛多彩的圖畫,引領讀者穿梭于不同技術的時空,見證自然語言處理技術的傳承、演進與蛻變。在這場不斷攀登技術新峰的奇妙之旅中,讀者不僅能深入理解自然語言處理技術的核心原理,還能自己動手,從零開始搭建起一個又一個語言模型。
無論你是在校學生還是人工智能從業者,這本書都將成為一盞明燈,照亮你探索人工智能無限奧秘的道路。
黃佳,筆名咖哥,新加坡科技研究局人工智能研究員。主攻方向為NLP大模型的研發與應用、持續學習、AI in FinTech。黃佳深耕人工智能領域多年,積累了豐富的科研項目和政府、銀行、能源、醫療等領域AI項目落地實戰經驗,目前正與PlatoX.AI展開富有前景的技術合作。曾著有《零基礎學機器學習》《數據分析咖哥十話》等多部熱銷書。同時,在極客時間開設專欄《零基礎實戰機器學習》《LangChain實戰課》,在深藍學院開設視頻課程“生成式預訓練語言模型:理論與實戰”。