自己開發ChatGPT - LLM從頭開始動手實作-FindBook 找書網 ISBN:9786267569016

圖書名稱：自己開發ChatGPT - LLM從頭開始動手實作

☆大型語言模型的白話文介紹
☆大型語言模型技術有什麼？
☆預訓練資料的建立(語料庫)
☆大型語言模型從頭來 – 預訓練
☆挖掘大型語言模型潛能：有監督微調
☆大型語言模型強化學習對齊
☆大型語言模型的評測標準
☆大型語言模型的重要應用
☆動手做大型語言模型
☆自己訓練一個7B的大型語言模型

本書涵蓋大型語言模型的全貌，從基礎概念到實際應用。第一章介紹大型語言模型的基本概念。第二章深入解析其基礎技術，包括自然語言資料表示、Transformer架構以及BERT和GPT等預訓練模型，並以InstructGPT和LLaMA系列為例展示實用成果。第三章探討預訓練資料的類別、來源和處理方式。第四章詳細介紹大型語言模型的預訓練過程，包括不同架構和訓練策略。第五章解釋有監督微調的定義、用途和應用場景，以及微調資料建構和技巧。第六章介紹強化學習的基礎知識及在大型語言模型中的應用，特別是基於人類回饋的強化學習（RLHF），並展望其未來發展。第七章介紹大型語言模型的評測方法，包括微調後的對話能力和安全性評測，並探討通用人工智慧的評價。第八章展示提示詞技術在引導大型語言模型方面的應用，介紹搜索增強生成技術和推理協作技術，使模型能逐步分解並解決問題。第九章探討從訓練到任務完成的專案最佳化技術和實作案例，以提高模型的效率和可擴充性。第十章提供微調大型語言模型的關鍵步驟和程式範例，便於實際應用。

作者簡介：

楊青
度小滿技術委員會執行主席、數據智能應用部總經理，碩士畢業於清華大學計算機系，曾就職於百度、阿里巴巴，從事自然語言處理、搜索、推薦、大數據架構等相關方向的研發工作。

2018年初加入度小滿，組建數據智能部，從0到1建設度小滿的智能引擎核心算法，深耕計算機視覺、自然語言處理、圖模型、機器學習、因果推斷等技術領域，多篇文章被EMNLP、ACL、CIKM等國際頂會收錄，「智能化徵信解讀中台」工程榮獲吳文俊人工智能科技進步獎。相關技術廣泛應用於度小滿營銷、經營、風控、反欺詐全流程業務場景，為上千萬客戶提供穩定、安全的金融服務。

目前，專注於AIGC相關研究及產品落地工作，基於度小滿模型即服務（MaaS）的模式積極探索文生圖、數字人與生成式大模型的應用轉化。已於2023年年初帶領團隊發布中國首個千億中文大模型「軒轅」，2023年9月，「軒轅-70B」大模型在C-Eval和CMMLU兩大權威榜單上位列所有開源模型榜首。

作者序

前言
緣起：為什麼要寫這本書
OpenAI 的ChatGPT 自推出以來，迅速成為人工智慧領域的焦點。ChatGPT在語言理解、生成、規劃及記憶等多個維度展示了強大的能力。這不僅表現在對特定任務的高效處理上，更重要的是，它在處理多樣化任務和複雜場景中的靈活性顯著，甚至能在一定程度上模擬人類的思考方式。這種能力的展現，標誌著人工智慧從專注於單一任務的傳統模型向通用人工智慧轉變，其強大的能力將對千行百業產生深遠影響，尤其在最佳化業務流程和重塑組織結構方面。
然而，在研究和實作過程中，我們遇到了一個主要挑戰：市場上缺乏大型...

顯示全部內容

第1 章解鎖大型語言模型
1.1 什麼是大型語言模型
1.2 語言模型的發展
1.3 GPT 系列模型的發展
1.4 大型語言模型的關鍵技術
1.5 大型語言模型的湧現能力
1.6 大型語言模型的推理能力
1.7 大型語言模型的縮放定律
參考文獻

第2 章大型語言模型基礎技術
2.1 語言表示介紹
2.1.1 詞表示技術
2.1.2 分詞技術
2.2 經典結構Transformer
2.2.1 輸入模組
2.2.2 多頭自注意力模組
2.2.3 殘差連接與層歸一化
2.2.4 前饋神經網路
2.2.5 解碼器
2.3 預訓練語言模型
2.3.1 Decoder 的代表：GPT 系列
2.3.2 Encoder 的代表：BER...

顯示全部內容