作者-盧菁 -FindBook 找書網

內容簡介

本書深入剖析DeepSeek的核心技術，介紹了提示詞的原理與高級應用，對DeepSeek的模型架構、訓練框架，以及MoE優化、MLA、思維鏈、GRPO算法、獎勵模型等技術細節進行了探討。

此外，本書對DeepSeek給人工智能行業格局帶來的影響及DeepSeek的開源貢獻進行了分析，對大模型的發展趨勢進行了展望。

本書適合人工智能研究人員、開發人員及大模型相關技術愛好者閱讀，也為關注人工智能領域技術發展的從業人員提供了參考與借鑒。

作者介紹

盧菁，北京科技大學博士，北京大學博士後流動站出站。工作於騰訊、愛奇藝等知名互聯網公司，主要從事人工智能技術的應用和研發工作。主要研究方向為機器學習、自然語言處理、知識圖譜、推薦系統等，有豐富的理論和實踐經驗。

戴志仕，資深AI架構師，“寒武紀人工智能”公眾號的創立者。2024年CCF國際AIOps挑戰賽優秀獎獲得者。擁有十餘年人工智能算法研究和產業落地經驗，成功實施過多個人工智能項目。

第1章技驚四座的DeepSeek
1.1 石破天驚的產品發佈
1.2 DeepSeek-V3和DeepSeek-R1可以做什麼
1.3 DeepSeek-V3的技術突破與創新
1.3.1 架構創新
1.3.2 訓練優化
1.3.3 推理與部署優化
1.3.4 效果的全面提升
1.4 DeepSeek-R系列的技術突破與創新
1.4.1 DeepSeek-R1-Zero的技術突破與創新
1.4.2 DeepSeek-R1的技術突破與創新
1.4.3 推理能力的提升
1.5 DeepSeek發佈的模型家族
1.5.1 通用語言大模型
1.5.2 多模態大模型
1.5.3 代碼大模型
1.5.4 數學推理大模型
1.5.5 混合專家模型
1.5.6 MoE專用微調模型
1.5.7 基於LLaMA架構的模型

第2章提示詞的原理與應用
2.1 推理模型與通用模型
2.2 提示工程
2.2.1 提示詞的類型
2.2.2 提示詞的基本元素
2.2.3 有效的提示詞
2.2.4 正確地表達需求
2.3 提示詞高級技巧：提示詞鏈
2.3.1 提示詞鏈的設計過程
2.3.2 提示詞鏈的應用案例

第3章 DeepSeek-V3技術剖析
3.1 DeepSeek的模型架構
3.1.1 MoE的起源與發展
3.1.2 DeepSeek-V3的MoE優化
3.1.3 DeepSeek-V3的MoE架構的優勢
3.1.4 DeepSeek-V3的MLA
3.1.5 DeepSeek-V3的MTP
3.2 DeepSeek的訓練框架
3.2.1 常見的並行策略
3.2.2 DeepSeek的並行策略
3.2.3 DeepSeek的FP8混合精度訓練
3.3 DeepSeek的推理階段優化
3.3.1 PD分離架構
3.3.2 DeepSeek的預填充階段優化
3.3.3 DeepSeek的解碼階段優化
3.4 DeepSeek的後訓練優化
3.5 小結

第4章 DeepSeek-R1技術剖析
4.1 預備知識
4.1.1 思維鏈
4.1.2 有監督微調
4.1.3 強化學習
4.2 DeepSeek對訓練推理模型的探索
4.3 DeepSeek-R1-Zero的訓練
4.3.1 GRPO算法
4.3.2 獎勵模型
4.4 DeepSeek-R1的訓練
4.4.1 階段一訓練
4.4.2 階段二訓練
4.4.3 推理能力的蒸餾
4.5 小結

第5章 DeepSeek的影響與成功啟示
5.1 DeepSeek對AI格局的影響
5.1.1 打破硬件依賴的迷思
5.1.2 對英偉達CUDA護城河的衝擊
5.1.3 對大模型技術路線的重新思考
5.1.4 投資風向的改變
5.1.5 對商業模式的衝擊
5.1.6 對創新文化的衝擊
5.1.7 對地緣政治的衝擊
5.2 DeepSeek的成功啟示
5.2.1 領導者的技術直覺
5.2.2 長期主義
5.2.3 極致的工程優化
5.2.4 對資源的高效利用
5.2.5 團隊的創新文化

第6章 DeepSeek開源技術剖析
6.1 DeepSeek的“開源周”
6.2 FlashMLA：減少顯存消耗
6.2.1 項目特點
6.2.2 應用場景
6.2.3 技術剖析
6.2.4 影響與展望
6.3 DeepEP：通信系統的優化
6.3.1 項目特點
6.3.2 應用場景
6.3.3 技術剖析
6.3.4 影響與展望
6.4 DeepGEMM：讓矩陣乘法起飛
6.4.1 項目特點
6.4.2 應用場景
6.4.3 技術剖析
6.4.4 影響與展望
6.5 DualPipe與EPLB：集群並行計算優化
6.5.1 項目特點
6.5.2 技術剖析
6.5.3 影響與展望
6.63 FS：為AI加速
6.6.1 項目特點
6.6.2 應用場景
6.6.3 技術剖析
6.6.4 影響與展望

第7章大模型未來發展展望
7.1 MoE的未來
7.1.1 專家數量與規模的優化
7.1.2 MoE分布式訓練工具進一步完善
7.1.3 門控算法的改進
7.1.4 跨領域應用與融合
7.2 MLA的未來
7.3 大模型訓練方法的發展趨勢
7.3.1 三階段訓練法的普及
7.3.2 混合精度訓練的推廣
7.3.3 並行策略的優化
7.4 推理部署的發展趨勢
7.4.1 PD分離模式的普及
7.4.2 集群化推理的優化與推理加速技術研究
7.5 GPU硬件的未來發展
7.5.1 軟硬件協同升級
7.5.2 存儲與通信能力的優化
7.5.3 低精度計算的支持
7.5.4 異構計算的支持
7.6 從LLaMA4看推理模型的發展
7.6.1 LLaMA4簡介
7.6.2 LLaMA4的核心技術細節

看更多

詳細資料

ISBN：9787121501241
規格：平裝 / 154頁 / 19 x 26 x 1 cm / 普通級 / 1-1
出版地：中國

盧菁

內容簡介

作者介紹

目錄

詳細資料