購物比價找書網找車網
FindBook  
 有 1 項符合

多模態大模型:技術原理與實戰

的圖書
多模態大模型:技術原理與實戰 多模態大模型:技術原理與實戰

作者:彭勇 
出版社:電子工業出版社
出版日期:2023-11-01
語言:簡體中文   規格:平裝 / 287頁 / 19 x 26 x 1.44 cm / 普通級/ 1-3
圖書選購
型式價格供應商所屬目錄
 
$ 600
博客來 博客來
概論/哲學
圖書介紹 - 資料來源:博客來   評分:
圖書名稱:多模態大模型:技術原理與實戰

內容簡介

詳細介紹了大語言模型和多模態大模型的發展歷史、技術原理和亮點、主要的開源框架、配套工具、部署細則和實戰案例。為了讓讀者更好地進行大模型的應用實戰,本書還詳細介紹了使用大模型為商業賦能的3個應用案例。期望本書能夠説明讀者打開通往大模型尤其是多模態大模型的學習、實戰和商業成功之路。

《多模態大模型:技術原理與實戰》適用於從事人工智慧工作的專業技術人員,比如演算法工程師、研發工程師等,也適用於對多模態大模型感興趣的各類從業者,比如產品經理、專案經理和各級管理人員等。
 

作者介紹

彭勇
國家公派留法博士,全球金融專業人士協會(GIFP協會)特聘專家,2020年歐耕互聯網保險十大風雲人物,《資料中台建設:從方法論到落地實戰》作者。從事大資料和人工智慧在金融行業的研究與應用工作約18年,負責相關的落地項目超過100個,在金融行業資料中台建設、數位化行銷和運營體系建設、大資料和人工智慧賦能、大模型研發和應用、風險管理、數智化轉型等方面經驗豐富。現就職于蘇州數擎智技術有限公司和北京長正諮詢有限公司,擔任兩個公司的總經理。

彭旋
本科和碩士畢業于中國石油大學(華東)數學與應用數學專業,從事多模態大模型、知識圖譜、資訊抽取、自然語言處理等方面的研發工作,具備豐富的多模態大模型訓練、研發和企業落地經驗。《知識圖譜與大模型融合實踐研究報告》《知識圖譜互聯互通白皮書》的主要作者之一。

鄭志軍
NLP專家,研究領域主要包括文本理解、自然語言生成等,申請7項專利。從事自然語言處理研究7年有餘,有近4年大模型使用、研發經驗。現擔任公司AIGC組組長,研發的大模型在公共評測和客戶應用上均取得了優異的成績,在大模型研發領域具有豐富的理論和實踐經驗。

茹炳晟
騰訊Tech Lead,騰訊研究院特約研究員,中國電腦學會(CCF)TF研發效能SIG主席,“軟體研發效能度量規範”標準核心編寫專家,中國商業聯合會互聯網應用工作委員會智庫入庫專家,中國通信標準化協會TC608雲計算標準和開源推進委員會雲上軟體工程工作組副組長,騰訊雲、阿裡雲、華為雲最具價值專家,國內外很多技術峰會的聯席主席、出品人和演講嘉賓。公眾號“茹炳晟聊軟體研發”主理人。多本技術暢銷書作者,著作有《軟體研發行業創新實戰案例解析》《測試工程師全棧技術進階與實踐》《軟體研發效能提升之美》《高效自動化測試平臺:設計與開發實戰》《軟體研發效能提升實踐》《軟體研發效能權威指南》,譯作有《持續架構實踐:敏捷和DevOps時代下的軟體架構》和《現代軟體工程:如何高效構建軟體》等。
 

目錄

第1章 OpenAI一鳴驚人帶來的啟示 1
1.1 OpenAI的成長並非一帆風順 2
1.2 OpenAI成功的因素 5
1.3 OpenAI特殊的股權設計帶來的啟示 7
1.4 思考 11

第2章 自然語言處理的發展歷程 13
2.1 自然語言處理的里程牌 14
2.1.1 背景介紹 14
2.1.2 自然語言處理發展的7個階段 15
2.2 從BERT模型到ChatGPT 30
2.3 BERT模型到底解決了哪些問題 31
2.4 BERT模型誕生之後行業持續摸索 38
2.5 ChatGPT的誕生 41
2.5.1 InstructGPT模型的構建流程 42
2.5.2 ChatGPT和InstructGPT的差異 44
2.5.3 ChatGPT和BERT大模型在公開資料集上的測試 45
2.5.4 高品質的資料標注 46
2.6 思考 48

第3章 讀懂ChatGPT的核心技術 50
3.1 基於Transformer的預訓練語言模型 50
3.2 提示學習與指令微調 55
3.3 基於人工回饋的強化學習 59
3.4 思維鏈方法 61
3.5 集成學習 64
3.6 思考 67

第4章 看清GPT的進化史和創新點 68
4.1 GPT技術的發展歷程 68
4.1.1 GPT-1技術的發展歷程 68
4.1.2 GPT-2技術的發展歷程 72
4.1.3 GPT-3技術的發展歷程 73
4.2 GPT的創新點總結 75
4.3 思考 77

第5章 大模型+多模態產生的“化學反應” 78
5.1 多模態模型的發展歷史 78
5.2 單模態學習、多模態學習和跨模態學習的區別 82
5.3 多模態大模型發展的重大里程碑 85
5.4 大模型+多模態的3種實現方法 94
5.5 多模態大模型的效果評估 99
5.6 思考 103

第6章 多模態大模型的核心技術 104
6.1 文本多模態技術 105
6.1.1 基於範本的圖像描述方法 106
6.1.2 基於檢索的圖像描述方法 106
6.1.3 基於深度學習的圖像描述方法 106
6.2 圖像多模態技術 107
6.2.1 基於GAN的文本生成圖像方法 108
6.2.2 基於VAE的文本生成圖像方法 110
6.2.3 基於擴散模型的文本生成圖像方法 111
6.3 語音多模態技術 112
6.3.1 基於非深度學習的文本生成語音技術 112
6.3.2 基於深度學習的文本生成語音技術 114
6.4 視頻多模態技術 117
6.4.1 基於非擴散模型的文本生成視頻技術 118
6.4.2 基於擴散模型的文本生成視頻技術 119
6.5 跨模態多重組合技術 120
6.6 多模態大模型高效的訓練方法 121
6.7 GPT-4多模態大模型核心技術介紹 123
6.8 多模態技術的發展趨勢 124

第7章 國內外多模態大模型對比 125
7.1 國內多模態大模型介紹 126
7.1.1 LLaMA-Adapter V2 126
7.1.2 VisualGLM-6B 129
7.1.3 mPLUG-Owl 130
7.2 國外多模態大模型介紹 132
7.2.1 Visual ChatGPT 132
7.2.2 InstructBLIP 133
7.2.3 MiniGPT-4 135
7.3 多模態大模型評測資料集 136
7.3.1 國內評測資料集 137
7.3.2 國外評測資料集 137
7.4 多模態大模型的評測標準 138
7.4.1 國內評測標準 138
7.4.2 國外評測標準 139
7.5 多模態大模型對比 140
7.5.1 感知能力評測 140
7.5.2 認知能力評測 144
7.6 思考 145

第8章 中小公司的大模型構建之路 147
8.1 微調技術介紹 148
8.1.1 LoRA技術 149
8.1.2 AdaLoRA技術 150
8.1.3 QLoRA技術 150
8.1.4 微調加DeepSpeed的ZeRO-3 151
8.2 模型壓縮技術介紹 152
8.2.1 剪枝 152
8.2.2 知識蒸餾 154
8.2.3 量化壓縮 155
8.3 微調實戰 156
8.3.1 部分參數微調實戰 157
8.3.2 全參數微調實戰 158
8.4 模型壓縮實戰 160
8.4.1 8位量化壓縮實戰 160
8.4.2 4位量化壓縮實戰 161
8.5 思考 163

第9章 從0到1部署多模態大模型 164
9.1 部署環境準備 164
9.2 部署流程 166
9.3 使用Flask框架進行API開發 168
9.4 使用Gradio框架進行Web頁面開發 172
9.5 其他部署方法介紹 177
9.6 部署過程中常見的問題總結 180

第10章 多模態大模型的主要應用場景 184
10.1 多模態大模型的應用圖譜 184
10.1.1 多模態大模型的30個基礎應用 184
10.1.2 多模態大模型在六大領域中的應用 190
10.2 多模態大模型在金融領域中的應用 194
10.2.1 語音質檢 195
10.2.2 智慧顧問 197
10.3 多模態大模型在出行與物流領域中的應用 202
10.4 多模態大模型在電商領域中的應用 204
10.4.1 智能客服 204
10.4.2 智能試穿 206
10.5 多模態大模型在工業設計與生產領域中的應用 208
10.6 多模態大模型在醫療健康領域中的應用 211
10.7 多模態大模型在教育培訓領域的應用 216
10.8 思考 217

第11章 用多模態大模型打造AI助理實戰 219
11.1 應用背景 219
11.2 方法論介紹 220
11.2.1 思維鏈解決複雜的推理問題 220
11.2.2 思維樹進一步提升推理能力 221
11.2.3 採用插值法解決長文本輸入問題 221
11.3 工具和演算法框架介紹 223
11.3.1 使用的工具 223
11.3.2 使用的演算法框架 223
11.4 優化邏輯介紹 225
11.4.1 如何提高多輪對話能力 226
11.4.2 如何提高角色扮演能力 226
11.4.3 如何提高長文本閱讀能力 227
11.5 多模態大模型的部署 228
11.6 多模態大模型的性能評估 229
11.6.1 綜合性能評估 229
11.6.2 長文本閱讀示例 230
11.6.3 多輪對話示例 231
11.6.4 角色扮演示例 234
11.6.5 LangChain框架賦能Ziya在限定域內問答示例 235
11.7 思考 236

第12章 多模態大模型在情緒識別領域的應用 237
12.1 應用背景和待解決的問題 237
12.2 方法論介紹 239
12.3 工具和演算法框架介紹 244
12.3.1 演算法的輸入和輸出 244
12.3.2 演算法框架的整體構建流程 245
12.3.3 文本預訓練任務 246
12.3.4 圖像預訓練任務 248
12.3.5 多模態預訓練任務 249
12.3.6 演算法的求解 250
12.3.7 演算法的應用 251
12.4 優化邏輯介紹 252
12.5 部署流程 254
12.6 效果評測 255
12.6.1 評測資料集 255
12.6.2 評測指標 258
12.6.3 評測結果 258
12.7 思考 260

第13章 大模型在軟體研發領域的實戰案例與前沿探索 262
13.1 LLM在軟體研發過程中的單點提效 263
13.1.1 基於GitHub Copilot的代碼片段智慧生成 263
13.1.2 基於GitHub Copilot X實現增強的代碼片段智慧生成 267
13.1.3 基於GitHub Copilot X實現對選中的代碼的理解與解讀 269
13.1.4 基於GitHub Copilot X的Pull Requests提效 270
13.1.5 基於LLM實現的“代碼刷” 271
13.1.6 使用Copilot Voice實現語音驅動的代碼開發 273
13.1.7 使用Copilot CLI實現命令列的自動生成 275
13.1.8 使用TestPilot實現單元測試用例的自動生成 276
13.1.9 更多的應用 278
13.2 代碼大語言模型為軟體研發帶來的機遇與挑戰 278
13.2.1 對於軟體研發來說,什麼變了 279
13.2.2 對於軟體研發來說,什麼沒有變 279
13.3 在LLM時代,對軟體研發的更多思考 284
13.3.1 思考1:替代的是“碼農”,共生的是工程師 284
13.3.2 思考2:有利於控制研發團隊規模,保持小團隊的效率優勢 285
13.3.3 思考3:不可避免的“暗知識” 285
13.3.4 思考4:Prompt即代碼,代碼不再是代碼 286
13.3.5 思考5:Prompt to Executable軟體研發範式的可能性 287
13.4 思考 287
 

詳細資料

  • ISBN:9787121465628
  • 規格:平裝 / 287頁 / 19 x 26 x 1.44 cm / 普通級 / 1-3
  • 出版地:中國
贊助商廣告
 
 
Taaze 讀冊生活 - 暢銷排行榜
當爸媽過了65歲:你一定要知道的醫療、長照、財務、法律知識【全新增修版】
作者:康哲偉
出版社:先覺出版
出版日期:2024-11-01
$ 300 
博客來 - 暢銷排行榜
蔡康永的情商課2:因為這是你的人生
作者:蔡康永
出版社:如何
出版日期:2019-10-17
$ 276 
Taaze 讀冊生活 - 暢銷排行榜
圖解英文文法的原理【暢銷修訂版】:看圖學文法不用背,一張圖就懂!用老外的思維理解英文!
作者:安正鳳
出版社:語研學院
出版日期:2020-04-09
$ 299 
博客來 - 暢銷排行榜
叛逆玩家 01 博客來獨家作者親簽版
$ 252 
 
金石堂 - 新書排行榜
小說 BLUE LOCK 藍色監獄 決戰前的我們。千切‧玲王‧凜 (首刷限定版)(全)
作者:萌木桃
出版社:東立出版社
出版日期:2024-11-30
$ 219 
Taaze 讀冊生活 - 新書排行榜
【京都三部曲1】千年繁華:京都的街巷人生(壽岳章子X澤田重隆攜手經典作,在台發行22周年金典珍藏)
作者:壽岳章子
出版社:馬可孛羅
出版日期:2024-11-07
$ 280 
博客來 - 新書排行榜
活用技術分析寶典:飆股上校朱家泓40年實戰精華 從K線、均線到交易高手的養成祕笈 (上、下冊)
作者:朱家泓
出版社:金尉
出版日期:2024-11-21
$ 948 
博客來 - 新書排行榜
我不婚,然後呢?:黃越綏給單身世代的人生相談
出版日期:2024-11-11
$ 276 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策