購物比價找書網找車網
FindBook  
 有 1 項符合

自然語言處理基礎與大模型:案例與實踐

的圖書
自然語言處理基礎與大模型:案例與實踐 自然語言處理基礎與大模型:案例與實踐

作者:宗成慶 
出版社:清華大學出版社
出版日期:2024-01-01
語言:簡體中文   規格:平裝 / 291頁 / 19 x 26 x 1.46 cm / 普通級/ 1-1
圖書選購
型式價格供應商所屬目錄
 
$ 512
博客來 博客來
電腦硬體
圖書介紹 - 資料來源:博客來   評分:
圖書名稱:自然語言處理基礎與大模型:案例與實踐

內容簡介

本書在簡要介紹自然語言處理代表性模型和方法的基礎上,通過具體案例詳細展現了相關模型和算法的實現過程,並給出了可執行的程式代碼、數據集和運行結果。全書內容既有經典的統計語言模型,也有神經網路基礎模型和大語言模型前沿技術。應用案例從情感分析、資訊抽取、自動摘要和文本語義匹配,到閱讀理解、意圖理解、文本生成和機器翻譯,全方位地展示自然語言處理從理論到實踐的全貌。

書中提供的所有代碼都已通過調試,並以Jupyter Notebook形式託管在百度AI Studio星河社區上。讀者按照書中的說明就可以直接使用AI Studio提供的免費計算資源線上編譯運行書中的程式代碼,為讀者實踐練習提供了極大的便利。本書可作為高等院校相關專業高年級本科生和研究生學習自然語言處理課程的教學輔導書,也可供對自然語言處理技術感興趣的初學者或者從事相關技術研發的工程技術人員參考。
 

作者介紹

宗成慶,中國科學院自動化所研究員、博士生導師,中國科學大學崗位教授,ACL/ CAAI/ CCF Fellow,主要從事自然語言處理、機器翻譯和語言認知計算等研究,主持國家專案10余項,發表論文200餘篇,出版《統計自然語言處理》、《文本數據挖掘》和Text Data Mining三部專著及兩部譯著。現任國際計算語言學委員會(ICCL)委員,中國中文信息學會副理事長,榮獲國家科技進步獎二等獎和多個省部級及國家一級學會的科技獎勵,獲得北京市優秀教師、中科院優秀導師和國科大李佩教學名師等若干榮譽。

趙陽,中國科學院自動化研究所助理研究員,中國中文資訊學會開源情報技術專業委員會委員,研究方向為自然語言處理與機器翻譯,作為負責人和參與人員,主持和承擔國家自然基金、科技部重點研發計劃和中國科學院先導計劃等多項國家項目。

飛槳教材編寫組,專注數據分析、商業戰略、機器學習和人工智慧等領域,出品過《大數據分析的道與術》《機器學習的思考故事》《零基礎實踐深度學習》和《如何系統化的分析業務和戰略》等系列課程。
 

目錄

第1章 緒論
1.1自然語言處理方法概述
1.2本書的內容組織
1.3本書的實踐平臺
1.3.1本地運行
1.3.2AI Studio星河社區運行
1.3.3本書使用的API
1.3.4本書使用的數據集

第2章 神經網路基礎
2.1概述
2.2神經元與感知機
2.2.1神經元
2.2.2感知機
2.2.3常見的啟動函數
2.3前饋神經網路
2.4卷積神經網路
2.4.1卷積
2.4.2池化
2.4.3卷積神經網路
2.5迴圈神經網路
2.5.1簡單迴圈神經網路
2.5.2長短時記憶網路
2.5.3門控迴圈單元
2.5.4迴圈神經網路拓展知識

第3章 分散式表示
3.1詞的分散式表示
3.1.1靜態詞向量
3.1.2動態詞向量
3.2短語的分散式表示
3.3句子的分散式表示
3.3.1基於迴圈神經網路的表示方法
3.3.2基於預訓練語言模型的表示方法

第4章 序列生成模型
4.1基於迴圈神經網路的Seq2Seq模型
4.1.1基於RNN的Seq2Seq模型原理
4.1.2解碼策略
4.2融合注意力機制的Seq2Seq模型
4.3基於Transformer的Seq2Seq模型
4.3.1自注意力模型
4.3.2Transformer的網路結構
4.3.3Transformer編碼器
4.3.4Transformer解碼器
4.3.5知識延伸: 基於Transformer結構的模型

第5章 基礎語言模型
5.1統計語言模型
5.1.1模型定義
5.1.2數據平滑方法
5.1.3語言模型評價
5.2神經網路語言模型
5.2.1前饋神經網路語言模型
5.2.2迴圈神經網路語言模型
5.2.3語言模型與詞向量

第6章 預訓練大模型
6.1GPT語言模型
6.1.1GPT模型預訓練
6.1.2GPT在下游任務中的應用
6.2BERT語言模型
6.2.1BERT模型的預訓練任務
6.2.2BERT在下游任務中的應用
6.3ERNIE 語言模型
6.4預訓練大模型
6.4.1基礎大模型
6.4.2指令微調
6.4.3基於人類回饋的強化學習

第7章 詞語切分
7.1基於BERT實現中文分詞
7.1.1任務目標
7.1.2實現思路及流程
7.1.3數據處理
7.1.4模型構建
7.1.5訓練配置
7.1.6模型訓練
7.1.7模型評估
7.1.8模型預測
7.2基於BPE演算法實現子詞切分
7.2.1任務目標
7.2.2實現思路及流程
7.2.3構建BPE詞表
7.2.4文本子詞切分
7.2.5語料還原
7.3實驗思考

第8章 文本情感分類方法實踐
8.1基於LSTM模型的情感分類方法
8.1.1任務目標
8.1.2實現思路及流程
8.1.3數據處理
8.1.4模型構建
8.1.5訓練配置
8.1.6模型訓練
8.1.7模型評估
8.1.8模型預測
8.2基於BERT模型實現情感分類
8.2.1數據處理
8.2.2模型構建
8.2.3訓練配置
8.2.4模型訓練
8.2.5模型評估
8.2.6模型預測
8.3基於BERT的屬性級情感分類
8.3.1任務目標
8.3.2實現思路及流程
8.3.3屬性和觀點抽取
8.3.4屬性級情感分類
8.3.5全流程模型推理
8.4實驗思考

第9章 信息抽取實踐
9.1基於Bi-LSTM和CRF的命名實體識別方法
9.1.1任務目標和實現流程
9.1.2數據處理
9.1.3模型構建
9.1.4訓練配置
9.1.5模型訓練
9.1.6模型評估
9.1.7模型預測
9.2基於ERNIE-UIE實現實體關係抽取
9.2.1任務目標和實現流程
9.2.2數據處理
9.2.3模型構建
9.2.4訓練配置
9.2.5模型訓練
9.2.6模型評估
9.2.7模型預測
9.3實驗思考

第10章 文本語義匹配實踐
10.1基於SimNet的文本語義匹配
10.1.1任務目標和實現流程
10.1.2數據處理
10.1.3模型構建
10.1.4訓練配置
10.1.5模型訓練
10.1.6模型評估
10.1.7模型預測
10.2基於RocketQA的文本語義匹配
10.2.1任務目標和實現流程
10.2.2數據處理
10.2.3模型構建
10.2.4訓練配置
10.2.5模型訓練
10.2.6模型評估
10.2.7模型預測
10.3實驗思考

第11章 基於PEGASUS的中文文本摘要實踐
11.1任務目標和實現流程
11.2數據處理
11.2.1數據集確定
11.2.2數據載入
11.2.3將數據轉換成特徵形式
11.2.4構造DataLoader
11.3模型構建
11.4訓練配置
11.4.1BLEU演算法
11.4.2ROUGE演算法
11.5模型訓練
11.6模型評估
11.7模型預測
11.8實驗思考

第12章 基於ERNIE 3.0實現意圖識別
12.1任務目標和實現流程
12.2數據處理
12.2.1數據集確定
12.2.2數據載入
12.2.3將數據轉換成特徵形式
12.2.4構造DataLoader
12.3模型構建
12.4訓練配置
12.5模型訓練
12.6模型評估
12.7模型預測
12.8實驗思考

第13章 機器閱讀理解實踐
13.1任務目標
13.2實現流程
13.3數據處理
13.3.1數據集確定
13.3.2數據載入
13.3.3將數據轉換成特徵形式
13.3.4構造DataLoader
13.4模型構建
13.5訓練配置
13.6模型訓練
13.7模型評估
13.8模型預測
13.9實驗思考

第14章 機器翻譯實踐
14.1任務目標和實現流程
14.2數據處理
14.2.1數據集確定
14.2.2數據載入
14.2.3將數據轉換成特徵形式
14.2.4構建DataLoader
14.2.5後處理
14.3模型構建
14.3.1嵌入層的代碼實現
14.3.2組裝Transformer模型
14.4訓練配置
14.5模型訓練
14.6模型評估
14.6.1數據讀取
14.6.2權重載入
14.6.3模型評估
14.7模型預測
14.8實驗思考

第15章 基於大模型的自動問答實踐
15.1任務目標和設計方案
15.2通過飛槳零代碼開發工具實現
15.3通過PaddleNLP實現
15.3.1代碼實現邏輯
15.3.2配置大模型
15.3.3配置向量檢索模型
15.3.4定義document store
15.3.5構建文檔索引
15.3.6構建問答應用
15.3.7(可選)線上推理部署
15.4實驗思考

附錄 術語與縮略語
參考文獻
 

詳細資料

  • ISBN:9787302651550
  • 規格:平裝 / 291頁 / 19 x 26 x 1.46 cm / 普通級 / 1-1
  • 出版地:中國
贊助商廣告
 
金石堂 - 今日66折
未知的實相有聲書第9輯
作者:許添盛
出版社:賽斯文化
出版日期:2012-08-13
66折: $ 581 
金石堂 - 今日66折
李辛中醫全精要套書(三冊):《經典中醫精要》、《兒童健康中醫講堂》、《精神健康中醫講堂》
作者:李辛
出版社:橡實
出版日期:2021-07-14
66折: $ 911 
金石堂 - 今日66折
賽斯速成100有聲書 第1輯
作者:王怡仁
出版社:賽斯文化
出版日期:2017-03-10
66折: $ 858 
金石堂 - 今日66折
信任生命的動力有聲書
作者:許添盛
出版社:賽斯文化
出版日期:2014-06-10
66折: $ 924 
 
博客來 - 暢銷排行榜
笑中帶淚的老後日常套書:《銀髮川柳1~3》(附贈「人生滋味」插畫書籤、「一起變老吧」新春賀年狀)
作者:日本公益社團法人全國自費老人之家協會 (公益社団法人全国有料老人ホーム協会, ポプラ社編集部)
出版社:三采
出版日期:2024-12-27
$ 562 
博客來 - 暢銷排行榜
ONE PIECE航海王 110
出版日期:2024-12-27
$ 97 
博客來 - 暢銷排行榜
你的人生,他們六個說了算!:決定你一生的六種物質
作者:大衛.JP.菲利浦斯
出版社:平安文化
出版日期:2024-12-30
$ 284 
金石堂 - 暢銷排行榜
東京-臨界點- (首刷限定版)(全)
作者:ハル
出版社:東立出版社
出版日期:2025-01-22
$ 187 
 
金石堂 - 新書排行榜
別對每件事都有反應【2025限量暢銷特典版】:淡泊一點也無妨,活出快意人生的99個禪練習!
作者:枡野俊明
出版社:悅知文化
出版日期:2024-12-18
$ 261 
金石堂 - 新書排行榜
迷宮飯 世界導覽冒險者聖經 完全版(全)
作者:九井諒子
出版社:青文出版社股份有限公司
出版日期:2025-01-22
$ 395 
Taaze 讀冊生活 - 新書排行榜
愛的修復:伴侶諮商中的衝突、理解與接納
作者:趙文滔、王國仲、呂伯杰、林冠伶、紀盈如、梁淑娟、蕭維真、魏凡涓
出版社:心靈工坊文化事業股份有限公司
出版日期:2024-11-25
$ 378 
Taaze 讀冊生活 - 新書排行榜
月的愛人
作者:丸尾末廣
出版社:鯨嶼文化
出版日期:2025-01-22
$ 280 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策