透過本書,可以:
•了解自然語言處理(NLP)的概念
•了解各種自然語言處理的方法
•如何使用循環神經網路(RNN)、長短期記憶法(LSTM)對句子進行情緒分析
•如何使用RNN、LSTM對句子內的詞標註詞性
本書有系統地介紹了自然語言處理(NLP)的基礎技術,從傳統的統計處理方法過渡到近年興起基於類神經網路的處理方法,用通俗易懂的語言說明自然語言處理的概念,於各章節中也都有配合實際範例描述所介紹的方法,讓讀者有更紮實的理解。內容深入淺出、容易理解,相信本書會讓讀者有所收獲。本書作者為AI4kids團隊,曾應教育部國教署邀請,至全國高中主任會議分享AI教學、親子天下雜誌專文報導,成員來自AIA台灣人工智慧學校的校友,團隊有軟體技術、創新研發、工程管理、電商行銷等資歷專長,因為對AI科技教育的熱情而投入AI的教案研發與教學,目標是透過教孩子動手實作AI專題,來啟發他們對好奇心與想像力,協助他們運用各種程式或平台工具來探索、創造自己的AI應用。
作者簡介:
AI4kids成立於2019年6月,是一群來自AIA台灣人工智慧學校的校友團隊,成員各有軟體技術、創新研發、工程管理、電商行銷等資歷專長,因為對AI科技教育的熱情,而投入AI的教案研發與教學,教學足跡遍佈北、中、南、東各高中與大專院校。
曾獲教育部國教署邀請於全國高中教務主任會議上分享人工智慧的教與學,也是《親子天下》雜誌專文推薦的AI教育團隊。
目錄
第1章 自然語言處理介紹
1-1 前言
1-2 何謂「自然語言處理」?
1-3 傳統的自然語言處理
1-4 深度學習的自然語言處理
1-5 小結
第2章 電腦學中文的第一步:斷詞
2-1 前言
2-2 語料庫
2-3 最大匹配法
2-4 斷詞工具
2-5 中文斷詞工具──Jieba
2-6 中研院斷詞系統─CKipTagger
2-7 小結
第3章 基於統計的自然語言處理
3-1 前言
3-2 One-hot表示法
3-3 詞袋表示法
3-4 TF-IDF表示法
3-5 N元語法
3-6 小結
第4章 基於類神經的自然語言處理
4-1 前言
4-2 詞嵌入
4-3 國王–他 + 她 = 皇后
4-4 Skip-gram模型與CBOW模型
4-5 訓練詞彙向量
4-6 小結
第5章 循環神經網路簡介
5-1 前言
5-2 認識序列資料
5-3 類神經網路的演進
5-4 循環神經網路
5-5 循環神經網路的種類
5-6 長短期記憶神經網路
5-7 小結
第6章 RNN與LSTM實作:IMDB情緒分析
6-1 前言
6-2 載入與了解IMDB網路電影資料集
6-3 資料預處理
6-4 建構RNN及LSTM模型
6-5 小結
第7章 RNN與LSTM實作:詞性標註
7-1 前言
7-2 載入與了解詞性標註資料集
7-3 資料預處理
7-4 建立字典
7-5 獲得訓練集與測試集
7-6 TensorFlow data pipeline
7-7 建構RNN及LSTM模型
7-8 小結
附錄A Python基礎語法查詢表
A-1 Python基本概念
附錄B Google Colab使用簡介
B-1 Google Colaboratory介紹
B-2 Notebook組態設定
B-3 檢視目前Python版本與套件清單
第1章 自然語言處理介紹
1-1 前言
1-2 何謂「自然語言處理」?
1-3 傳統的自然語言處理
1-4 深度學習的自然語言處理
1-5 小結
第2章 電腦學中文的第一步:斷詞
2-1 前言
2-2 語料庫
2-3 最大匹配法
2-4 斷詞工具
2-5 中文斷詞工具──Jieba
2-6 中研院斷詞系統─CKipTagger
2-7 小結
第3章 基於統計的自然語言處理
3-1 前言
3-2 One-hot表示法
3-3 詞袋表示法
3-4 TF-IDF表示法
3-5 N元語法
3-6 小結
第4章 基於類神經的自然語言處理
4-1 前言
4-2 詞嵌入
4-3 國王–他 + 她 = 皇后
4-4 Skip-gram模型與CBOW模型...