第 1 章 概述 1
大資料處理的特徵 / 3
基本處理模型 / 5
工程角度的大資料歷史 / 8
大資料的基本處理框架 / 10
大資料的技術實施方法 / 13
第2 章 數據 21
資料存儲 / 23
數據定址 / 28
列式存儲 / 34
鍵值對快取記憶體 / 43
持久化的快取記憶體 / 54
大資料表 / 65
第3 章 計算資源 73
集群匯流排 / 75
資源調度 / 91
資源控制 / 97
第4 章 計算模型 109
MapReduce / 111
SQL 類查詢 / 115
流式計算 / 119
圖計算 / 125
第5 章 大資料應用 133
搜索資訊匹配 / 136
搜索資訊排名 / 140
文檔相似性判定 / 147
文檔主題生成 / 152
用戶畫像 / 163
廣告投放決策 / 175
基數計算 / 191
第6 章 資料治理 199
中繼資料管理 / 202
主資料管理 / 207
資料標準 / 209
資料管理成熟度評估 / 213
數據資產 / 220
資料治理的組織構架 / 230
第7 章 大數據和人工智慧 233
大資料和電腦視覺 / 236
大數據和語音辨識 / 259
大數據和博弈 / 284
術語表 291
作者介紹 299