推薦序
前言
第1章 信息流產品與推薦算法1
1.1 什麼是信息流產品1
1.2 信息流產品對使用者體驗和商業價值的重塑3
1.2.1 信息流產品下的使用者體驗3
1.2.2 商業價值的重塑6
1.2.3 用戶體驗及商業價值總結8
1.3 信息流產品推薦系統的構成8
1.3.1 推薦算法基線9
1.3.2 推薦算法的生態建設14
1.4 本章小結16
參考文獻16
第2章 業務資料探索:推薦算法閉環的起點與終點18
2.1 產品運營分析19
2.1.1 系統性分析19
2.1.2 週期性分析23
2.2 用戶畫像分析24
2.2.1 用戶畫像構建的基本方法25
2.2.2 用戶畫像之價值分層與生命週期管理26
2.2.3 用戶畫像的品質保障30
2.3 使用者行為路徑分析32
2.4 本章小結34
參考文獻35
第3章 可插拔式的召回算法36
3.1 召回側的業務目標和技術方向36
3.2 協同過濾召回38
3.2.1 User-based CF38
3.2.2 Item-based CF40
3.2.3 Item-based CF與User-based CF的對比與改進41
3.2.4 Model-based CF43
3.3 用戶和物品的向量化表示學習48
3.3.1 從Word2vec到Item2vec48
3.3.2 YouTube DNN54
3.3.3 DSSM57
3.4 基於圖模型的召回建模63
3.4.1 SimRank63
3.4.2 DeepWalk66
3.4.3 LINE68
3.4.4 Node2vec70
3.4.5 EGES73
3.5 用戶行為序列召回建模75
3.5.1 序列建模的通用算法模組75
3.5.2 用戶多興趣建模84
3.5.3 序列建模總結91
3.6 本章小結93
參考文獻94
第4章 粗排算法97
4.1 粗排的定位和重要性思考97
4.2 前深度學習時代的粗排98
4.2.1 非個性化離線評估模型98
4.2.2 淺層個性化模型104
4.3 深度粗排模型的重要方法106
4.3.1 基於向量內積的雙塔模型106
4.3.2 基於精排模型的知識蒸餾111
4.3.3 COLD粗排架構117
4.4 粗排建模的重要問題120
4.4.1 樣本選擇策略120
4.4.2 粗精排一致性校驗123
4.5 本章小結125
參考文獻125
第5章 精排算法127
5.1 精排算法的核心目標和概要127
5.2 前深度學習時代的精排算法128
5.2.1 LR128
5.2.2 FM131
5.2.3 GBDT136
5.3 深度精排算法137
5.3.1 Wide & Deep138
5.3.2 DeepFM139
5.3.3 DIN140
5.3.4 DIEN144
5.3.5 DSIN146
5.3.6 SIM149
5.4 線上學習152
5.4.1 線上學習的基本概念152
5.4.2 線上學習算法框架:FTRL153
5.5 多工學習156
5.5.1 MMoE157
5.5.2 ESMM158
5.5.3 PLE159
5.5.4 MFH162
5.5.5 MVKE164
5.6 本章小結170
參考文獻170
第6章 多目標融合算法173
6.1 多目標融合的意義173
6.2 啟發式多目標融合173
6.2.1 Grid Search174
6.2.2 Random Search175
6.2.3 搜參實踐175
6.3 貝葉斯優化176
6.3.1 概率代理模型177
6.3.2 採集函數178
6.3.3 貝葉斯搜參實踐179
6.4 進化策略179
6.4.1 進化算法的相關概念179
6.4.2 基於OpenAI ES的進化策略實踐185
6.5 強化學習186
6.5.1 強化學習的核心概念187
6.5.2 強化學習的多目標融合實踐189
6.6 本章小結194
參考文獻194
第7章 重排算法196
7.1 重排算法概要及核心目標196
7.2 多樣性算法之啟發式方法196
7.2.1 MMR197
7.2.2 MLR197
7.2.3 DPP198
7.3 多樣性算法之list-wise建模200
7.3.1 DLCM200
7.3.2 PRM205
7.3.3 Seq2Slate208
7.3.4 GRN212
7.3.5 PRS217
7.4 端雲一體協同推薦221
7.4.1 EdgeRec221
7.4.2 DCCL227
7.5 本章小結232
參考文獻232
第8章 推薦建模中的資料預處理和模型後處理234
8.1 評分矩陣構建234
8.2 特徵工程239
8.2.1 特徵的提取與加工239
8.2.2 特徵重要性分析244
8.3 模型校準248
8.4 本章小結250
參考文獻250
第9章 信息流推薦中的經典業務問題應對252
9.1 關於信息繭房252
9.2 關於保量策略255
9.3 內容與使用者冷開機256
9.3.1 DropoutNet256
9.3.2 MWUF258
9.3.3 LinUCB261
9.3.4 Cold & Warm Net263
9.4 偏置與消偏266
9.4.1 偏置分析267
9.4.2 消偏:用戶選擇偏置269
9.4.3 消偏:曝光偏置269
9.4.4 消偏:群體一致性偏置270
9.4.5 消偏:位置偏置270
9.4.6 消偏:流行度偏置273
9.5 正向行為定義279
9.6 本章小結280
參考文獻281
第10章 信息流推薦算法的評估與改進283
10.1 宏觀視角下的推薦效果評估283
10.2 微觀視角下的推薦效果評估287
10.2.1 推薦效果評估流程287
10.2.2 離線評估指標體系289
10.3 A/B測試的實驗機制設計296
10.3.1 A/B測試的基本概念及必要性296
10.3.2 A/B測試的實驗設計和效果分析298
10.3.3 A/B測試與Interleaving305
10.4 本章小結307
參考文獻307
第11章 總結與展望308
11.1 推薦算法的重要挑戰308
11.2 論推薦算法工程師的自我修養312
11.3 本章小結317
參考文獻317
後記318