XGBoost是一種經過行業驗證的開源軟件庫,為快速高效地處理數十億數據點提供了梯度提升框架。首先,本書在介紹機器學習和XGBoost在scikit-learn中的應用后,逐步深入梯度提升背後的理論知識。讀者將學習決策樹,並分析在機器學習環境中的裝袋技術,同時學習拓展到XGBoost的超參數;並將從零開始構建梯度提升模型,將梯度提升擴展到大數據領域,同時通過計時器的使用了解速度限制。接着,本書重點探討XGBoost的細節,着重於速度提升和通過數學推導導出參數。通過詳細案例研究,讀者將練習使用scikit-learm及原始的Python API構建和微調XGBoost分類器與回歸器:並學習如何利用XGBoost的超參數來提高評分、糾正缺失值、縮放不平衡數據集,並微調備選基學習器。最後,讀者將學習應用高級XGBoost技術,如構建非相關的集成模型、堆疊模型,並使用稀疏矩陣、定製轉換器和管道為行業部署準備模型。
本書適合作為高等學校計算機專業、軟件工程專業的高年級本科生及研究生教材,同時適合有一定機器學習基礎的數據科學家、機器學習工程師和研究人員閱讀,可為解決複雜的機器學習問題提供實用指導。