本書循序漸進、詳細講解了大模型開發技術的核心知識,並通過具體實例的實現過程演練了使用TensorFlow和PyTorch開發大模型程序的方法和流程。
全書共12章,分別講解了大模型基礎,數據集的加載、基本處理和製作,數據集的預處理,卷積神經網絡模型,循環神經網絡模型,特徵提取,注意力機制,模型訓練與調優,模型推理和評估,大模型優化算法和技術,AI智能問答系統和AI人臉識別系統。全書簡潔而不失其技術深度,內容豐富全面。本書易於閱讀,以極簡的文字介紹了複雜的案例,是學習大模型開發的實用教程。
本書適用於已經了解Python基礎開發的讀者,以及想進一步學習大模型開發、模型優化、模型應用和模型架構的讀者,還可以作為大專院校相關專業的師生用書和培訓學校的專業性教材。
王振麗,華中科技大學計算機碩士,精通C、C#、C++、Java、Python等多門編程語言。現任騰訊AI產品架構師,主要從事移動端底層系統架構、驅動程序、AI應用的研究和開發工作,對人工智能的架構設計和實現原理有非常深刻的認識和理解。精通各種多模態預訓練算法,熟悉Prompt Engineering和模型Tuning方法,在協同大模型垂直領域的訓練和調優方面經驗豐富,在提升大模型業務的產品落地領域有着豐富的見解。