TVM(Tensor Virtual Machine, 張量虛擬機器)是一種開源的模型編譯框架,旨在將機器學習模型自動編譯成可供下層硬體執行的機器語言,從而利用多種類型的算力。其工作原理是,先將深度學習模型進行優化推理、記憶體管理與執行緒調度,再借用LLVM框架將模型部署在CPU、GPU、FPGA、ARM等硬體設備上。
本書全面解析TVM的主要功能,幫助讀者理解TVM工作原理,以及使用 TVM對深度學習與機器學習進行優化與部署。
本書結合作者多年的工作與學習經驗,力求將TVM基礎理論與案例實踐融合在一起進行詳細講解。全書共9章,包括TVM基本知識,使用TVM開發,運算元融合與圖優化,TVM量化技術,TVM 優化調度,Relay IR,代碼生成,後端部署與OpenCL(Open Computing Language,開放運算語言),自動調度、自動搜索與成本模型。各章除了包含重要的知識點和實踐技能外,還配備了精心挑選的典型案例。
本書適合從事AI演算法、軟體、編譯器開發以及硬體開發等專業的工程技術人員、科研工作人員、技術管理人員閱讀,也可以作為編譯器相關專業高校師生的參考用書。