本書是CUDA並行程序設計領域最全面、最詳實和最具權威性的著作之一,由CUDA開發者社區技術總監親自撰寫,英偉達中國首批CUDA官方認證工程師翻譯,詳實地講解了CUDA並行程序設計的技術知識點(平台、架構、硬件知識、開發工具和熱點技術)和編程方法,包含大量實用代碼示例,實踐性非常強。
全書共分為12章。
第1章從宏觀上介紹流處理器演變歷史。
第2章詳解GPU並行機制,深入理解串行與並行程序,以辯證地求解問題。
第3章講解CUDA設備及相關的硬件和體系結構,以實現最優CUDA程序性能。
第4章介紹CUDA開發環境搭建和可用調試環境。
第5章介紹與CUDA編程緊密相關的核心概念——網格、線程塊與線程,並通過示例說明線程模型與性能的關系。
第6章借助實例詳細講解了不同類型內存的工作機制,並指出實踐中容易出現的誤區。
第7章細述多任務的CPU和GPU協同,並介紹多個CPU/GPU編程秘技。
第8章介紹如何在應用程序中編寫和使用多GPU。
第9章詳述CUDA編程性能限制因素、分析CUDA代碼的工具和技術。
第10章介紹編程實踐中的庫與軟件開發工具包。
第11章講解如何設計基於GPU的系統。
第12章總結CUDA應用中易犯錯誤以及應對建議。
Shane Cook CUDA開發者社區技術總監,有20余年行業經驗。當認識到異構系統以及CUDA對於已有串行和並行編程技術的革命性沖擊時,創立了CUDA開發者社區(歐洲的咨詢公司,專門幫助企業重構代碼以充分利用GPU硬件的威力)。他專注於高性能軟件開發、GPU利用、嵌入式系統,並參與了多個C語言編程標准的建設,包括廣泛應用於汽車軟件行業的汽車工業軟件MISRA Safer C。他常為德國汽車行業、國防承包行業、北電網絡以及福特汽車公司等機構或藍籌股公司提供專業咨詢服務和軟件定制開發。