數據科學專案日益增多,每個專案在提出原型到生產的過程中都需要可靠的基礎設施。使用《Effective數據科學基礎設施》介紹的一些新技術和新工具,你將能建立一個適用於各類組織(無論是初創企業還是大型企業)的基礎設施堆疊。《Effective數據科學基礎設施》可説明你建立數據流程和專案工作流,為你開發專案帶來強大動力。
《Effective數據科學基礎設施》呈現Netflix數據操作的最先進工具和概念,並在此基礎上介紹一種可定制的基於雲的模型開發和MLOps方法,可輕鬆適應公司的特定需求。當團隊把數據科學和機器學習應用於廣泛的業務問題時,這些實用的數據流程將更高效地生成更完美的結果。主要內容在雲中處理計算和編排將基於雲的工具耦合到一個內聚的數據科學環境中使用Metaflow、AWS和Python數據生態系統開發可複製的數據科學專案構建需要大型數據集和模型,需要數據科學家團隊參與的複雜應用程式。