購物比價找書網找車網
FindBook  
 有 1 項符合

Effective數據科學基礎設施

的圖書
Effective數據科學基礎設施 Effective數據科學基礎設施

作者:(維萊·圖洛斯 / 譯者:郭濤 
出版社:清華大學出版社
出版日期:2023-08-01
語言:簡體中文   規格:平裝 / 277頁 / 19 x 26 x 1.39 cm / 普通級/ 1-1
圖書選購
型式價格供應商所屬目錄
 
$ 512
博客來 博客來
工程技術
圖書介紹 - 資料來源:博客來   評分:
圖書名稱:Effective數據科學基礎設施

內容簡介

數據科學專案日益增多,每個專案在提出原型到生產的過程中都需要可靠的基礎設施。使用《Effective數據科學基礎設施》介紹的一些新技術和新工具,你將能建立一個適用於各類組織(無論是初創企業還是大型企業)的基礎設施堆疊。《Effective數據科學基礎設施》可説明你建立數據流程和專案工作流,為你開發專案帶來強大動力。

《Effective數據科學基礎設施》呈現Netflix數據操作的最先進工具和概念,並在此基礎上介紹一種可定制的基於雲的模型開發和MLOps方法,可輕鬆適應公司的特定需求。當團隊把數據科學和機器學習應用於廣泛的業務問題時,這些實用的數據流程將更高效地生成更完美的結果。主要內容在雲中處理計算和編排將基於雲的工具耦合到一個內聚的數據科學環境中使用Metaflow、AWS和Python數據生態系統開發可複製的數據科學專案構建需要大型數據集和模型,需要數據科學家團隊參與的複雜應用程式。
 

作者介紹

Ville Tuulos在Netflix公司設計並構建了用於數據科學的全棧框架Metaflow。目前,Ville在一家專業開發數據科學基礎設施的初創公司擔任首席執行官。
 

目錄

第1章 數據科學基礎設施介紹 1
1.1 選擇數據科學基礎設施的原因 2
1.2 什麼是數據科學基礎設施 5
1.2.1 數據科學基礎設施堆疊 6
1.2.2 支持數據科學專案的整個生命週期 8
1.2.3 不能以偏概全 9
1.3 良好基礎設施的重要性 10
1.3.1 管理複雜性 11
1.3.2 利用現有平臺 12
1.4 以人為中心的基礎設施 13
1.4.1 自由與責任 14
1.4.2 數據科學家自主性 15
1.5 本章小結 16

第2章 數據科學的工具鏈 17
2.1 建立開發環境 18
2.1.1 雲帳戶 21
2.1.2 數據科學工作站 22
2.1.3 筆記 24
2.1.4 歸納 27
2.2 介紹工作流 29
2.2.1 工作流基礎 30
2.2.2 執行工作流 31
2.2.3 工作流框架 33
2.3 本章小結 35

第3章 Metaflow簡介 37
3.1 Metaflow的基本概念 38
3.1.1 安裝Metaflow 39
3.1.2 編寫基本工作流 40
3.1.3 管理工作流中的數據流 44
3.1.4 參數 50
3.2 分支和合併 55
3.2.1 有效的DAG結構 56
3.2.2 靜態分支 57
3.2.3 動態分支 61
3.2.4 控制併發 64
3.3 Metaflow實際應用 66
3.3.1 啟動新專案 67
3.3.2 使用用戶端API訪問結果 69
3.3.3 調試故障 72
3.3.4 最後潤色 76
3.4 本章小結 79

第4章 隨計算層伸縮 81
4.1 什麼是可伸縮性 82
4.1.1 整個堆疊的可伸縮性 83
4.1.2 實驗文化 85
4.2 計算層 87
4.2.1 使用容器進行批次處理 89
4.2.2 計算層示例 92
4.3 Metaflow中的計算層 98
4.3.1 為Metaflow配置AWS批次處理 100
4.3.2 @batch和@resources裝飾器 104
4.4 處理故障 107
4.4.1 使用@retry從瞬態錯誤中恢復 109
4.4.2 使用@timeout殺死僵屍 110
4.4.3 最後一種裝飾器:@catch 111
4.5 本章小結 113

第5章 實踐可伸縮性和性能 115
5.1 從簡單開始:垂直可伸縮性 116
5.1.1 示例:聚類Yelp評論 117
5.1.2 實踐垂直可伸縮性 119
5.1.3 為什麼選擇垂直可伸縮性 124
5.2 實踐水準可伸縮性 126
5.2.1 為什麼選擇水準可伸縮性 126
5.2.2 示例:超參數搜索 127
5.3 實施性能優化 130
5.3.1 示例:計算共現矩陣 131
5.3.2 加快工作流的方法 139
5.4 本章小結 140

第6章 投入生產 141
6.1 穩定的工作流調度 143
6.1.1 中心化元數據 145
6.1.2 使用AWS Step Functions和Metaflow 147
6.1.3 使用@schedule調度運行 152
6.2 魯棒的執行環境 153
6.2.1 Metaflow包如何流動 155
6.2.2 為什麼依賴管理很重要 160
6.2.3 使用@conda裝飾器 162
6.3 穩定運行 167
6.3.1 原型開發期間的命名空間 169
6.3.2 生產命名空間 173
6.3.3 使用@project的並行部署 174
6.4 本章小結 177

第7章 處理數據 179
7.1 快速數據的基礎 182
7.1.1 從S3載入數據 183
7.1.2 使用表格數據 188
7.1.3 記憶體數據堆疊 192
7.2 與數據基礎設施的交互 194
7.2.1 現代數據基礎設施 195
7.2.2 用SQL準備數據集 199
7.2.3 分散式數據處理 205
7.3 從數據到特徵 210
7.3.1 區分事實和特徵 211
7.3.2 編碼特徵 213
7.4 本章小結 218

第8章 使用和操作模型 221
8.1 生成預測 223
8.1.1 批次處理、流式和即時預測 225
8.1.2 示例:推薦系統 227
8.1.3 批次處理預測 232
8.1.4 即時預測 243
8.2 本章小結 248

第9章 全棧機器學習 249
9.1 可插拔的特徵編碼器和模型 250
9.1.1 為可插拔的元件開發框架 251
9.1.2 執行特徵編碼器 255
9.1.3 基準模型 259
9.2 深度回歸模型 264
9.2.1 編碼輸入張量 266
9.2.2 定義深度回歸模型 269
9.2.3 訓練深度回歸模型 272
9.3 總結所學 275
9.4 本章小結 277

附錄 安裝Conda 279
 

詳細資料

  • ISBN:9787302641865
  • 規格:平裝 / 277頁 / 19 x 26 x 1.39 cm / 普通級 / 1-1
  • 出版地:中國
贊助商廣告
 
金石堂 - 今日66折
邁向成熟大人的情緒教養】(三冊):《為何你不敢自在做自己?》、《為何你總是憂鬱不安?》、《為何你容易失控發脾氣?》
作者:麗莎.M.薩伯
出版社:橡實
出版日期:2020-08-03
66折: $ 713 
金石堂 - 今日66折
自然元素魔法系列套書(四冊):《水系魔法》、《風系魔法》、《火系魔法》、《土系魔法》
作者:莉莉絲.朵西
出版社:橡實
出版日期:2022-08-01
66折: $ 1320 
金石堂 - 今日66折
旅遊大歷史
作者:賽門.亞當斯、R. G.格蘭
出版社:大石國際文化
出版日期:2019-12-03
66折: $ 792 
金石堂 - 今日66折
朝鮮一姊金與正:北韓領導人金正恩妹妹,史上首握核彈按鈕女子的掌權之路,王朝如何「培養」接班人。
作者:李晟允
出版社:大是文化有限公司
出版日期:2024-04-29
66折: $ 329 
 
Taaze 讀冊生活 - 暢銷排行榜
大廚不外傳の黃金比例調醬祕訣571【暢銷修訂版】
作者:學研編輯部
出版社:台灣廣廈
出版日期:2020-02-13
$ 224 
金石堂 - 暢銷排行榜
嫁入狼族~異種婚姻譚~Ⅱ (特裝版)
作者:犬居葉菜
出版社:東立出版社
出版日期:2024-10-23
$ 162 
金石堂 - 暢銷排行榜
學生會也有洞! 06
作者:無知麻呂
出版社:東立出版社
出版日期:2024-10-25
$ 126 
博客來 - 暢銷排行榜
少年來了【新裝紀念版】
作者:韓江 (한강)
出版社:漫遊者文化
出版日期:2023-06-19
$ 308 
 
金石堂 - 新書排行榜
連結:從石器時代到AI紀元
作者:哈拉瑞
出版社:遠見天下文化出版股份有限公司
出版日期:2024-09-10
$ 553 
博客來 - 新書排行榜
山茶花情書【首刷限量為你而寫信紙組】
作者:小川糸
出版社:圓神
出版日期:2024-11-01
$ 347 
金石堂 - 新書排行榜
AI時代的教育:面對瞬息萬變的模糊未來,孩子為何而學、要學什麼、如何去學?
作者:查爾斯.費德、亞莉西斯.布萊克、羅比.泰勒、珍妮特.史雷辛斯基、凱蒂.鄧恩
出版社:親子天下股份有限公司
出版日期:2024-09-24
$ 395 
Taaze 讀冊生活 - 新書排行榜
當爸媽過了65歲:你一定要知道的醫療、長照、財務、法律知識【全新增修版】
作者:康哲偉
出版社:先覺出版
出版日期:2024-11-01
$ 239 
 

©2024 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策