有 1 項符合
andy konwinski
的圖書
|
圖書介紹 - 資料來源:博客來 目前評分: 評分:
圖書名稱:Spark學習手冊 內容簡介
現今無論在任何領域,資料都逐漸地變大,你該如何有效率的對他們進行處理?此書介紹了Apache Spark,一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark,你可以透過簡易的Pyhon,Java,或是Scala的API進行快速的大量資料處理。
此書為Spark的開發者親自撰寫,可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。
‧讓讀者可以快速地了解Spark,例如:分散式資料集、記憶體快取、以及交互式介面等。
‧利用Spark內建的強大資料庫,包含Spark SQL、Spark Streaming以及MLib。
‧使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。
‧學習透過Spark進行交互式、批次、以及串流式的應用程式開發
‧與諸多資料來源進行連接,包含HDFS、HIVE、JSON以及S3
‧學習資料切割以及共享變數等進階議題
“本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media
作者介紹
作者簡介
Holden Karau
Holden Karau任職於Databricks的軟體開發工程師,活耀於開放原始碼專案,同時也是《Fast Data Processing with Spark》(Packt 出版社)的作者
Andy Konwinski
Andy Konwinski是Databricks的共同創辦人,Apache Spark的提交者。同時也是Apache Mesos專案的共同建立人
Patrick Wendell
Patrick Wendell是Databricks的共同創辦人,Apache Spark的提交者。他也維護許多Spark核心引擎的子專案。
Matei Zaharia
Matei Zaharia是Databricks的CTO以及Apache Spark的建立人,他也因為此專案名列Apache副董事
目錄
Chapter 1 Spark 資料分析導論
Chapter 2 下載及開始使用 Spark
Chapter 3 RDD程式撰寫
Chapter 4 鍵值對 RDD 操作
Chapter 5 存取資料
Chapter 6 進階 Spar k程式撰寫
Chapter 7 在叢集執行 Spark
Chapter 8 Spark 調校與除錯
Chapter 9 Spark SQL
Chapter 10 Spark streaming
Chapter 11 MLlib 機器學習函式庫
詳細資料
- ISBN:9789864760466
- 規格:平裝 / 288頁 / 18.5 x 23 cm / 普通級 / 單色印刷 / 初版
- 出版地:台灣
|
|
|
| 66折: $ 238 | | 66折: $ 165 | | 作者:史考特.納遜斯 出版社:先覺出版股份有限公司 出版日期:2022-08-01 66折: $ 277 | | 66折: $ 825 | |
|
| 作者:強納森.海德特 (Jonathan Haidt) 出版社:網路與書出版 出版日期:2024-11-29 $ 379 | | 作者:台灣角川 出版社:角川精品 出版日期:2020-12-10 $ 266 | | $ 925 | | $ 489 | |
|
| 作者:荻野真 出版社:東立出版社 出版日期:2024-12-13 $ 255 | | 作者:楊佳燊 (Jason Yang) 出版社:商周出版 出版日期:2024-12-26 $ 316 | | 作者:張西 出版社:三采 出版日期:2024-12-27 $ 331 | | 作者:草子信 出版社:英屬維京群島商高寶國際有限公司台灣分公司 出版日期:2024-11-13 $ 217 | |
|
|
|
|