購物比價找書網找車網
FindBook  
 有 4 項符合

Hadoop技術手冊(第四版)

的圖書
Hadoop技術手冊 第四版 Hadoop技術手冊 第四版

作者:Tom White / 譯者:林峰正王耀聰辜文元施赬陽周天穎 
出版社:歐萊禮
出版日期:2016-09-14
語言:繁體書   
圖書介紹 - 資料來源:博客來   評分:
圖書名稱:Hadoop技術手冊(第四版)

內容簡介

  準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。

  針對Hadoop 2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。

  .學習基礎元件如MapReduce、HDFS及YARN。
  .更深入探索MapReduce,包含開發應用程式。
  .設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
  .學習兩種資料格式:Avro 的資料序列化和Parquet巢狀資料。
  .使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
  .了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
  .學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
 

作者介紹

作者簡介

Tom White


  Tom White自2007年起就是Apache Hadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章,並在商業研討會上發表多場演講。
 

目錄

第一部分 Hadoop 基礎
chapter 1|遇見 Hadoop
chapter 2|MapReduce
chapter 3|Hadoop 分散式檔案系統
chapter 4|YARN
chapter 5|Hadoop 的 I/O

第二部分 MapReduce
chapter 6|開發 MapReduce 程式
chapter 7|MapReduce 如何運作
chapter 8|MapReduce 的類型與格式
chapter 9|MapReduce 的特性

第三部分 Hadoop 操作
chapter 10|建立一個 Hadoop 叢集
chapter 11|Hadoop 的管理

第四部分 相關專案
chapter 12|Avro
chapter 13|Parquet
chapter 14|Flume
chapter 15|Sqoop
chapter 16|Pig
chapter 17|Hive
chapter 18|Crunch
chapter 19|Spark
chapter 20|HBase
chapter 21|ZooKeeper

第五部分 案例研究
chapter 22|Cerner 的可聚集資料
chapter 23|生物資料科學:用軟體拯救生命
chapter 24|Cascading

appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
appendix D|舊版及新版的 Java MapReduce API
index
 



  Martin Gardner是一位數學和科學作家,在一次的採訪中提到:「除了微積分,我什麼都沒有,這就是我的專欄成功的秘密。我花了很長的時間去瞭解我寫些什麼,這讓我知道如何寫作才能讓讀者都能看得懂」。在許多方面,我對Hadoop的感覺是:它的內部作業非常複雜,結合了分散式系統理論、實務技術和常識來作為支持它運作的基礎。對於缺乏特定知識和經驗的人而言,Hadoop就像外星人一樣,無法理解。

  但它也未必會變成這樣。拆開它的核心,它就只是Hadoop提供用來建立分散式系統、對資料儲存、資料分析和協調運作一個很簡單的工具。如果有一個共通的主題,提高它相關的抽象化層級-這就像創造積木用來建立基礎環境,當遇到有大量資料需要儲存或有大量資料需要分析或有大量主機需要協調,而程式設計師又沒有足夠時間、技能或不想要變成分散式系統專家時,就可以輕易的掌控。應該要有這樣一個簡單且具普遍應用性的套件,當我開始有這個想法的時候,在我心中很清楚,唯有如此Hadoop才能更廣泛的被使用。然而,在當時(2006年初),建置、配置和撰寫程式來使用Hadoop是一件藝術。從那時候事情開始有了改善:有愈來愈多的文件、有更多的範例,而且當你有問題時可以透過郵件清單來反應。而對新的使用者而言,最大的障礙是還不知道這項技術的能力、擅長的地方和如何使用它。這也就是為什麼我要寫這本書的原因。
 
 

詳細資料

  • ISBN:9789864761364
  • 規格:平裝 / 756頁 / 18.5 x 23 cm / 普通級 / 單色印刷 / 四版
  • 出版地:台灣
贊助商廣告
 
金石堂 - 今日66折
你的謎底,我的謎題
作者:小川哲
出版社:圓神出版社
出版日期:2024-01-01
66折: $ 218 
金石堂 - 今日66折
溫伯格的軟體管理學套書(全4卷)
作者:傑拉爾德.溫伯格
出版社:經濟新潮社
出版日期:2012-05-24
66折: $ 2033 
金石堂 - 今日66折
天才在左瘋子在右
作者:高銘
出版社:時報文化出版企業股份有限公司
出版日期:2017-10-31
66折: $ 297 
金石堂 - 今日66折
豐盛鍋飯:一鍋一餐,省時美味!輕鬆組合季節食材╳風味高湯,韓國人氣美食總監的日常私家菜
作者:金妍我
出版社:台灣廣廈有聲圖書有限公司
出版日期:2021-12-16
66折: $ 317 
 
博客來 - 暢銷排行榜
美國第一健身強人,給女生的科學化鍛鍊全書:重訓×飲食,12週有效訓練,女生也能練出精實肌肉
作者:麥可.馬修斯 (Michael Matthews)
出版社:采實文化
出版日期:2022-02-10
$ 513 
Taaze 讀冊生活 - 暢銷排行榜
Word、Excel、PPT高效爆量500招【office 365全新進化版】
作者:PCuSER研究室
出版社:PCuSER電腦人文化
出版日期:2023-03-23
$ 165 
金石堂 - 暢銷排行榜
從此縱情
作者:希澄
出版社:台灣角川股份有限公司
出版日期:2025-04-14
$ 284 
 
博客來 - 新書排行榜
供應鏈之死與 PI 的崛起:實體 AI 如何革命性的推動下一個時代智慧物流暨供應鏈管理、改變我們賺錢的方式
作者:詹斯敦 (Shelton Chan)著
出版社:商周出版
出版日期:2025-04-10
$ 434 
Taaze 讀冊生活 - 新書排行榜
奧馬哈之霧——巴菲特:你可以不認同、不理會,但千萬別誤解了巴菲特!破解奧馬哈先知迷霧般的投資思維,一本濃縮所有股東信與傳記
作者:任俊傑、朱曉芸
出版社:方舟文化
出版日期:2025-04-16
$ 315 
博客來 - 新書排行榜
學生會也有洞! 7
$ 133 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策