購物比價找書網找車網
FindBook  
 有 4 項符合

Hadoop+Spark大數據巨量分析與機器學習整合開發實戰

的圖書
最新圖書評論 -  目前有 5 則評論,查看更多評論
 「Hadoop+Spark大數...
轉載自博客來  極力推薦  2019/01/14
「Hadoop+Spark大數據巨量分析與機器學習整合開發實戰」一書,算是姐妹作「Python+Spark 2.0+Hadoop機器學習與大數據分析實戰」的前身。就是藉由許多實作的練習,一步步教導讀者學會使用Spark平台進行大數據分析以及機器學習預測。 Hadoop HD...
Hadoop+Spark大數據巨量分析與機器學習整合開發實戰 Hadoop+Spark大數據巨量分析與機器學習整合開發實戰

作者:林大貴 
出版社:博碩文化股份有限公司
出版日期:2015-11-03
語言:繁體書   
圖書介紹 - 資料來源:TAAZE 讀冊生活
圖書名稱:Hadoop+Spark大數據巨量分析與機器學習整合開發實戰

◆技術為金融財務、行銷分析、商業趨勢預測帶來全新的變革
◆詳實的安裝設定與程式編寫說明降低學習入門門檻
◆可單機執行或以實機/虛擬機器建立多台演算陣列
◆具備大量實務案例分析與程式碼範例實作

大數據分析與機器學習人工智慧帶來資訊科技革命的第五波新浪潮
創新產業      大量商機      人才需求

一般人可能會認為大數據需要很多台機器的環境才能學習,但是本書透過虛擬機器的方法,就能在自家電腦演練建立Hadoop叢集,並且建立Spark開發環境。

以實機操作介紹Hadoop MapReduce與HDFS基本概念,以及Spark RDD與MapReduce基本觀念。

以大數據分析實務案例:MoiveLens(電影喜好推薦引擎)、StumbleUpon(網頁二元分類)、CovType(林相土地演算)、Bike Sharing(Ubike類租賃預測分析)。

配合範例程式碼來介紹各種機器學習演算法,示範如何擷取資料、訓練資料、建立模型、預測結果,由淺而深介紹Spark機器學習。

大數據對每個領域都造成影響。在商業、經濟及其他領域中,將大量資料進行分析後,就可得出許多資料關聯性。可用於預測商業趨勢、行銷研究、金融財務、疾病研究、打擊犯罪等。大數據對每一個公司的決策方式將發生變革-決策方式將基於資料和分析的結果,而不是依靠經驗和直覺。
 
資訊科技浪潮第一波是大型電腦,第二波是個人電腦,第三波是網路,第四波是社群媒體,第五波科技則是「大數據」。每一波的的資訊科技浪潮,總是帶來工作與生活方式的改變,創造大量商機、新的產業、大量的工作機會。像是在網路時代,創造了Google、Amazon 等大公司,以及無數.com 公司。
 
每一波浪潮開始時,需求的相關人才最多,但是此時也是相關人才供應最少。因此對個人而言,如果能在浪潮興起時就投入,往往成果最豐碩,並且有機會占有重要職位。像是網路剛興起時,每個公司都需要建立網站,但是相對這方面的人才不夠。那時候能撰寫網頁相關程式語言的工程師就能夠獲得高薪。但是後來投入的人越來越多,這方面的工程師就沒有那麼吃香了。
 
之前的科技浪潮,也許你沒有機會躬逢其盛,或是沒有機會在浪潮初期進入。但是大數據的浪潮方興未艾,正是進入的好時機。根據IBM 調查預估,大數據目前的商機是71 億美元,並將以每年增長20%速度持續成長,預計2015 年達到180 億美元。機會是給有準備的人,學會了大數據分析的相關技能,讓你有機會獲得更好的薪資與發展前景。根據美國調查機構Robert Half Technology 2016 年趨勢報告,在美國大數據工程師,薪水年成長8.9%,年薪大約13 萬至18 萬美金(約新台幣429 萬元~594 萬元)。因為人才短缺,企業不惜重金挖角。(你可以在google 搜尋Robert Half Technology 2016 就可以下載此調查報告)
 
本書的主題是Haddop+Spark大數據分析與機器學習。Hadoop 大家已經知道是運用最多的大數據平台,然而Spark 異軍突起,與Hadoop 相容而且執行速度更快,各大公司也開始加入Spark 開發。例如IBM 加入Apache Spark 社群打算培育百萬名資料科學家。Google 與微軟也分別應用了Spark 的功能來建置服務、發展大數據分析雲端與機器學習平臺。這些大公司的加入,也意味著未來更多公司會採用Hadoop+Spark 進行大數據資料分析。
 
然而目前市面上雖然很多大數據的書,但是多半偏向理論或應用層面的介紹,網路上的資訊雖然很多,但是也很雜亂。本書介紹希望能夠用淺顯易懂原理說明,再加上實機操作、範例程式,能夠降低大數據技術的學習門檻,帶領讀者進入大數據與機器學習的領域。當然整個大數據的生態系非常龐大,需要學習的東西太多。希望讀者能透過本書有了基本概念後,比較容易踏入這門領域,能繼續深入研究其他大數據的相關技術。

作者簡介:

林大貴

作者從事IT產業多年,涉獵系統設計、網站開發、數位行銷與商業智慧等多領域,具備豐富實務開發經驗。

TOP

目錄
Chapter01 大數據與機器學習
1-1 大數據定義
1-2 Hadoop 簡介
1-3 Hadoop HDFS 分散式檔案系統
1-4 Hadoop MapReduce 介紹
1-5 Spark 介紹
1-6 機器學習介紹

Chapter02 Virtual Box 虛擬機器軟體安裝
2-1 VirtualBox 下載安裝
2-2 設定Virtual Box 儲存資料夾
2-3 在VirtualBox 建立虛擬機器

Chapter03 Ubuntu Linux 作業系統安裝
3-1 下載Ubuntu 安裝光碟檔案
3-2 在Virtual Box 設定Ubuntu 虛擬光碟檔案
3-3 開始安裝Ubuntu
3-4 啟動Ubuntu
3-5 安裝Guest Additions
3-6 設定預設輸入法
3-7 設...
»看全部
TOP

商品資料
  • 作者: 林大貴
  • 出版社: 博碩文化股份有限公司 出版日期:2015-11-03 ISBN/ISSN:9789864340545
  • 語言:繁體中文 裝訂方式:平裝 頁數:528頁
  • 商品尺寸:長:230mm \ 寬:170mm
  • 類別: 中文書> 電腦
圖書評論 -   評分:
 「Hadoop+Spark大數...
轉載自博客來  極力推薦  2019/01/14
「Hadoop+Spark大數據巨量分析與機器學習整合開發實戰」一書,算是姐妹作「Python+Spark 2.0+Hadoop機器學習與大數據分析實戰」的前身。就是藉由許多實作的練習,一步步教導讀者學會使用Spark平台進行大數據分析以及機器學習預測。

Hadoop HDFS、Hadoop Map/Reduce等大數據重要觀念也一併收入到書中。不誇張地說,只要好好研習書中介紹的技術並且詳加練習,讀者將在大數據以及機器學習上打下了穩固的基礎。依時序來看以Python 語言為主的「Python+Spark 2.0+Hadoop機器學習與大數據分析實戰」才是續作,也反映出目前業界在機器學習領域中,Python儼然成為非正規的標準語言,有最多人投入研習與實作。

諷刺地是我反倒是先看完「Python+Spark 2.0+Hadoop機器學習與大數據分析實戰」之後,才再看「Hadoop+Spark大數據巨量分析與機器學習整合開發實戰」這本書。主要原因是透過PySpark開發出來的預測系統在執行效能上不甚理想。透過Python轉Py4J最後在Spark上執行中Context Switch,讓程式運算耗掉太多轉換時間,對於建置線上預測系統而言,是一大致命傷。因此只要回過頭來研究如何用Scala語言來開發Spark機器學習,畢竟Scala號稱能比PySpark快上數倍。

對於不在意採用Scala來實作機器學習的人,這本書不遜於Python的那本續作。只是因為此書出版較早,所以重點多在解說Spark RDD,而在Spark Dataframe的章節相對不足。另外開發工具也建議採用IDEA,不要使用書中介紹的Eclipse(Spark plugin)這樣就沒問題了。
 這本書我覺得還不錯,這本書的指...
轉載自博客來  極力推薦  2016/09/10
這本書我覺得還不錯,這本書的指令我都有執行過,大多都可以執行,並沒有買書的人與花錢買書的人,所說指令的錯誤不少的情況。
我使用書名google查詢發現這本書評價還不錯,而且還有多家大學採用作為教材,如果有指令的錯誤不少的情況,應該不會被大學採用。
以上提供參考
 內容很適合初學者 可惜指令的...
轉載自博客來  尚可  2016/07/01
內容很適合初學者  可惜指令的錯誤不少 特別是chapter 10之後的spark & ML 章節.
 適合初學者 但是指令錯誤不少...
轉載自博客來  尚可  2016/07/01
適合初學者  但是指令錯誤不少  特別是chapter11之後的spark & ML 章節
 有別於其他書,這本書提供了很多...
轉載自博客來  極力推薦  2016/05/11
有別於其他書,這本書提供了很多實作,而且是“實用的實作”,並且對於大家的問題,還有成立一個facebook的粉絲團,可以在上面發問,還有blog提供操作指令,讓我不用照著書上打,也不用怕打錯,降低入門的門檻,總之是本好書,真的,真心不騙。
贊助商廣告
 
金石堂 - 今日66折
我就是生活冒險王有聲書
作者:許添盛醫師主講
出版社:賽斯文化
出版日期:2018-08-01
66折: $ 792 
金石堂 - 今日66折
賽斯速成100有聲書 第1輯
作者:王怡仁
出版社:賽斯文化
出版日期:2017-03-10
66折: $ 858 
金石堂 - 今日66折
富足人生的12把金鑰有聲書﹝新版﹞
作者:許添盛主講
出版社:賽斯文化
出版日期:2015-08-10
66折: $ 792 
金石堂 - 今日66折
心靈的本質有聲書第 4 輯
作者:許添盛主講
出版社:賽斯文化
出版日期:2015-08-01
66折: $ 660 
 
Taaze 讀冊生活 - 暢銷排行榜
圖解英文文法的原理【暢銷修訂版】:看圖學文法不用背,一張圖就懂!用老外的思維理解英文!
作者:安正鳳
出版社:語研學院
出版日期:2020-04-09
$ 299 
Taaze 讀冊生活 - 暢銷排行榜
寶可夢 伽勒爾圖鑑(全)
作者:構成:川島潤二(十八VAN PLANNING) 設計:はやしだこーじ(CORNFLAKES)
出版社:青文出版社股份有限公司
出版日期:2025-01-13
$ 315 
Taaze 讀冊生活 - 暢銷排行榜
你願意,人生就會值得:蔡康永的情商課3
作者:蔡康永
出版社:如何出版
出版日期:2024-08-01
$ 316 
博客來 - 暢銷排行榜
真誠Be real, not perfect:從菜鳥助理到跨國企業CEO,關於職場、關係與人生的啟發
作者:楊佳燊 (Jason Yang)
出版社:商周出版
出版日期:2024-12-26
$ 316 
 
Taaze 讀冊生活 - 新書排行榜
山野花香(10)
作者:清風九度
出版社:北京億森同創文化
出版日期:2025-01-17
$ 59 
Taaze 讀冊生活 - 新書排行榜
山野花香(8)
作者:清風九度
出版社:北京億森同創文化
出版日期:2025-01-17
$ 59 
金石堂 - 新書排行榜
想要聽妳說妳喜歡我(全)
作者:竹嶋えく
出版社:青文出版社股份有限公司
出版日期:2025-01-22
$ 111 
博客來 - 新書排行榜
笑中帶淚的老後日常套書:《銀髮川柳1~3》(附贈「人生滋味」插畫書籤、「一起變老吧」新春賀年狀)
作者:日本公益社團法人全國自費老人之家協會 (公益社団法人全国有料老人ホーム協会, ポプラ社編集部)
出版社:三采
出版日期:2024-12-27
$ 562 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策