購物比價找書網找車網
FindBook  
 有 5 項符合

Python+Spark 2.0+Hadoop機器學習與大數據分析實戰

的圖書
Python+Spark 2.0+Hadoop機器學習與大數據分析實戰 Python+Spark 2.0+Hadoop機器學習與大數據分析實戰

作者:林大貴 
出版社:博碩文化股份有限公司
出版日期:2016-10-04
語言:繁體書   
圖書介紹 - 資料來源:TAAZE 讀冊生活   評分:
圖書名稱:Python+Spark 2.0+Hadoop機器學習與大數據分析實戰

◆本書淺顯易懂的原理說明
◆Step by Step實機操作
◆範例程式詳細解說
◆大幅降低機器學習與大數據技術的學習門檻

機器學習正熱門
機 器學習是近20多年興起的多領域學科,機器學習演算法可從大量數據中建立模型,並利用模型對未知數據進行預測。近年來各大公司google、 facebook、microsoft、IBM…等,全力投入機器學習研究與應用,以Google為例,Google早已將機器學習,運用在垃圾郵件判 斷、自動回覆、照片分類與搜尋、翻譯、語音辨識等功能。在你在不知不覺中,機器學習已經讓日常生活更便利。

「大數據」與「機器學習」相輔相成
大 數據的特性: 大量資料、多樣化、速度快。因此如何從大量資料中擷取出有用的資訊,是大數據的主要課題。機器學習需要大量資料進行訓練,並且訓練過程需大量運算。正好大 數據的興起帶來大量資料,以及可儲存大量數據的分散式儲存技術,例如:Hadoop HDFS、NoSQL..。還有分散式運算可進行大量運算,例如Spark 基於記憶體內的分散式運算框架,可以大幅提升效能。

Python與Spark與Hadoop的完美結合
本 書的主題是Python+Spark+Hadoop機器學習與大數據分析:使用Python開發Spark應用程式,具有多重好處,既可以享有 Python語言特性所帶來的好處:程式碼簡明、易學習、高生產力的特質。再加上Spark基於記憶體內的分散式運算框架,非常適合需多次重覆運算的機器 學習演算法,可以大幅提升效能。Spark可輕易讀取Hadoop分散式儲存技術HDFS。Spark也可以在Hadoop 新MapReduce架構YARN執行。

Python與Spark機器學習與資料視覺化
Python資料分析的相 關模組如NumPy、Matplotlib、Pandas、Scikit-learn,讓Python成為資料分析主要語言之一。使用Python開發 Spark機器學習應用時,你仍然可以繼續使用這些模組,這對於Python開發者帶來很大的方便,例如:你可以使用Spark ML Pipeline機器學習、訓練、預測。並且可以將Spark DataFrames轉換為Pandas DataFrame。轉換後你就可以運用Python豐富的資料視覺化套件,例如matplotlib、Bokeh…等,進行資料視覺化。

本書特色:實機操作建置Spark+Hadoop機器學習與大數據平台
一般人學習大數據的困難是,沒有多台機器建立分散式系統,但是透過本書介紹使用Virtual Box虛擬機器的方法,就能在自家電腦演練建立Hadoop叢集,並且建立Python Spark機器學習開發環境。

本書特色:以實務範例程式學會Python+Spark機器學習與大數據
以 大數據實務案例MovieLens(電影喜好推薦引擎)、StumbleUpon (網頁二元分類)、Covtype(森林覆蓋多元分類),BikeSharing(類Ubike租借數量迴歸分析),介紹如何使用Python Spark運用機器學習演算法:決策樹、邏輯迴歸、支持向量機器SVM、單純貝氏。進行資料處理、訓練、建立模型、訓練驗證找出最佳模型、預測結果。

作者簡介:

林大貴

作者從事IT產業多年,涉獵系統設計、網站開發、數位行銷與商業智慧等多領域,具備豐富實務開發經驗。近年來,開始從事書籍創作與教學,著重在人工智慧、機器學習、大數據等領域,並著有暢銷書《Hadoop+Spark大數據巨量分析與機器學習整合開發實戰》一書。

TOP

目錄

Chapter01 Python Spark機器學習與Hadoop大數據
1.1 機器學習介紹
1.2 Spark介紹
1.3 Spark資料處理RDD、DataFrame、Spark SQL
1.4 使用Python開發Spark機器學習與大數據應用
1.5 Python Spark 器學習
1.6 Spark ML Pipeline機器學習流程介紹
1.7 Spark 2.0介紹
1.8 大數據定義
1.9 Hadoop簡介
1.10 Hadoop HDFS分散式檔案系統
1.11 Hadoop MapReduce介紹
1.12 結論

Chapter02 Virtual Box虛擬機器軟體安裝
2.1 VirtualBox下載安裝
2.2 設定Virtual Box儲存資料夾
2.3 在VirtualBox建立虛擬機器
2....
»看全部
TOP

商品資料
  • 作者: 林大貴
  • 出版社: 博碩文化股份有限公司 出版日期:2016-10-04 ISBN/ISSN:9789864341535
  • 語言:繁體中文 裝訂方式:平裝 頁數:576頁
  • 商品尺寸:長:230mm \ 寬:170mm
  • 類別: 中文書> 電腦> 程式語言
贊助商廣告
 
金石堂 - 今日66折
靈魂永生有聲書第5輯
作者:許添盛
出版社:賽斯文化
出版日期:2014-10-05
66折: $ 581 
金石堂 - 今日66折
啟動內在感官的十二堂課第2輯:健康.活力﹝新版﹞
作者:陳嘉珍
出版社:賽斯文化
出版日期:2018-08-15
66折: $ 211 
金石堂 - 今日66折
早期課1有聲書第2輯
作者:許添盛、李宜懃
出版社:賽斯文化
出版日期:2020-04-01
66折: $ 660 
金石堂 - 今日66折
未知的實相有聲書第 3 輯(新版)
作者:許添盛
出版社:賽斯文化
出版日期:2017-05-01
66折: $ 660 
 
金石堂 - 暢銷排行榜
SPY×FAMILY 間諜家家酒 14
作者:遠藤達哉
出版社:東立出版社
出版日期:2025-02-04
$ 94 
博客來 - 暢銷排行榜
ONE PIECE航海王 110
出版日期:2024-12-27
$ 97 
博客來 - 暢銷排行榜
生命中最大的寶藏就是你自己Stand by Yourself
作者:曾寶儀
出版社:天下文化
出版日期:2024-10-31
$ 331 
Taaze 讀冊生活 - 暢銷排行榜
學自然發音不用背【QR碼隨身學習版】 :看字發音、聽音拼字,單字馬上就記住!
作者:DORINA
出版社:國際學村
出版日期:2015-03-20
$ 224 
 
Taaze 讀冊生活 - 新書排行榜
蔚藍檔案 便利屋68業務日誌(02)
作者:蔚藍檔案
出版社:尖端出版
出版日期:2025-02-11
$ 168 
博客來 - 新書排行榜
不時輕聲地以俄語遮羞的鄰座艾莉同學 (9)
作者:燦燦SUN
出版社:台灣角川
出版日期:2025-02-06
$ 197 
金石堂 - 新書排行榜
請解開故事謎底 04
作者:花於景(雷雷夥伴)
出版社:魔豆文化有限公司
出版日期:2025-02-05
$ 150 
金石堂 - 新書排行榜
雙層壓克力吊飾《吾命騎士》三杯就倒?
作者:御我
出版社:原動力文化事業有限公司
出版日期:2025-02-12
$ 270 
 

©2025 FindBook.com.tw -  購物比價  找書網  找車網  服務條款  隱私權政策