圖書介紹 - 資料來源:博客來 目前評分: 評分:
圖書名稱:Splunk大數據分析
內容簡介
是介紹如何實時處理大數據並從中獲得商業價值的一本實用指南。《大數據技術叢書:Splunk大數據分析》通過真實的大數據分析項目,從數據導入、訪問、挖掘和可視化角度全面而系統地介紹splunk的基本概念和使用方法,以幫助讀者快速掌握splunk。 全書共16章,分為四個部分:第一部分(第1~7章)介紹splunk的基本操作,包括利用splunk進行數據收集、處理、分析及結果可視化等的基本操作和命令,以及使用日志文件創建高級數據分析報表的方法;第二部分(第8~11章)使用「航空公司准點性能數據」介紹一個典型的數據分析案例,詳細講解如何運用splunk深度挖掘現有數據倉庫,並介紹一些新的splunk命令和實用技巧;第三部分(第12~14章)詳細介紹如何收集、處理、分析推文和Foursquare的簽到信息等,涵蓋分析社會化媒體流數據所需的知識;第四部分(第15~16章)詳細介紹如何按需求擴展splunk,以及分布式處理和高可用性的基本概念。此外,還包括兩個附錄,展示splunk的性能以及各種可用的應用程序。 Peter Zadrozny,資深軟件技術專家,OpalliosS公司創始人兼首席技術官,專注於利用大數據和雲技術為客戶提供有價值產品。Peter還是聖荷西州立大學大數據相關課程的講師。他曾先后在多家大中型公司擔任行政和技術職務,並主導在歐洲開啟webLogic和在墨西哥啟動sun微操作系統。他在J2EE和性能工程領域有多部非常成功的著作,並且是流行開源項目Grinder的最初貢獻者。
目錄
譯者序 致謝 第1章 大數據和 1.1什麼是大數據 1.2非傳統的數據處理技術 1.3Splunk是什麼 1.4關於本書 第2章 將數據導入 2.1數據的多樣性 2.2Splunk如何處理多樣化的數據 2.2.1文件和目錄 2.2.2數據生成器 2.2.3生成樣本數據 2.2.4網絡資源 2.2.5Windows數據 2.2.6其他資源 2.3應用程序和附加組件 2.4轉發器 2.5小結 第3章 處理和分析數據 3.1了解組合訪問日志數據 3.2搜索和分析索引數據 3.3報表 3.3.1使用最多的瀏覽器 3.3.2排名前五的IP地址 3.3.3瀏覽量來源最多的網站 3.3.4有多少404事件 3.3.5有多少事件包含購買行為 3.3.6列出購買的商品 3.4排序 3.5過濾 3.6添加和評估字段 3.7聚合 3.8小結 第4章 結果的可視化 4.1數據可視化 4.2Splunk是怎樣處理可視化的 4.3.1制作每一個主機的GET和POST事件數量的圖表 4.3.2制作每一個產品類別的購買數和瀏覽數的圖表 4.3.3哪個產品種類受HTTP404錯誤的影響 4.3.4MyGizmoStore.com的購買趨勢 4.3.5事務持續時間 4.4.1最高購買數量的產品 4.4.2頁面瀏覽率和購買量 4.5使用GoogleMaps應用程序來可視化 4.7儀表盤 4.8小結 第5章 定義警報 5.1什麼是警報 5.2Splunk如何提供警報 5.2.1基於商品銷售量的警報 5.2.2登錄失敗的警報 5.2.3日志文件中關鍵性錯誤的警報 5.3小結 第6章 網站監測 6.1監測網站 6.2IT運作 6.2.1主機訪問量 6.2.2無內部訪問的主機訪問量 6.2.3HTTP請求成功的流量 6.2.4HTTP請求未成功的流量 6.2.5返回HTTP錯誤狀態碼最多的頁面 6.3業務 6.3.1區域用戶統計 6.3.2跳出率 6.3.3獨立訪問者數量 6.4小結 第7章 使用日志文件創建高級分析 7.1傳統的分析方法 7.2范式變更 7.3語義日志 7.4日志最佳實踐 7.5小結 第8章 航班准點率項目 小結 第9章 將航班數據導入 9.1處理CSV文件 9.1.1航班數據 9.1.2下載數據 9.1.3了解航班數據 9.1.4關於時間戳 9.1.5將字段映射成一個時間戳 9.1.6對所有航班數據建立索引 9.2從關系數據庫中索引數據 9.2.1定義一個新的數據庫連接 9.2.2數據庫監測 9.3小結 第10章 分析航空公司、機場、航班和延遲 10.1分析航空公司 10.1.1計算航空公司的總數 10.1.2可視化結果 10.2分析機場 10.3分析航班 10.4分析延遲 10.4.1各航空公司航班延遲情況 10.4.2各機場航班延遲的原因 10.4.3冬天與夏天的航班延遲情況 10.5創建和使用宏命令 10.6報告加速 10.7加速統計 10.8小結 第11章 分析一個特定航班的歷年數據 11.1航空公司名稱 11.1.1字段查找自動化 11.1.2從搜索中創建查找表 11.2Unitedflight871航班 11.3小結 第12章 分析推文 12.1開發樣本流 12.2將推文加載到Splunk中 12.4最流行的單詞 12.5實時的Twitter趨勢 12.6小結 第13章 分析Foursquare簽到信息 13.1簽到信息格式 13.2時區注意事項 13.3裝載簽到數據 13.4分析簽到信息 13.4.1星期日早午餐搜索 13.4.2Google地圖和熱門地點 13.4.3地點的簽到模式 13.4.4地點的簽到數量 13.4.5分析性別活動 13.5小結 第14章 情感分析 14.1意見、觀點、信仰、信念 14.2商業用途 14.3情感分析的技術性工作 14.4情感分析應用程序 14.4.1全局性的命令 14.4.2挖掘情感 14.4.3語言的處理 14.4.4訓練數據和測試數據 14.5世界情緒指數項目 14.5.1收集RSS摘要 14.5.2將新聞標題索引到Splunk中 14.5.3定義情感語料庫 14.5.4對結果進行可視化 14.6小結 第15章 遠程數據收集 15.1轉發器 15.1.1流行的拓撲結構 15.1.2安裝轉發器 15.2部署服務器 15.2.1配置部署服務器 15.2.2配置轉發器 15.3部署監控 15.4小結 第16章 可擴展性和高可用性 16.1擴展 16.2聚類 16.3小結 附錄A Splunk的性能 附錄B 有用的Splunk應用程序
詳細資料
ISBN:9787111464297規格:291頁 / 普通級 / 1-1 出版地:大陸
作者:日本VOGUE社編著
出版社:Elegant-Boutique新手作
出版日期:2022-03-23
66折: $ 251
66折: $ 198
作者:林哲璋
出版社:小天下
出版日期:2020-03-27
66折: $ 680
作者:楊沁弦
出版社:幸福文化
出版日期:2023-10-13
66折: $ 264
作者:金芝惠
出版社:台灣廣廈
出版日期:2022-01-21
$ 247
作者:古舘春一
出版社:東立
出版日期:2020-08-07
$ 93
作者:峰浪りょう
出版社:青文出版社股份有限公司
出版日期:2024-01-18
$ 119
作者:佛蘭克.赫爾
出版社:智言館
出版日期:2014-04-01
$ 187
作者:くゥ
出版社:青文出版社股份有限公司
出版日期:2024-05-09
$ 111
作者:陳郁如
出版社:親子天下股份有限公司
出版日期:2024-04-30
$ 266
作者:チ点日子
出版社:長鴻出版社(漫畫)
出版日期:2024-04-10
$ 120
作者:廣嶋玲子
出版社:親子天下股份有限公司
出版日期:2024-04-30
$ 245