美國一名男子衝入他家附近的一家美國零售連鎖超市Target 店鋪(美國第三大零售商)進行抗議:「你們竟然寄給我17 歲的女兒嬰兒尿片和嬰兒推車的優惠券?」
一個月後,這位父親來道歉,因為這時他才知道他的女兒的確懷孕了。
總公司寄嬰兒尿片和嬰兒推車的優惠券的行為正是執行大數據挖掘的結果!
連鎖超市Target 比這位父親知道他女兒懷孕的時間足足早了一個月。
問卷調查是上一個世代的做法。
直接從顧客的行為分析出正確商業決策才是王道!
誰是潛在的客戶?
如何從消費者的習慣決定商品的架位。
怎麼辨別大量的偽造資訊?
當YB(10的24次方Bytes)等級的資料呈現在你眼前的時候,是否有能力從中擷取有意義的資訊就是現在成功的關鍵!
本書特色
本書全面地介紹了如何使用資料挖掘技術從各種結構的(資料庫)或非結構(Web)的巨量資料中提取和產生業務知識。作者整理了各種資料挖掘常用演算法和資訊採集技術,有系統地描述如何透過網誌分析、電子郵件行銷、網路廣告和電子商務進行網際網路上的巨量資料挖掘。
名人推薦
本書是一本極佳的教材。它從網際網路廣告的角度全面且有系統地介紹了資料採擷的基本概念、方法和技術以及資料採擷對網際網路廣告的實際意義,重點關注其可行性、有用性、有效性和可伸縮性問題。本書不僅適合作為資料採擷和知識發現課程的教材,也非常適合作為電子商務、資料採擷相關領域從業人員的參考資料。 ——復旦大學電腦學院 黃萱菁 教授
隨著大數據時代的到來,資料科學家這一專業職位變得炙手可熱。在2012 年10 月,《哈佛商業評論》甚至宣佈「資料科學家是21 世紀最性感的職業」。在本書中,作者以大量實際專案開發和培訓經驗為基礎,借助最新的網際網路應用案例,深入淺出地介紹了資料採擷領域的基本技術和常用工具。本書是資料科學家完美的入門讀物。 ——微軟亞洲研究院主管研究員 謝幸
大家都知道自己現在身處在一個資訊化的時代,我們每天從傳統的媒體(報紙、雜誌、電視,等等)以及新媒體(網際網路、網路論壇、Facebook⋯等等)獲取到大量資訊。在每天面對撲面而來的巨量資訊的同時,常常又有很多人在感歎對自己有用的或者能夠讓自己感興趣的東西似乎越來越少。本書也許會為你解開這種困惑。此書深入淺出的描述了時下炙手可熱的IT業界的幾個詞彙。作為一般的讀者可以把此書作為茶餘飯後的讀物,當你在同事朋友面前侃侃而談「大數據」、「資料採擷」等詞彙時,相信定能吸引周圍人的目光。當你明白資料是如何變成資訊,資訊又是怎麼再昇華為有用的資訊時,或許你的生活也會變得更加多姿多彩。此書也能幫助企業的經營人員更加深刻的理解如 何運用IT(資訊技術)提升企業的經營,讓IT 更有效的幫助企業決策千里。當然此書更能幫助我們這些IT 從業人員深入的考慮如何運用大數據挖掘技術開發出更好的產品或者解決方案,服務於各個企業,服務於我們的社會。 ——富士通(中國)公司 戰略規劃部總經理 黃邦瑜
隨著雲端時代的來臨,大數據也吸引了越來越多的關注。之前我對大數據的瞭解還停留在概念上,讀完本書讓我有了豁然開朗的感覺,明確了自己企業在大數據方向上的目標,也瞭解了相關的理論和方法。我相信很多關心大數據的朋友都會從書中受益良多。 ——鳳凰網CTO 吳華鵬
本書很認真實際的探討了一個說起來很容易,但是實際執行起來卻需要一個公司從上到下無縫配合才有可能完成的任務。能成功發揮大數據挖掘能力的公司/ 機構/ 政府,得到的優勢就等於在別人還在用指南針定位目標的時候,你已經裝備了衛星導航系統+ 雷達,做的決定變得更加快、狠、準。這會是一個大家都努力嘗試做大數據挖掘的時代,關鍵在於,誰能夠更瘋狂的熱愛資料,更理性的尊重數據。 ——小米科技聯合創始人,副總裁黃江吉 小米KKWong
大數據時代的到來讓世界變得越來越透明,自由民主是資訊社會的生態,無論是生活領域還是行政領域,大眾對透明的視覺化資料呈現都有迫切的需求,在企業決策、行銷決策、醫療、教育等各個領域都需要大數據。大數據流程行伊始,技術行業和學術界都非常需要優質的學習書籍,本書作者把自己的網際網路資料工作經驗與大數據行業發展結合,深入淺出,對行業發展有重大意義,是國內少見的網際網路前沿研究的精品之作。 ——Web 2.0 研究者,西瓜世界創始人 柳華芳
有人甚至說,「資料是新的石油」,大數據將徹底改變人類文明的發展脈絡,重塑我們對於世界、對於生活的認知。譚磊這本書很及時,很深刻的闡述大數據挖掘的各種方法,對於從事資料採擷的同行來說,是一本不可多得的好書。 ——盛大遊戲技術保障中心高級總監 陳桂新
認識Raymond 很多年,知道他技術很強,這次倒是第一次知道他的文筆也是如此好。大數據的重要性早已不言而喻,我們對此的關注度也是非常高。Raymond 的這本書深淺適中,既符合技術人員的需求,對於非技術的電商從業人員幫助也是很大的。 ——阿里巴巴集團資深總監 陳宜
本書是目前國內大數據挖掘類書籍中不可多得的,有理論有實戰,非常值得大數據時代的相關研究者閱讀。 ——騰訊開發高級總監 宋永柱
本書以一位經驗豐富的資料工程師的獨特觀點,以詳實的資料和深入淺出的論述揭示了大數據概念下的實際問題,專注於大數據的實用價值和方法,使之不再是虛幻時髦的炒作概念。不同於很多注重解釋演算法的資料採擷方面的書籍,本書從「為什麼」入手,以通俗易懂的案例展示了大數據領域的全貌,並很精準的把握了在大數據領域的基本概念和前沿技術。這本書不僅為初學者揭開了大經驗這一日趨重要領域的神秘面紗,也為專業人士提供了進一步深入研究的入口。 ——微軟研究院首席研究員 周禮棟博士
本書展示了資料採擷的基本理念和應用場景,能讓你在幾個小時內讀懂資料採擷,是進入大數據時代的一個敲門磚。 ——前騰訊產品總監,現火花無線CEO 吳國鴻
一場長跑競賽,並不是一開始衝在最前的人就可以獲得最後的冠軍,而是取決於戰術和耐力。對於網際網路產品而言也是如此。隨著巨量資料的堆砌,其在商業上的價值已經成為企業對未來發展的巨大依託。未來的網際網路不再是速度的對決,而是深度的較量!如何正確且深度挖掘資料背後蘊藏的寶藏,這本書將會給出大家希望得到的答案。 ——車鄰會、卡內網路科技創始人兼CEO 呂筍
幾年來大數據的運用,給商業世界帶來巨大影響。《紐約時報》報導過一個案例,美國超市Target 通過分析購買資料居然比她父親還要預先猜測出女孩懷孕的消息!而Target 正是運用資料採擷技術,有效提高了細分顧客群體的推廣行銷效果。本書涵蓋該領域相關的技術理論基礎概論,並且也提供以網際網路為主的各種商業大數據運用前沿的實例,具有很強的實際操作指導意義。對大數據趨勢感興趣的讀者,不管是技術人員,或者是管理人員,都能從這本書裡獲益。 ——前24 券團購網CTO,網際網路創業者 Bruce 黃海旻
資料就是一座巨大而未知的礦藏,是所有公司最值錢的財富之一,也是當下所有公司都想挖掘的秘密;資料是會說話的,關鍵是我們如何讀懂和理解他,本書能引導我們大家如何讀懂他,如何用他指導我們的產品運營和產品設計,如何做精準行銷,是非常值得推薦的一本資料分析類書籍。——著名網際網路資料庫架構師 金官丁
本書循序漸進地剖析了大數據挖掘演算法在搜索和廣告等方面的應用,理論描述深入淺出,應用案例非常精彩,網際網路專業知識豐富。本書適合作為搜索廣告等相關領域研發的參考手冊,也適合作為資料採擷及Web 應用的學習教材。 ——阿里巴巴資深技術專家 林鋒博士
資訊時代裡,資料對人類生活的影響和社會的掌控力在不斷被放大,理解和運用龐大規模的資料成為了一項雄心勃勃的計畫。本書探討了大數據時代前沿的熱點問題,描繪了大規模資料採擷在當前環境下的典型應用。有概念分析,也有操作實例,既是一本優秀的入門讀物,又適合業內人士隨時翻閱參考。 ——優酷資深工程師 章岑