任何人都不該錯過的一本書!大數據浪潮來襲,在巨量、繁雜的資料之中掏選出黃金資訊,已經成為現今最兵家必爭之顯學,大數據的應用幾乎是全方位,技術和工具也不斷推陳出新,現今管理與行銷方法跟思維勢必也要經歷一番徹底的更新,沒錯!如何有效應用大數據是傳統電子商務業者的重要課題,也將成為未來電子商務趨勢所在。誰能夠迅速地掌握關鍵,誰就可以成為未來電子商務的掌舵手!
本書為東吳大學巨量資料管理學院許晉雄副院長與鄭江宇教授聯合著作,蘊含其涵養多年的專業知識與豐富的教學經驗編寫而成,也是國內第一本由大數據專業教學領域學者書寫的大數據應用與實務工具書,不論是理論或是實務操演,內容上都十分的詳實而完備,用字遣詞上也非常平易近人,即使沒有資訊背景、不會寫程式也能一讀就懂。本書非常適合當作大數據的第一本入門書,然其內涵與獨樹一格的分析也能對相關領域的人帶來一定的影響力。
本書重點:
認識大數據!告訴你大數據如何影響我們日常生活?大數據如何成就電子商務4.0?
運用免費工具蒐集巨量資訊!一步步教你如何使用網路爬蟲Python Crawler、Power BI、IBM Watson使用實際操演畫面的步驟化教學,跟著老師做,一定能學會!
活用免費網路資源分析巨量資訊!使用Google Analytics與SimilarWeb兩大利器,全方位掌握使用者的網路足跡就能化為商機!
如何從日常生活中觀察大數據電子商務機會與前景?生活化的舉例讓你輕鬆觸類旁通,成為下一個大數據電子商務人才不是夢!
作者簡介:
鄭江宇
現任
東吳大學巨量資料管理學院專任助理教授
台北科技大學工管系兼任助理教授
台灣金融研訓院遴選菁英講座
著作:
《指尖下的大數據:運用Google Analytics發掘行動裝置裡的無限商機》
《流量分析與考題大揭秘:Google Analytics》
許晉雄
現任 東吳大學巨量資料管理學院副院長兼學位學程主任
東吳大學財務工程與精算數學系教授
經歷
東吳大學商用數學系副教授
東吳大學商學院商學進修學士班主任
台灣科技大學工業管理系兼任副教授
實踐大學企業管理系兼任副教授
工研院講師
成功大學管理顧問班講師
東吳大學發展處處長
東吳大學社會資源處處長
章節試閱
1-1 何謂大數據
大數據 (Big Data) 一詞最早出現在 2012 年 Viktor Mayer-Schönberger&Kenneth Cukier 兩位的著作《大數據時代:生活、工作與思維的大變革》當中,書裡提到所謂大數據指的是 4V 數據特性,包含數量龐大 (volume)、產生速度快 (velocity)、形式多樣 (variety) 且具有價值 (value) 的資料。茲將此四大特性說明如下:
數量龐大 (volume)
Volume 原意為一個有形物體或容器內的空間容量,例如:某一輛汽車的油箱容量為 60 公升,若能夠將油箱擴大,那麼就可以存放更多的汽油來延長汽車續航力。在大數據世界裡,volume 卻屬於一個抽象概念,好比一個沒有刻度的量杯一樣,並無具體資料容量上限。試想,在這個世界上有幾個網站呢?而在這龐大網站量中流竄的全球網路流量又有多少呢?答案想必是非常驚人!在大數據裡,volume 其實就是指數量龐大的網路資料。
以傳統電子商務時代而言,或許網路資料僅局限於來自網站的流量,然而近年來受惠於行動網路普及,由行動裝置所產生的網路流量不約而同的加入貢獻 volume 的行列,甚至是近年流行的物聯網也不例外,在萬物皆可連網情況下,儼然扮演額外的網路流量供應者,因此我們也可以把大數據的數量龐大(volume) 特性視為「浩瀚網路容器中的無垠數據」。再舉一個生活中常見的龐大數量 (volume) 案例,大家平常在使用手機上網的時候可能會遇到一種情況,那就是上網流量超過電信業者合約中的限額。以 1G 流量限額來說,若將流量使用完畢,等同於自己在智慧型手機上閱讀了上千本電子書的內容,然而實際上的流量限額不只有 1G,甚至有不少人是使用吃到飽方案,那麼在沒有限制的情境下比喻成電子書閱讀數量恐怕更難以計算。
產生速度快 (velocity)
大數據的產生可以說是一年三百六十五天、一天二十四小時不斷的發生著。若以資料在網上流動的速度而言,不妨試著想想看在簡單的 LINE 對話過程裡 (傳訊方是上傳、收訊方是下載),自己一天當中發生過幾次一來一往的傳送與接收訊息呢?如果將此單一個人每天傳訊的流動頻率放眼至全世界的LINE 用戶的話,LINE 公司的伺服器主機一天當中又得服務多少用戶傳送與接收訊息需求呢?然而這只是眾多大數據資料流動的一個小案例,在人們日常生活中,只要所從事的活動涉及到網路,就等同於隨時產生資料流動,也就是達到資料即時性 (real-time)。
以傳統電子商務來說,在過去受限於硬體處理能力或是資料分析技術上的瓶頸,往往只能透過顧客關係管理系統 (Customer Relationship Management,CRM) 來將消費者的交易紀錄進行歷史性事後分析。例如:業者可以透過RFM 分析來匯總顧客最近一次交易日期 (recency)、交易頻率 (frequency) 以及交易金額 (monetary),然而這一切以大數據電子商務的觀點來看,恐怕是太後知後覺了。換句話說,當消費者每分每秒不斷的進行資料傳送與接收時,相關業者有必要以「即時」或是「趨近即時」的作為來回應消費者需求,例如:依據消費者過去交易紀錄以及當下的網站訪問行為,電子商務業者可以針對特定顧客投放即時性的專屬優惠資訊。
形式多樣 (variety)
在日常生活中常見的資料多數屬於數字形態的結構化資料,例如:溫濕度、學期總平均、股票交割金額等。然而大數據並非僅局限在數字形態資料,它還包括許多非結構化的資料,例如:聲音、視覺焦點、臉部表情等。在傳統電子商務情境中,結構化資料一樣是較為常見的資料,像是顧客交易額、訪客網站瀏覽次數、網站跳出率等。時至今日,受惠於許多資料截取技術突飛猛進,使得新形態電子商務得以將過去無法捕捉的資料進行「非結構化→結構化」的轉換處理。舉例來說,若某電子商務網站想要得知其訪客的目光焦點(即訪客進站後的網站內容瀏覽重點),可以在徵求顧客同意的前提下,請他們在自己電腦上安裝眼動拍攝儀,藉此將目光焦點這樣的非結構化資料轉換為結構化資料,如此,電子商務網站業者便能得知訪客是如何被自己網站的內容吸引 (如圖 1-2)。類似方式也被使用在新型態的零售業上,知名連鎖超商業者 7-11 於日前在各店結帳櫃台後方掛上液晶螢幕 (如圖 1-3),在播放商品廣告之餘,同時也利用螢幕上視訊鏡頭記錄顧客觀看時的眼球活動,此舉不但能夠有效的化解顧客排隊結帳時的不耐煩,也巧妙的捕捉到非結構化數據,從而能夠針對眼球停留秒數與臉部表情辨識結果來提供精準的商品推薦。
價值 (value)
資料必須經過轉化才能成為具有價值的數據。這個道理就好比平常政府所宣導的資源回收一般,把看似無用的垃圾加以分類處理,就可以回收再利用、垃圾也能變黃金。對傳統電子商務業者而言,僅僅是針對單一數據來蒐集與分析較難察覺到其中的數據價值。例如:某電子商務網站記錄了「訪客進站次數」,然而此單一數據充其量只能描述一個網站所獲得的訪客數多寡,無法再進一步針對此數據給予延伸性的詮釋。此時若加入其他數據一同探討,那麼數據價值即可逐漸明朗。例如:除了「訪客進站次數」這個單一數據之外,該業者額外記錄了「訪客進站日期」,若將此兩項數據合併探討,也就是「訪客進站次數」+「訪客進站時段」,則可以交織出圖 1-4 矩陣,如此便能針對四個象限給予更深度的詮釋,因此資料轉化力 (data derivability) 對於數據價值之影響不可小覷。
很遺憾的,受到大數據資料特性的影響〔即數量龐大 (volume)、產生速度快 (velocity)、形式多樣 (variety)〕,資料轉化力之培養更是極具挑戰。換句話說,如何能夠在形式多樣且產生速度快的龐大數據中,轉化出有價值的數據將會是一項艱難的挑戰。下圖 1-5 為 Miller & Mork1 兩位學者於 2013 年所提出的資料價值鏈 (Data Value Chain, DVC),共計有三大階段,每一階段附帶著該
環節應有的資料作為,敘述如下:
(1) 資料探索階段 (data discovery)
由於大數據的來源非常多,甚至不同的資料來源所呈現的資料型態也不盡相同,資料價值鏈中的首要階段就是針對不同資料來源,建立適合它們存放的場所,同時也要針對多種資料來源存放場所給予詮釋說明。這就好像一個大倉
庫中有許多小倉庫的概念,每一個小倉庫存放不同器具、原料或工具,也許是固態原料,又或許是液態原料,它們各自有合適的存放方式,為了能夠順利的在大倉庫快速找到所需使用的原料,那麼在每一個小倉庫上標記內容物敘述,就顯得非常必要。除此之外,由於小倉庫內容物的型態各有不同,因此管理者必須針對這些不同內容物制定領用規則,如此才能確保整體大倉庫的運作,而這些作為正是為了順利產出資料價值所必須的資料探索階段。
(2) 資料整合階段 (data integration)
資料整合階段的任務就是將第一階段的各式資料來源探索結果予以整合,形成一個類似大腦中樞概念,以便將不同資料在相同形式下順利呈現。舉例來說,若要讓管理員能夠有效率的管理在大倉庫中的每一個小倉庫,提供他們統
一且具有綜觀效果的管理介面,將有其必要性。然而這個管理介面除了要能夠對外呈現一致性的資料表達之外,還要能夠隨著小倉庫的內容物改變而將最即時、最精準數據提示給管理員。
(3) 資料利用階段 (data exploitation)
經過上兩個階段的努力之後,資料利用階段的任務就是要把所獲得的資料予以正確的分析,並且將分析結果提供給資料需求者。例如:大倉庫管理員除了擁有上一階段所提到的良好管理介面之外,若能夠將各個小倉庫內容物的變化情況予以彙整並且進行資料的預測分析與視覺化,那麼倉庫管理員便能夠從分析結果中判斷未來可能的小倉庫內容物異動,甚至可以將這些數據結論提供給高階主管供其決策制定參考,此時倉庫管理員受惠於資料妥善利用,便可著實扮演決策者與資料之間的友善之橋,從而讓數據價值逐漸浮現。
綜合以上說明得知,大數據可以說是包山包海,幾乎任何形式的數據皆可視為一種大數據。既然大數據的範疇如此廣泛,傳統電子商務業者自然不會放過任何可以應用大數據的機會。套一句阿里巴巴總裁馬雲說過的一句話:「做
淘寶不是賣貨,而是為了獲得數據。」從這席話,我們就可以推敲出數據對於電子商務之重要性,就好比魚要生存不能離開大海一般,這也是為什麼有些電子商務業者可以善用數據、從數據裡淘金,但有些業者卻無法從中洞察出數據價值與機會。有鑑於此,下一節我們將更具體介紹大數據能夠在電子商務上帶來哪些前所未有的新應用,以及這些新興應用對於傳統電子商務之影響為何。
1-1 何謂大數據
大數據 (Big Data) 一詞最早出現在 2012 年 Viktor Mayer-Schönberger&Kenneth Cukier 兩位的著作《大數據時代:生活、工作與思維的大變革》當中,書裡提到所謂大數據指的是 4V 數據特性,包含數量龐大 (volume)、產生速度快 (velocity)、形式多樣 (variety) 且具有價值 (value) 的資料。茲將此四大特性說明如下:
數量龐大 (volume)
Volume 原意為一個有形物體或容器內的空間容量,例如:某一輛汽車的油箱容量為 60 公升,若能夠將油箱擴大,那麼就可以存放更多的汽油來延長汽車續航力。在大數據世界裡,volume 卻屬於...
推薦序
本人在擔任政務官期間即不斷的大聲疾呼台灣必須邁向大數據時代,期間亦鼓勵各政府機關積極開放所擁有之大數據,唯有如此,才能從數據開放中促進大數據脈動,強化台灣在國際上競爭力。欣聞東吳大學巨量資料管理學院許晉雄副院長、鄭江宇助理教授出版《成為大數據電子商務人才的第一本書》一書,從內容中讓人感受到兩位作者為了台灣大數據的努力,不懈不待、令人感佩!值得一提的是,本書內容除與本人過去所提及的多項大數據應用不謀而合之外,兩位作者更將全書定位在電子商務的大數據知識傳達與推廣,此定位呼應了當前台灣社會所需的軟實力驅動要件。全書最令人感到印象深刻的是每一章節的理論與實務個案,再加上作者們精心規劃的實作教學,想必能讓讀者學以致用。在此向廣大讀者推薦這本難得的理論與實作兼顧之著作,讓我們一同為台灣大數據應用、電子商務轉型來努力!
前行政院長 張善政
本人在擔任政務官期間即不斷的大聲疾呼台灣必須邁向大數據時代,期間亦鼓勵各政府機關積極開放所擁有之大數據,唯有如此,才能從數據開放中促進大數據脈動,強化台灣在國際上競爭力。欣聞東吳大學巨量資料管理學院許晉雄副院長、鄭江宇助理教授出版《成為大數據電子商務人才的第一本書》一書,從內容中讓人感受到兩位作者為了台灣大數據的努力,不懈不待、令人感佩!值得一提的是,本書內容除與本人過去所提及的多項大數據應用不謀而合之外,兩位作者更將全書定位在電子商務的大數據知識傳達與推廣,此定位呼應了當前台灣社會所需的軟實力...
作者序
電子商務在台灣發展至今已二十餘年,期間歷經許多外在情勢變化,其中最明顯的改變有連網設備普及、連網費用下降、智慧型手機普及等,這些都表明了電子商務正走在一條不斷進化的道路上。近年來大數據概念興起,使得電子商務的大數據相關應用呈現多元化趨勢。這意味著,大數據或是電子商務早已是一項跨領域之技能。有感於市面上大數據電子商務相關書籍多數局限於概念傳達,即便是實作型書籍也過於艱深難懂。有鑑於此,本書兩位作者協同各自跨領域專長及校內教學經驗,共同撰述符合資訊、商管、財務金融或社會科學領域適用之大數據電子商務教材。此《成為大數據電子商務人才的第一本書》一書共計有五大篇 15 個章節,每一章節皆包含理論、個案與實作,特別是在實作部分大量採用免費或試用版軟體,期許廣大讀者能以最低成本吸收大數據電子商務新知。再者,為了因應大數據電子商務的持續進化,本書內容廣泛的將輿情探索、網路爬蟲、社群網路分析、網站流量分析、超音波非主動式推播、AR 擴增實境、資料視覺化以及智慧客服機器人等議題納入,這些議題在大數據電子商務中皆屬重要應用,本書手把手的教導讀者,使讀者能夠從中學習到實務技能,進而縮小學用落差。2018 年正值大數據應用的衝刺階段,相信讀者從本書內容中可以收獲許多大數據電子商務知識,使大家得以順利的銜接大數據盛世。
鄭江宇、許晉雄 謹誌
東吳大學巨量資料管理學院
電子商務在台灣發展至今已二十餘年,期間歷經許多外在情勢變化,其中最明顯的改變有連網設備普及、連網費用下降、智慧型手機普及等,這些都表明了電子商務正走在一條不斷進化的道路上。近年來大數據概念興起,使得電子商務的大數據相關應用呈現多元化趨勢。這意味著,大數據或是電子商務早已是一項跨領域之技能。有感於市面上大數據電子商務相關書籍多數局限於概念傳達,即便是實作型書籍也過於艱深難懂。有鑑於此,本書兩位作者協同各自跨領域專長及校內教學經驗,共同撰述符合資訊、商管、財務金融或社會科學領域適用之大數據電子商務教...
目錄
推薦序
序
Part 1 大數據與電子商務
Chapter1 大數據崛起與電子商務變革
1-1何謂大數據
1-2大數據對傳統電子商務之影響
1-3大數據成就新電商4.0
1-4大數據電商營運模式
Chapter2大數據電商技能與挑戰
2-1 微觀視角
2-2 鉅觀視角
Chapter3大數據電商機會與前景
Part 2 大數據電子商務之輿情探索
Chapter4站外情報探索
4-1 谷歌搜尋趨勢Google Trends
4-2谷歌消費者氣壓計Google Consumer Barometer
4-3網路爬蟲Python Crawler
Chapter5站內情報探索
5-1購物籃分析運作
5-2 購物籃分析之R語言實作
Chapter6社群情報探索
6-1 Power BI安裝與設定
6-2臉書資料探索 (具管理權限)
6-3臉書資料探索 (不具管理權限)
6-4 IBM Watson 社交情報探索
Part 3 大數據電子商務之數位足跡掌握
Chapter7深度流量分析 (Google Analytics)
7-1傳統網站HTML程式碼安裝
7-2套版式網站安裝
Chapter8廣度流量分析 (SimilarWeb)
8-1 SimilarWeb (自我網站絕對分析)
8-2 SimilarWeb (他人網站相對分析)
Chapter9行動流量分析 (iBuildApp)
9-1行動流量分析理論依據
9-2網站型APP製作
9-3 iBuildApp之GA嵌入
Part 4 大數據電子商務之資訊濃縮與獲取
Chapter10主動式掃碼互動
10-1一維條碼
10-2二維條碼
10-3個性化QR-Code製作
10-4掃碼行為分析
Chapter11主動式擴增實境
Chapter12非主動式超聲波互動
Part 5 大數據電子商務之善用情報資料視覺化與人工智慧
Chapter13 跨境電商情報探查利器
Chapter14大數據資料視覺化呈現
14-1程式碼嵌入式
14-2 GUI介面式
Chapter15智慧語音客服訂單不漏接
結語
推薦序
序
Part 1 大數據與電子商務
Chapter1 大數據崛起與電子商務變革
1-1何謂大數據
1-2大數據對傳統電子商務之影響
1-3大數據成就新電商4.0
1-4大數據電商營運模式
Chapter2大數據電商技能與挑戰
2-1 微觀視角
2-2 鉅觀視角
Chapter3大數據電商機會與前景
Part 2 大數據電子商務之輿情探索
Chapter4站外情報探索
4-1 谷歌搜尋趨勢Google Trends
4-2谷歌消費者氣壓計Google Consumer Barometer
4-3網路爬蟲Python Crawler
Chapter5站內情報探索
5-1購物籃分析運作
5-2 購物籃分析之R語言實作
Chapter6社群情報...