三井住友海上集團開發!
菜鳥也可以無痛升級資料科學家的──
★大數據分析實戰指南★
除了告訴你「應該做什麼」,
還告訴你「什麼不能做」!
商品開發‧銷售策略‧KPI應用
◎什麼是「資料科學家」(Data Scientist)?
「資料科學家」(Data Scientist)是資料分析團隊的核心。一個完整的資料分析團隊係由工程師、行銷、分析師,並由資料科學家銜接「數據」「解讀」與「應用」三個層面。讓「資料」不再只是單純的數據,而是能用在商品開發、銷售策略、檢視反省等實際層面上。
但大多數的企業,無法負擔「完整的」資料分析團隊。所以,往往擁有分析、行銷甚至是工程師背景的「資料科學家」,就成為企業徵求相關人才時的首選。
Point:根據日本「資料科學家協會」的調查,企業想招聘的資料科學家類型,有四○%的企業為行銷人才、三六%為工程師人才、二四%為分析師人才。
◎5個D開頭字母,讓數據、資料變成業績!
從找需求到開發產品、行銷、銷售,全部都能搞定的實戰技巧
想開發一個新產品、發想一個新專案,首先必須找到需求;有需求才有商機,有商機才有行銷與銷售發揮的空間。但如何避免靠直覺、靠經驗摸索,在成功之前先繳出大筆學費?
三井住友海上集團的4位資料科學家,將自己的經驗轉化為以5個D開頭字母構成的框架:
(1)Demand(需求):詢問需求
(2)Design(設計):描繪整體輪廓
(3)Data(資料):收集資料
(4)Develop(開發):分析資料
(5)Deploy(部署):展示資料
並結合實際的成功、失敗經驗,找出「應該做什麼」與「不該做什麼」,導出從找需求到開發產品、行銷、銷售,全部都能搞定的實戰技巧。跳過摸索期,用最有效率的方式將數據、資料變現,打造業績金雞母!
◎跨領域發展必備!
《Fortune》五○○大企業、日本知名跨國金融集團的實戰指南
本書由隸屬於《Fortune》五○○大企業、日本知名跨國金融集團MS&AD保險集團控股旗下的三井住友海上保險的數位戰略部撰寫而成。其中成員除了是現役資料科學家,並擁有電商、零售、通信、IT等產業豐富從業經驗。
如果你是:
行銷、銷售、IT領域▶想外掛數據分析技術
工程師、分析師▶想外掛開發、銷售實務應用
三井住友海上集團開發、並實證有效的跨領域實戰指南,讓你用最無痛的方式快速上手、成為最搶手的跨領域人才!
作者簡介:
木田浩理Hiromasa Kida
三井住友海上火災保險 數位戰略部‧首席資料科學家
一九七九年出生。慶應義塾大學總和政策學部/慶應義塾大學研究所政策、媒體研究科畢業。曾任職於NTT東日本、SPSS/日本IBM、亞馬遜日本、百貨公司、通信販售企業等,自二○一八年五月於三井住友海上火災保險任職至今。在各式各樣不同的業界累積業務和資料分析的經驗。根據顧客的觀點進行CRM和市場行銷分析,專攻運用資料開發新市場。
伊藤豪Go Ito
三井住友海上火災保險 數位戰略部‧首席資料科學家
一九八一年出生。早稻田大學商學部畢業。任職於SPSS/日本IBM約十年左右,擁有軟體業務和資料分析相關顧問經驗。之後轉職至通信販售企業負責資料分析,跨足顧客、市場和廣告等各項領域的資料分析,同時也負責CRM和商品改善。自二○一九年任職至現在。
高階勇人Yuto Takashina
三井住友海上火災保險 數位戰略部‧資深資料科學家
一九八一年出生。二○○七年自早稻田大學研究所文學研究科心理學科畢業後,進入構造計畫研究所。擁有資料分析相關顧問經驗。以顧客的角度,歷經製造業、通信業、自治團體和大學等,各種不同業界的資料分析。此外,也曾參加行動經濟學等領域的學會發表。自二○一八年任職至今。
山田紘史Hiroshi Yamada
三井住友海上火災保險 數位戰略部‧資深資料科學家
一九八五年出生。二○一○年自中央大學研究所理工學研究科畢業後,進入Dentsu e-marketing One Inc.(現為 Dentsu Digital Inc.)。負責活用市場行銷領域的資料驗證策略成效。之後也曾任職於市場行銷顧問公司,以及自由接案分析師。自二○一九年任職至今。
譯者簡介:
金鐘範
淡江大學日文系畢業,曾於日本京都同志社大學留學一年。因遇見乙一《夏天、煙火、我的屍體》而愛上閱讀,愛上日本小說。現為兼職譯者。
作者序
前言 不需要成為「資料科學家」也沒關係
三十歲・文科生・業務。這是十年前我(木田)身上所貼的標籤。當時的我是一名「統計軟體」的業務。我本身並不是統計學的專家,只是湊巧負責的商品是「統計軟體」。那時是「大數據」一詞尚未普及的時代,因緣際會之下我對「資料分析」產生興趣,因而開始自學統計方法及資料分析。現在的我是一位資料科學家,任職於三井住友海上火災保險株式會社,是一家損害保險公司。
不論是誰都有機會成為資料分析人才
雖說我是恰巧踏入「資料分析」的世界,但如今被資料所圍繞的社會環境變化之大,十年前甚至無法想像現今的我們會將「資料非常重要」視為觀念。不僅「AI」「機器學習」「深度學習」這幾個關鍵字出現於日常的商業對話,眾多書籍及雜誌中更是將資料分析視作「改變商業的魔法師」。
我也聽聞許多商務人士開始學習程式設計(傑出資料分析的必備能力),或是重新學習數學(資料分析的基礎)。擁有卓越AI技能的理科生是社會新鮮人求職市場中的當紅炸子雞,掌握資料分析能力的人才在轉職時能談到更高的薪酬。就業市場遭遇空前理科人才荒,甚至連知名大企業也難以搶到具備優秀技能的珍貴人才。
即使處於這種情況,經營層想必仍想分杯羹,勢必會下令「把資料科學家給我找來!」或是「給我組個資料分析小組!」又或許現在手握本書的你,也是被下達這種指令的其中一人也說不定。
資料分析的關鍵在於「商業能力」
或許某天閱讀本書的讀者們,你會突然成為資料分析團隊的率領者,或是成為資料分析團隊的一員。我認為這並非不無可能。
當事情發生時,即便你是文科出身也請千萬不要放棄。我以自身經驗掛保證。倘若各位讀者曾在俗氣的商場打滾,這些累積的經驗在資料分析領域並不是無用武之地。反倒這份經驗對於商業上的資料分析是一大助力。本書正是「有一天我突然成為資料分析團隊的率領者,或是成為資料分析團隊的一員」為主旨所撰寫的養成指南。
一般而言,AI或是資料分析被認定為「理科生」的範疇。而實際上對數學有一定程度掌握的人,確實在資料分析領域會有較傑出的表現。然而「擅於分析」和「「分析的結果能運用在商業上」這兩件事並不成正比。在日複一日的工作中,身為文科資料科學家的我,深深領悟到「作為一名資料分析家,商業能力是不可或缺的」。
接下來介紹一項非常有趣的調查結果。「一般社團法人資料科學家協會」(地點:東京都港區、代表理事:草野隆史、以下簡稱資料科學家協會)在二○二○年四月公布國內企業資料科學家僱用現況調查結果。
●調查結果摘要
(1)僱用資料科學家的企業佔二九%
(2)計畫僱用資料科學家的企業中,有五八%的企業未達成目標僱用人數
(3)計畫增加僱用資料科學家的企業中,有四一%的企業需要擅於解決商業課題的人才
(4)未來想招聘的資料科學家類型,有四○%的企業為行銷人才、三六%為工程師人才、二四%為分析師人才
根據第(3)點和第(4)點的調查結果,我們可以看出相較於資料科學家,企業更需要的是具備商業能力的人才。而這份能力正是「透過資料分析所推演出的觀點(全新的見解和發現),提高企業營業額和利益的力量」。若想達成上述目標,「邏輯思維」「解決問題的能力」「行銷戰略」「經營戰略」,以及「溝通能力」和「提案能力」更是不可獲缺的技能。
站在公司人資部門立場看來,應該會抱怨「光是僱用理科人才就已經很困難,還想找到同時具備資料分析和商業能力的人才根本是癡人說夢」。具備資料分析及商業能力兩者的人才確實是鳳毛麟角。
值得我們關注的是,近幾年越是積極採用資料分析人才的企業,越容易發生人才錯置的問題。「雖然聘雇了資料科學家,但卻不知道如合運用人才而傷透腦筋」,或是「僱用的資料科學家馬上就辭職了」等情況也時有耳聞。簡而言之,即便找來了會程式設計、擅長統計學,或是數學專家的人才,也並不是就能一帆風順。
成為「能將資料變現的資料分析人才」
理科生是首要僱用條件的時代已經結束了。現在企業需要的是,適合自家公司商業目標的「資料分析人才」。而最佳人選正是公司的在職員工。文科或理科出身差異不大,只要擁有業務或行銷的相關經驗,曾經思考過顧客對於自家產品或服務的需求,就具備所需的能力。接著,只需要掌握些許資料分析能力就沒問題了。
縱然如此,會有「資料分析應該也不是那麼容易學會吧」的想法也不足為奇。然而,以往資料分析必備技能之一的程式設計能力,現在也能透過使用GUI圖形用者介面(Graphical User Interface)達成。資料分析工具進步速度飛快。「資料分析民主化」的推進勢不可擋。現在正是跨越文科・理科限制,任何人都能成為資料分析人才的時代。企業所需要的並不是「資料分析能力超群的資料科學家」。坦白來說,我們沒有必要成為資料科學家,只要成為「能將資料運用於商業上的資料分析人才」即可。目前正以勢如破竹的氣勢搶攻市佔的WORKMAN(WORKMAN CO.,LTD.)正是最好的例子。企業整體全力投入培育資料分析人才,讓具備商業頭腦、業務出身的資料分析師在職場上大放異彩。
資料分析可能遇見困境──與如何突破
若是某天各位讀者突然成為資料分析團隊的率領者,或是成為資料分析團隊的一員,我相信肯定會非常困惑該從哪開始著手。進到書店能看見滿坑滿谷「Python入門」、「資料分析入門」這類專為初學者打造的資料分析教學書,但卻找不到一本寫有製作真實商場上資料分析組織的方法,或是介紹面臨困境時的解決方案書籍。也幾乎看不見一本闡述資料分析師應具備商務能力的書。然而,若要運用於商業上,我們就必須知道這些訣竅。
本書並未介紹詳細的資料分析手法,所以即便閱讀也無法馬上成為一名資料分析師。本書所撰寫的是當你被任命為資料分析負責人,或是率領資料分析團隊時「該如何思考」的方法論。具體而言則是精進資料分析技能時應具備的「思考法的框架」,以及我運用該框架所導出的「資料人才培育理論」。以上兩大主旨都是作者們(木田・伊藤・高階・山田)根據自身經歷和失敗經驗所孕育出的產物。
我以成為一名資料科學家為目標,並自學資料分析技能,至今管理了無數個資料分析團隊。當時的我面臨許多不同的困境,一路不停地模索推敲再各個擊破。如今回想起來,其中也經歷許多失敗。我想各位讀者在未來也會遇見困難,但只要閱讀本書,你們會知道往後將有哪些障礙等在前方,也能知道衝破壁壘的方法。
根據過往經驗所孕育出的5D框架
作者們至今在許多不同的企業負責資料分析專案,其中有失敗也有成功的經驗。我們從上述經驗中找出「不會失敗」的方法論,並建立出一套名為「5D框架」的體系。
接下來想先介紹幾個例子,讓各位讀者能「稍微抓到」5D框架的概念。而詳細內容將會於本書的第二章節介紹。「料理」時常被拿來作為資料分析的比喻。烹煮「資料」這份材料,向顧客提供餐點,並請他享用,上述流程和料理十分雷同。
料理並不單純只是烹飪食材,將餐點送上餐桌即可。若餐點不能讓對方感受到喜悅,那就無法被稱為「美味的料理」。除了在食材選擇及調理方法下足工夫外,最重要的是充分了解對方想要什麼東西。若想提供完美的料理,必備的要素和步驟是不可或缺的。任一步驟若偷懶了事,或是弄錯步驟順序,就會變成「難吃的料理」。
詢問需求(Demand 需求)→
構思料理(Design 設計) →
準備食材(Data 資料) →
烹煮料理(Develop 開發)→
提供料理(Deploy 部署)
資料分析也是如此。為了避免製作出「難吃的分析」,必須按部就班完成。總共有(1)Demand 需求、(2)Design 設計、(3)Data 資料、(4)Develop 開發以及(5)Deploy 部署五個步驟,而每個名詞都是英文字母「D」開頭,因此稱為「5D框架」(參見圖表0-1 )。
接著依序介紹五個步驟的內容。
(1)Demand(需求):詢問需求
料理是為了讓人享用而製作。既然要讓對方品嚐,理當會詢問對方想要吃什麼樣的料理,或是確認對方當下的心情(狀況)。有些人會明確指定一種料理,而也有人會講出曖昧不明的需求。即使對方回答「都可以喔」,事實上並不是什麼都可以,必須鎖定他可以接受的料理範圍。
資料分析也和製作料理相同,從詢問對方的需求開始。找出對方所面臨的「問題」,或是成為路障的「課題」。同時也必須在這個時間點事先確認我們所提供的幫助是否確實適當無疑。
(2)Design(設計):描繪整體輪廓
以料理為例,當聽完對方的需求後,接著會開始思索「要製作什麼樣的料理呢?」。並非所有食材都能唾手可得,也會有時間上的限制。再者,自己也不是每道料理都能信手捻來。因此,我們必須估算「依照現在的狀況,能在時間內做出這道和那道料理」,同時也需要思考什麼時候將餐點端上桌,而又該安排對方在哪裡享用等等。而上述的內容,都必須在取得對方的同意後,才能開始製作料理。
資料分析也是一樣,必須思考「能在有限的時間內,使用取得的資料分析出什麼樣的結果」以及「運用這份分析結果,可以解決什麼樣的課題」,描繪出整體的輪廓。將輪廓圖展示給對方,獲得對方的同意後,再開始著手進行分析作業。
(3)Data(資料):收集資料
相當然爾,製作料理時不可或缺的就是食材。除了食材本身之外,也必須留意它的份量以及品質。只需要一項食材的料理極為稀少,大部分都是透過許多不同的食材組合製作而成。食材的品質是製作美味料理的必要關鍵之一,因此烹調方法至關重要。同時也需要注意保鮮,光是保持食材的鮮度就得耗費心力及金錢成本。
資料分析也是如此。收集有用的資料並不簡單,讓資料隨時保持在最新狀態更是需要耗費成本。資料和食材一樣,都不是免費的東西。
(4)Develop(開發):分析資料
料理這門學問,依照食材會有該食材所適合的調理方法(食譜),也會有相對應的技術和器具(工具)。只要順序、作法或是器具的使用方法一有閃失,就會讓得來不易的食材灰飛煙滅。「燒烤」或是「燉煮」等烹調方法在實際製作前,還需要耗費時間進行事前準備。
著手資料分析前,也需要將資料加工,做好事前準備,再選擇適合資料和目的的解析手法進行分析。若事前準備做得不夠充分,或是方法錯誤,都得不到預期的結果。為此,資料分析師的知識和經驗顯得更為重要。此外,也有許多工具能從旁輔助。善用工具不僅能縮短分析時間,分析出的結果大部分也較人工作業準確。
(5)Deploy(部署):展示資料
料理完成後,端上餐桌請對方享用。除了需要依照事先決定的時間點和分量提供外,還得將當下的氣氛、氛圍等一併納入考量。或許情況已經和一開始所聽聞有所不同也說不定。既然料理都製作完成了,當然會希望對方全部吃光,滿足他的味蕾。以餐廳為例,必然會希望將顧客變為常客,甚至也希望他能將餐廳介紹給其他人,讓更多顧客來店光臨。
資料分析也是一樣。報告完分析結果後,必須讓對方理解結果內容,並讓他採取必要的行動。有時候也會以「儀表板」或「預測系統」的方式,讓分析結果一目瞭然。若無法讓對方展開行動就無法解決「課題」。唯有在對方完整「消化」我們所提供的分析結果,並展開「行動」,資料分析專案才算大功告成。
5D框架的五個階段,若欠缺其中任一項都有可能導致分析專案以失敗收場。反之,只要依照順序確實執行,不論文科或理科生,任何人都能以極高的成功率正確執行分析專案。
作者代表
二○二○年十月 木田
前言 不需要成為「資料科學家」也沒關係
三十歲・文科生・業務。這是十年前我(木田)身上所貼的標籤。當時的我是一名「統計軟體」的業務。我本身並不是統計學的專家,只是湊巧負責的商品是「統計軟體」。那時是「大數據」一詞尚未普及的時代,因緣際會之下我對「資料分析」產生興趣,因而開始自學統計方法及資料分析。現在的我是一位資料科學家,任職於三井住友海上火災保險株式會社,是一家損害保險公司。
不論是誰都有機會成為資料分析人才
雖說我是恰巧踏入「資料分析」的世界,但如今被資料所圍繞的社會環境變化之大,十年...
目錄
成為資料分析人才
前言
不需要成為「資料科學家」也沒關係
根據過往經驗所孕育出的5D框架
第1章 提升經驗值
──失敗和成功的經驗談
1-1 眾多企業所面臨的課題
1-2 失敗經驗
1-2-1 Demand(需求)的失敗經歷:期待驚為天人的法則?
1-2-2 Design(設計)的失敗經歷:預期外的高額成本
1-2-3 Data(資料)的失敗經歷:沒用的大數據
1-2-4 Develop(開發)的失敗經歷:無法說明分析結果而招致混亂
1-2-5 Deploy(部署)的失敗經歷:分析完成卻沒有被拿來運用
1-3 成功經驗
1-3-1 突破Demand(需求)步驟困難點的案例
1-3-2 突破Design(設計)步驟困難點的案例
1-3-3 突破Data(資料)步驟困難點的案例
1-3-4 突破Develop(開發)步驟困難點的案例
1-3-5 突破Deploy(部署)步驟困難點的案例
1-4 成功經驗應用
第2章 實踐5D框架
2-1 步驟1Demand(需求)
2-1-1 Demand(需求)步驟-概要
2-1-2 Demand(需求)步驟-陷阱
2-1-3 Demand(需求)步驟-順序
2-1-4 Demand(需求)步驟-總結
2-2 步驟2Design(設計)
2-2-1 Design(設計)步驟-概要
2-2-2 Design(設計)步驟-陷阱
2-2-3 Design(設計)步驟-順序
2-2-4 Design(設計)步驟-總結
2-3 步驟3Data(資料)
2-3-1 Data(資料)步驟-概要
2-3-2 Data(資料)步驟的壁壘-取得資料
2-3-3 Data(資料)步驟的壁壘-取得後的資料
2-3-4 Data(資料)步驟-順序
2-3-5 Data(資料)步驟-總結
2-4 步驟4Develop(開發)
2-4-1 Develop(開發)步驟-概要
2-4-2 Develop(開發)步驟-陷阱
2-4-3 Develop(開發)步驟-順序1 整備分析環境
2-4-4 Develop(開發)步驟-順序2 檢查資料
2-4-5 Develop(開發)步驟-順序3 資料加工・分析
2-4-6 Develop(開發)步驟-順序4 編造提交結果時所需的故事
2-4-7 Develop(開發)步驟-順序5 議論時善用視覺化工具提交結果
2-4-8 Develop(開發)步驟-總結
2-5 步驟5Deploy(部署)
2-5-1 Deploy(部署)步驟-概要
2-5-2 Deploy(部署)步驟-陷阱
2-5-3 Deploy(部署)步驟-順序
2-5-4 Deploy(部署)步驟-總結
第3章 5D框架資料分析人才培育術
3-1 為培育人才所苦惱的企業
3-1-1 回流教育的極限
3-1-2 打造能讓回流教育持續發揮效果的環境
3-1-3 培育文科資料分析人才的理由
3-2 專為管理階層・領導階層所設計的5D框架
3-2-1 定義分析組織目的的「Demand(需求)」
3-2-2 設計分析組織的「 Design(設計)」
3-2-3 教導資料使用方法的「Data(資料)」
3-2-4 提升資料分析能力程度的「Develop(開發)」
3-2-5 讓分析結果也能在公司內部使用的「Deploy(部署)」
3-3 培育文科資料分析人才的注意事項
3-4 企業文化將因培育文科資料人才產生轉變
後記
成為資料分析人才
前言
不需要成為「資料科學家」也沒關係
根據過往經驗所孕育出的5D框架
第1章 提升經驗值
──失敗和成功的經驗談
1-1 眾多企業所面臨的課題
1-2 失敗經驗
1-2-1 Demand(需求)的失敗經歷:期待驚為天人的法則?
1-2-2 Design(設計)的失敗經歷:預期外的高額成本
1-2-3 Data(資料)的失敗經歷:沒用的大數據
1-2-4 Develop(開發)的失敗經歷:無法說明分析結果而招致混亂
1-2-5 Deploy(部署)的失敗經歷:分析完成卻沒有被拿來運用
1-3 成功經驗
1-3-1 突破Demand(需求)步驟困難點的案例
1-3-2 突破Design(設...