全日本累計銷量突破37萬冊!
一出版,即引爆商務人士重讀「統計學」熱潮!
台灣×日本年度暢銷商管書──
《統計學,最強的商業武器》最強續篇!
商場上最需要的,
是能夠「掌握」、「預測」、「洞悉」人心的數據分析!
在這因大數據而躁動不安的世界,具備基本統計學素養的人將擁有最大優勢。
本書完美結合「商業實務」與「統計學」,集中在策略管理與獲利能力之間,告訴你如何參透商機中的因果關係。
◎如何用統計學檢驗出到底是「偶發」的差距,還是「有意義」的差距?
◎如何避免「明明沒差異卻認為有差異」與「有差異卻找不出來」這兩種結果?
◎統計學能證明「天下烏鴉一般黑」嗎?
◎如何用「回歸分析」來找出難以發現的關聯性?
◎任何原始資料,只要加總便會趨近於常態分佈,為什麼?
◎穩賺不賠的彩金賠率設定,竟與病例對照研究的成功率算法相同?
以上,皆能一一套用書中的方法解開數字的騙局!
《統計學,最強的商業武器》的最大宗旨在於如何解讀數據;
《實踐篇》所談論的,則是──
洞悉人類心理,活用於商業行為的統計分析
在一切數據化的現今社會,無論任何領域,統計學都是一大利器。比起「掌握現況」和「預測未來」的統計學,以「洞悉因果」為動機的統計學,至今還未以簡單易懂的形式普及於一般人,而這正是本書的企圖。
令經濟學家頭疼的金融政策或許很難,但商業上的策略是可輕易以隨機對照實驗來驗證因果關係的。本書目標在於介紹對所有商務人士來說極為實用的統計常識,所提到的統計分析方法都很基本,只要懂得這些,便足以應付一般商業領域需求。
以下問題,你能用統計學知識解答嗎?
Q: 假設某付費的網路服務依據A/B測試的結果,改換新設計後的網頁其轉換率從0.10%上升到了0.11%。差距雖只有0.01%,但要怎麼做才能推測出這0.1%的差距為「偶發的差距」還是「真的有差異」?
Q: 假設某美白保養品的問卷調查題目為「有美白效果」、「讓膚色變明亮」、「改善膚色暗沉」,卻出現了「有美白效果」會提高購買意願,而「讓膚色變明亮」卻降低了購買意願的結論,在這種模稜兩可、看似矛盾的調查結果,如何透過因素分析讓其壁壘分明?
Q: 假設保險業務員A君完全沒拜訪客戶的簽約數是0;B君拜訪2次簽到3份約;C君則拜訪了4次簽到3份約,看似毫無關聯性的拜訪次數及簽約數,要如何用「回歸分析」推導出其中的細微差距?
Q: 假設賽馬場有三匹馬參賽,所有參與博奕的賭客都能預見賽馬A贏的機率為50%,賽馬B贏的機率為30%,賽馬C贏的機率為20%,博奕公司(莊家)該如何設計穩賺不賠的彩金賠率?
解答就在書本中!
作者簡介:
西內 啟
畢業於東京大學醫學部,主修生物統計學。曾任東京大學大學院醫學系研究科醫療傳播學領域的助理講師、大學醫院醫療資訊網路工程研究中心副主任、哈佛癌症研究中心客座研究員等職務。目前則為各種以數據資料為基礎的社會創新專案,提供研究調查、分析、系統開發以及策略規劃等諮詢服務。
著作包括《科特勒教會我的事》(暫譯)、《上班族的多數煩惱都已有學術性的「解答」》(暫譯)、《世界第一簡單易懂的醫學統計》(暫譯)等。
譯者簡介:
陳 亦苓
政治大學廣播電視系畢,輔修日文,曾留學並於日本工作近 4 年。目前為自由譯者,擅長資訊類英翻中、日翻中。
個人作品列表:www.anobii.com/bready/books
章節試閱
「掌握」、「預測」,以及「洞悉」的統計學
商業上所需要的,是能夠「洞悉」人類的統計學
除了能夠理解各領域統計學的運用方式及其差異外,公共衛生的統計學之所以有利於商業應用,其中還有另一個理由,那就是「以人類行為和社會狀態的轉變為研究對象」──這點幾乎和所有的商業活動一致。
與其他領域比比看就知道了。例如,工程和農業科學所研究的非生物及人類以外生物的量和質,大部分都可以透過控制條件來進行實驗。像是用超低溫讓分子停止震動來測量數據,或是收集所有實驗生物的基因等,只要有技術、有預算,就能自由測試。
但對於計量經濟學所研究的股價和景氣等大量資金流向,多數人都只能夠觀察及預測而已。
又或者如研究「聲音」、「影像」、「自然語言」的機器學習等領域,均各有其特殊的專業知識、技術存在,像是共振峰頻率(formant frequency)、特徵點、修飾結構…等等。亦即依據聲音、影像、語句本身的知識,以0/1之二進位數字將所記錄下來的資料賦予意義,把對人類而言理所當然的認知及理解,透過演算法以正確且快速的方式加以處理。
請讓我一開始就先說清楚,若你需要的是這方面的統計學知識,那麼,本書應該不是什麼有效的好選擇;因為早就有許多更合適你的書存在了。本書所談論的統計學,全都是為了洞悉人類心理以略微改善其行為及做法的類型。
人心十分複雜,決策機制則更複雜,要靠某些刺激來達到特定變化可說是相當困難,而以強迫方式達到特定變化又會有道德上的難度。因此,經濟學家便以合理性;政治學家以權力;社會學家以社群互動;心理學家以認知及情感;教育學家以知識和能力;行銷人員以需求和慾望,也就是各領域分別以不同的切入點來嘗試了解狀況。倘若問我,對改善人類行為來說以上何者重要?
我會很肯定地回答:「全都重要。」
我在商業領域做研究分析時,不論處理的是哪種行業、哪種業務,都必須徹底洞悉人類的個人或團體行為,然後從資料中找出可略微達到變化的方法。
而這幾年來,我在調查分析方面之所以毫無阻礙,應該就是因為現今商業環境
所需要的,正是能夠洞悉人類行為的統計學。
本書特色
因此,本書將從「平均值及比例」等為了「掌握現況」而被許多社會人士所運用的統計方法切入,進而說明以從資料內容來洞察其背後因果關係為目的的統計學。
基於前述對既有入門書的不滿,本書也和前著一樣,所有說明都不倚賴數學公式,只靠文字與圖表便能理解。不過,對於無論如何都需要以數學公式解說的統計方法基本觀念,我將於書末附上僅需高中程度即可理解的數學補充說明。即使不看該補充說明也不會影響你對本書內容的理解,因此,若你是個一看到數學公式就頭皮發麻的人,現在便可將書末附錄拆下,並以釘書機另外裝訂成獨立的一冊。附錄裡的那些數學補充說明,主要是為了讓你理解一些在入門書中被當成基本前提,但若真要仔細說明卻又太困難,於是就被省略掉的部分。即使現在跳過不看,哪天當你讀到大學課程裡會用的那種統計學入門書,或看到某些似曾相識的內容時再回頭翻閱本書,或許會覺得還蠻有參考價值的。
也就是說,即使是在一般統計學教科書中,以大學程度的數學只需短短幾行就能說明完畢的東西,我仍不厭其煩地詳列於書末的附錄之中,逐一以高中程度的數學來詳細解說,而內文更是花費大量篇幅,只靠文字與圖表來說明。此外,在一些細節部分,就算內文中的範例數值可能會在計算過程中變得萬分複雜,我還是盡力把最後結果設計成小學生也能輕易看懂的整數及分數。
書中提到的統計方法絕大多數都很基本,只有邏輯回歸、因素分析和聚類分析這三個是一般統計學入門書不太會談到的,但這些都是經過精挑細選,最常用於商業領域的分析方法,只要懂得這些方法,便能應付一般的分析需求。
首先,第1章要說明的是平均與比例,以及標準差等最基本統計學工具的本質。我要介紹的,不是「把所有數據全部加起來再除以其數量」這種顯而易見的計算過程,而是要讓你理解可透過此種計算而得的平均值,為何對「洞悉」型的統計學來說很重要。懂了這些,你應該就比較容易了解之後介紹的各種方法。
接著在第2章介紹的是統計學中的假設檢定觀念,也就是判斷各群組在平均值及比例方面是否存在著非偶然誤差程度的差距。舉例來說,假設比較既有門市與新門市的平均客單價後發現,新門市的平均客單價多了一百日圓。但即使是同一顧客,每次的消費金額也都不同,不可能分毫不差地符合平均值。這一百日圓的差距若真是有意義的差距,就表示新門市的嘗試是成功的,如此一來,既有門市或許都該仿效新門市,但若只是偶然形成的誤差,那也不過是稍微上下波動,沒什麼好大驚小怪的。而用來做這種判斷的統計學工具,就是所謂的假設檢定。
第3章則不只是討論群組間的差異,而是要更要進一步說明,用來分析當某值不斷增加,另一值是否會隨之增加,又或是反而隨之減少這類關聯性的各種回歸分析方法。例如,當門市與車站的距離越遠,營業額會隨之增加?隨之減少?還是不受影響?若是會隨之增加,那麼會增加多少?如果能回答以上問題,或許就能提升新門市開店計畫的獲利。而用來做這種分析的統計學工具,就叫做回歸分析。
最後在第4章則要學習如何以因素分析和聚類分析,有效地將大量的資料項目轉換成少量項目。到底為何需要做這種轉換?而這些方法所依據的又是什麼樣的想法和道理?就請各位期待第4章的內容了。
如同前著,本書在舉例說明各種統計方法的功用時,全都是以商業環境中常見的事物為例。一般統計學入門書要不就出現「蘋果的平均重量為∼」這種幼稚的例子,要不就是突然出現一堆與統計學無關的專業術語,範例總是舉得很極端。而我則將這些都統一改成適合商務人士閱讀的例子。此外,我還會描述各分析方法的歷史背景,介紹這些方法分別是由誰、依據何種想法所提出的,藉此解說其背後概念,這樣的寫法亦是沿襲前著。
本書的內文基本上都以一般的統計學概念──頻率論為基礎。雖然近年來以貝葉斯論為基礎的統計學也有相當不錯的進展,但正如前著提過的,貝葉斯論比較適合「預測」型的統計學,對於以了解「洞悉型統計學基礎觀念為目標」的本書來說,並不合適。
在撰寫前著時,我並未想到統計學的書竟能如此暢銷,只是覺得即使只能接觸到一部分的人,身為專業人士的我依舊有其社會責任,應該針對因大數據而躁動不安的世界貢獻關於統計學的知識。
但該書卻不可思議地觸及了廣大的讀者群,因此,填補讀者與許多統計學入門書之間的間隙,便成了我責無旁貸的使命。
若本書能讓各位開始朝向統計學應用的方向邁進一步,本人將深感光榮。
「掌握」、「預測」,以及「洞悉」的統計學
商業上所需要的,是能夠「洞悉」人類的統計學
除了能夠理解各領域統計學的運用方式及其差異外,公共衛生的統計學之所以有利於商業應用,其中還有另一個理由,那就是「以人類行為和社會狀態的轉變為研究對象」──這點幾乎和所有的商業活動一致。
與其他領域比比看就知道了。例如,工程和農業科學所研究的非生物及人類以外生物的量和質,大部分都可以透過控制條件來進行實驗。像是用超低溫讓分子停止震動來測量數據,或是收集所有實驗生物的基因等,只要有技術、有預算,就能自由測試。
但對...
目錄
序章 商業活動與統計學之間的連結
01 商業與統計學之間為何存在著鴻溝
02 「掌握」、「預測」,以及「洞悉」的統計學
第 1 章 統計學的實踐,就從重新思考基本觀念開始
──「平均」及「比例」的本質
03 「洞悉」型統計學的三項必要知識
04 「平均值」其實很深奧
05 平均值為何能夠掌握真相?
06 標準差所呈現的「概略資料範圍」
第 2 章 統計學之所以「最強」的另一個理由
──標準誤差及假設檢定
07 介於急驚風與慢郎中之間的「最強」思維
08 「誤差範圍」與資料量的關係
09 為貧乏言論畫上休止符的假設檢定
10 用z檢定來駁斥急驚風
11 用於少量資料的t檢定與費雪的精確性檢定
12 檢定的多重性與其對應處方
第 3 章 堪稱洞悉之王道的各種分析工具
──多元回歸分析與邏輯回歸
13 統計學的王道──回歸分析
14 如何求出迴歸直線?
15 一次分析多個解釋變數的多元回歸分析
16 邏輯回歸與對數比值
17 回歸模型的總結與補充
18 實用的迴歸模型應用方法──輸入層面
19 實用的迴歸模型應用方法──輸出層面
第 4 章 在資料背後隱藏了「什麼」
──因素分析與聚類分析
20 心理學家所開發的因素分析有何用途
21 具體而言,因素分析到底能做些什麼?
22 聚類分析的基本觀念
23 k-平均演算法(k-means)的聚類分析
終章 統計方法總整理與使用順序介紹
24 本書總結
25 商業應用時的分析順序
26 無法透過本書獲得的三種知識
數學公式的補充說明
補充01:偏差的絕對值與中位數
補充02:偏差的平方與平均值
補充03:平均值與比例的標準誤差
補充04:變異數與無偏變異數
補充05:常態分佈的數學特性
補充06:中央極限定理
補充07:切比雪夫不等式
補充08:針對平均值與比例之差距的z檢定
補充09:卡方分佈與t分佈的關係
補充10:費雪的精確性檢定
補充11: z檢定與卡方檢定
補充12:邦弗朗尼校正
補充13:簡單回歸分析
補充14:簡單回歸分析與t檢定的關係
補充15:多元回歸分析
補充16:比值比
補充17:檢定力與樣本數規劃
序章 商業活動與統計學之間的連結
01 商業與統計學之間為何存在著鴻溝
02 「掌握」、「預測」,以及「洞悉」的統計學
第 1 章 統計學的實踐,就從重新思考基本觀念開始
──「平均」及「比例」的本質
03 「洞悉」型統計學的三項必要知識
04 「平均值」其實很深奧
05 平均值為何能夠掌握真相?
06 標準差所呈現的「概略資料範圍」
第 2 章 統計學之所以「最強」的另一個理由
──標準誤差及假設檢定
07 介於急驚風與慢郎中之間的「最強」思維
08 「誤差範圍」與資料量的關係
09 為貧乏言論畫上休止符的假設檢定
10 用z檢...