看紐約大學統計學教授 馮啟思 如何應用數字統計,解決在商業、金融、科學、公共衛生以及犯罪調查中遇到的難題挑戰!
看統計學家如何解決迪士尼樂園大排長龍的問題和明尼蘇達公路大塞車!
為何你的保險費率這麼高?信用卡評比積分是怎麼運作的?
傳染疾病爆發時,統計數字如何找出感染源頭,幫你逃過一劫?
違規使用禁藥的運動員被逮到前,如何一而再、再而三地捏造清白的測試結果?
為何一般人害怕搭飛機而統計學家則否?
透過知名統計學家馮啟思的妙筆,你將在書中看到各方面的專家如何利用數字和統計學來解決問題。例如,疾病偵測專家會警告我們別碰不安全的食物、保險業務員會精算佛羅里達州颱風襲擊的風險程度、教育專家如何擬定各種考試標準,如學術能力測驗(SAT)、實驗室裡的科學家詳細檢查運動員的血液體樣本,避免服用禁藥的運動員矇騙大眾。
《像統計學家一樣思考》形同提供第一手專人指引的導覽,帶領你巡禮一趟驚心動魄之旅,認清實情與數據、平均與例外,以及報導與統計的世界。這些真相將讓你驚訝、讓你覺得有趣、有些甚至會讓你生氣,但這讓你無法否認,數字其實掌握了你的生活。
作者簡介:
馮啟思(Kaiser Fung)是一位專業的統計學家,先後在英國劍橋大學(Cambridge University)、哈佛大學(Harvard University)、與普林斯頓大學(Princeton University)取得統計、商業與工程學科學位。
現任職為美國天狼星衛星廣播(Sirius XM Radio)的策略分析高級總監,運用統計方法預測廣告和消費者行為。他並經營廣獲讚揚的網路日誌Junk Charts(junkcharts.typepad.com,意指垃圾圖表),首開先例分析大眾傳播媒體流行使用的數據和統計圖表多半無用。
各界推薦
名人推薦:
各界讚譽:
「這本書述說了許多故事,就像記者娓娓道來一般;也介紹了這些故事背後那一番由數字妝點而成、引人入勝的風景;更展示數字所顯現的活力,讓我們不由得深深入迷。」
──賽仕電腦軟體公司(SAS Institute)執行副董事長約翰.薩爾(John Sall)
「對那些憂心忡忡組織所使用的資料探勘將衝擊全世界的人而言,馮啟思揭開這層神秘的面紗,讓預言式分析論的優點、缺點無所遁形。」
──耶魯大學法學院教授、《什麼都能算,什麼都不奇怪:超級數據分析的祕密》(Super Crunchers: Why Thinking-by-Numbers Is the New Way to Be Smart)作者伊恩.艾瑞斯(Ian Ayres)
「簡單易懂,卻能獲益良多!」
—時代雜誌主編,CNN主持人法理德札卡利亞Fareed Zakaria, CNN
「那些關心組織的研究數字如何影響世界的人,馮啟思的書把預測型的統計數字的好和壞誠實的呈現在讀者面前。」--Ian Ayres,耶魯教授,《什麼都能算,什麼都不奇怪》作者
名人推薦:各界讚譽:
「這本書述說了許多故事,就像記者娓娓道來一般;也介紹了這些故事背後那一番由數字妝點而成、引人入勝的風景;更展示數字所顯現的活力,讓我們不由得深深入迷。」
──賽仕電腦軟體公司(SAS Institute)執行副董事長約翰.薩爾(John Sall)
「對那些憂心忡忡組織所使用的資料探勘將衝擊全世界的人而言,馮啟思揭開這層神秘的面紗,讓預言式分析論的優點、缺點無所遁形。」
──耶魯大學法學院教授、《什麼都能算,什麼都不奇怪:超級數據分析的祕密》(Super Crunchers: Why Thinking-by-Numbers Is the New ...
章節試閱
第一章
快速通行/龜速會車
被平均化會讓人心生不滿
2008年初,美國《大西洋月刊》刊出資深記者詹姆斯.法洛斯的一篇醒目之作,分析美國對中國大陸失控的貿易逆差。法洛斯在文中闡述中國人民是如何幫忙撐起美國人的生活水準。
通常這類學術報導不會在網路上引起多少迴響,但這篇文章卻異軍突起,廣受各方熱烈討論。全多虧了那些為法洛斯這篇文章標題畫龍點睛的網民。他們把原來的標題「一個1兆4千億美元的問題」換成「平均每個美國人欠每個中國人4千美元」,3個月內,這篇文章得到超過1千6百個網路讀者認同的「喜歡」書籤和正面回應。
這些是高科技世界裡表現讚揚的方式。
顯然,這個新標題抓得住我們。我們的大腦無法輕鬆處理1兆4千億之類的天文數字,卻能夠輕易理解每人4千元這樣的數字。簡單來說,我們比較喜歡看平均數字。
平均的統計數字是個被忽略的偉大發明。所有人、事、物都可以平均。我們平均人(一般人),也平均動物(一般的熊),連不是活的物品也拿來平均:例如,在2001年9月11日的恐怖襲擊事件之後,一個安全保衛單位示範了如何「將一般的飲水機改裝成武器。」
經濟過程也被平均:一位市場觀察家在2008年喊出了「我們的新希望:平均的經濟衰退」,預測這個淺層的經濟衰退時期將會很快過去;就連行動逃不過被平均的命運:2008年美國民主黨內初選進行得如火如荼,當時的候選人歐巴馬(Barack Obama)與希拉蕊(Hilary Clinton)進行某次電話會議時,歐巴馬的律師突然插嘴加入對話。這次事件被媒體貼上了「非一般的電話會議」的標籤。
那麼特殊事物能被平均嗎?當然可以。《富比士》(Forbes)雜誌曾說:「2007年的億萬富翁平均高齡62歲。」你可能會想,總沒有人能夠平均不可數的事物了吧。別太快下結論!美國商務部人口普查局(U.S. Census Bureau)就發明了平均時間的方法:在2006年的「平均日」中,每位美國人平均睡眠8.6小時、工作3.8小時,並花5.1小時做運動及休閒活動。
你幾乎找不到任何未曾被平均過的事物。這個概念在日常生活中無所不在,甚至已經讓我們直覺認為,這是人類與生俱來的能力,無須費時學習或發明。
試想一個沒有平均數字的世界;試想所有關於平均的兒童、熊或任何東西的辭彙被排除在字典以外的世界。你可能會很驚訝,這樣的世界的確存在,那是1831年比利時統計學家阿爾道夫.凱特勒(Adolphe Quetelet)發明「平均人」(l’homme moyen)之前。
誰會相信,這一個如此深入人心的概念,存在的時間原來比美國憲法還短呢!
凱特勒是將統計學概念帶進社會科學的第一人。在此之前,只有研究天象的天文學家和分析賭博遊戲的數學家才執迷於統計學和或然率。凱特勒本身也是一位出色的天文學家,創辦布魯塞爾天文台。他到中年後才將野心轉到發明適當的科學方法檢視社會環境。
在他稱作「社會物理學」(social physics)的研究中,所有的主題都圍繞著平均人。當然,在現代人的眼中,凱特勒使用的分析方法並不算多麼令人讚嘆,不過歷史學家終究還他一個公道,正式認可凱特勒在社會科學的研究方法上的確具有革命性的影響力。
他曾運用統計數字推測出國家的徵兵過程可能出問題,這項推論也大受南丁格爾(Florence Nightingale)的讚賞。其實很少人知道,這位舉世聞名的護士也同時是頂尖的統計學家,更於1874年成了美國統計協會(American Statistician Association)的榮譽會員。他的研究中包含身體質量指數(BMI)(後來也被稱為凱特勒指數)的理論,至今當代醫生仍採此標準診斷體重過重或過輕。
由於平均人的概念太過深植人心,我們經常忘記凱特勒帶來的影響竟然具有偌大的革命力量。平均人毫無疑問是個全新發明,因為自古至今,真實世界中都沒有任何平均人的實質存在。
我們大可描述這個名詞,但永遠不可能實際指出他存在於何處;我們知道他,但從來不曾與他面對面接觸;要去哪裡找一個「普通人」?瑜珈熊(Yogi Bear)到底比哪一隻「普通熊」聰明?哪一通電話才是一通「一般」的電話會議?哪一天才是所謂的「平均」日?
然而這個影響深遠的發明卻一直不停誘使我們混淆想像與現實。
所以,當法洛斯提出平均每位美國人拖欠每位中國人4千美元的理論時,他間接將所有美國人放在平等的地位上,把1兆4千億美元的債務平均分攤給全美人口,用3億名想像中的普通複製人代替了三億個不同的美國人。(巧合的是,網民搞錯中國人口數量,他們只製造了3億中國複製人;事實上中國應該有13億人口,所以正確的結論應該是,每位中國人都借了1千美元給每1個美國人。)平均數將個別差異排除在外,把一件事情的複雜度減到最低。但是我們也冒著過度簡化或忽略個別差異的風險。
注意變異數是一種統計思維趨於成熟的表現。事實上,我們可以將統計學定義為研究變異的本質的科學。事物的改變幅度是多少?變異度有多大?導致變異的原因是什麼?
凱特勒是最早開始探討這些題目的人之一。他所說的平均人不是只有一種,而是有許多種不同類型的平均人,他的目標是希望把不同類型的平均人拿來做比較。
對他來說,找出平均值是為了當成測量變異性的工具;計算平均值只是研究的過程,而非結論。舉例來說,身體質量指數(凱特勒指數)就是用來辨識出落在平均範圍以外的人,而想要找出非圈內的人。當然這得要先定義出何謂平均。
至今,統計學家仍追隨著凱特勒,我們在這一章將探討,這些人如何使用統計學的思考方式與現代生活中的兩大難題奮戰,往返工作崗位得花上一小時,以及排隊一小時等著坐上主題公園的遊戲火車。
一個通情達理的人,當他被困在車陣或排隊人龍中,都會忍不住猜想,無論是誰負責管理相關工作,肯定是在上班時夢周公去了吧。為了要證明這種反應其實錯得離譜,我們需要先知道一點有關平均數的統計方法。統計學家其實是在與工程師及心理學家共同應用這類知識,幫我們節省等待的時間。
第一章
快速通行/龜速會車
被平均化會讓人心生不滿
2008年初,美國《大西洋月刊》刊出資深記者詹姆斯.法洛斯的一篇醒目之作,分析美國對中國大陸失控的貿易逆差。法洛斯在文中闡述中國人民是如何幫忙撐起美國人的生活水準。
通常這類學術報導不會在網路上引起多少迴響,但這篇文章卻異軍突起,廣受各方熱烈討論。全多虧了那些為法洛斯這篇文章標題畫龍點睛的網民。他們把原來的標題「一個1兆4千億美元的問題」換成「平均每個美國人欠每個中國人4千美元」,3個月內,這篇文章得到超過1千6百個網路讀者認同的「喜歡」書籤和正面回應。...
目錄
目錄
致謝 vii
介紹 ix
一、快速通行/龜速會車 1
被平均化會讓人心生不滿
二、袋裝波菜/分數難看 25
搞砸的美德
三、題庫/風險庫 63
全部混為一談的兩難
四、膽小的受試者/魔法套索 95
不對稱,所以擺不平
五、飛機失事/中樂透 137
不可能的大威力
結論 155
目錄
致謝 vii
介紹 ix
一、快速通行/龜速會車 1
被平均化會讓人心生不滿
二、袋裝波菜/分數難看 25
搞砸的美德
三、題庫/風險庫 63
全部混為一談的兩難
四、膽小的受試者/魔法套索 95
不對稱,所以擺不平
五、飛機失事/中樂透 137
不可能的大威力
結論 155