推薦序
大開入門途徑 輕鬆學習統計 文.鄭宇庭(國立政治大學統計學系副教授)
統計學是現今各領域必備的工具,統計學家是未來十年最迷人的工作
最近有一篇文章在網路上被廣泛地討論,這是在《紐約時報》二○○九年八月六日的一篇文章,文中提出「未來十年內最迷人的工作,會是『統計學家』」,當中舉了一個例子,談到一位在哈佛大學主修「人類考古學」的研究生,她的研究主題是馬雅人當時定居的模式。她說很多人都認為「人類考古學」的工作會是像電影中印地安納瓊斯(Indiana Jones),但是她真正所做的卻是馬雅人的手工製品分布的資料分析(Data Analysis)。她在畢業之後馬上被Google以高薪聘請,主要是借重她對於大量資料的統計分析能力,來加強Google搜尋引擎的功能!
之後相繼又有多篇的文章在介紹數據科學(Data Science),這是在討論我們每天在日常生活中所碰到的現象——大量的數據資料。我們要如何來應對?其實,我們現在面對的資料已經夠多了,有研究更指出到了二○一二年,資料量還會是現在的五倍多!因應目前我們所面對的愈來愈多的數據趨勢,IBM早在二○○九年四月就成立了一個「商業數據分析與優化服務」的研究部門,聘用了兩百多位數學家、統計學家及資料分析師來做商業數據的分析,運用各式各樣專門的統計挖掘軟體,希望可以從企業大量的資料中萃取出「黃金」(有用的資訊),這也就是目前大家所常談論的資料採礦(Data Mining)。IBM更提到為了要應付目前數據成長的趨勢,未來他們準備還要再多聘請四千位的數據分析師。
如何從一大堆數字或資料萃取出有用的資訊?我們平時會碰到各式各樣的數據,各行各業都會需要應用到統計方法來分析這些數據,不管是個人、企業還是行政部門,都離不開數據資料分析。個人在自己的工作或財務管理,都需要對相關的數據資料進行搜集和分析;企業要做好生產和銷售,必須進行生產控制、市場調查、成本評估等,也都需要去搜集有關的市場資料、生產資料和成本資料等進行整理和分析;行政部門要進行經濟建設和社會發展,更離不開有關國民經濟和社會發展的統計資料,以此為基礎進行分析和決策。可見統計與現代人的生活息息相關,統計已經是今天各個領域必備的工具了。
從觀念和實際應用起步,統計學也能輕鬆明白充滿樂趣
但是統計一直是許多初學者的夢魘,因為統計學中有太多的數學,包括許多的運算公式與專業術語,都會讓初學者望而生畏。可是統計又是處理數據資料的科學,我們幾乎每天都離不開這些數據,有鑑於此,本書作者特別針對初學者撰寫此書。作者捨棄學理的論述,而用簡單的計算例題和具體的案例,以深入淺出的方式介紹統計學的觀念和實際應用,同時配合圖表說明,引發學習的興趣。統計學是需要多做練習的學科,因此,本書於各講之後皆附有練習題,供讀者練習參考,以提高學習上的成效。作者期待能在統計教育的革新改變中,幫助所有想學習統計的初學者,能進入一趟毫無負擔的統計學習之旅,了解統計的本質與意義,並為學習興趣注入活力。本書由帝京大學執教統計學的教授小島寬之編寫,除了在學術上的專業之外,更結合作者多年來的教學經驗,以及對讀者程度與學習心態的掌握,更使用作者個人新的見解--統計學的邏輯有某種「跳躍」現象,以最簡潔易懂的方式,向剛開始學習統計學的讀者介紹統計學的觀念。
作者在第一部分將統計艱深的數學概念予以簡化,對常用的統計觀念及原理做一基本的介紹,並藉由實際案例的說明,引導讀者瞭解統計方法的概念,期使讀者研習統計學時,能以有系統、具效率的方式吸收。讀者並不需要高深的數學知識才能讀懂這部分,因為裡面談的,全都是最基本、最易懂的統計,例如次數分配、平均值、標準差。在第二部分以深入淺出的方式探討統計學中的重要的兩個概念「檢定」及「區間估計」,透過生活化的實例,利用敘述的方式,把最重要的兩個基本概念解釋得清清楚楚。這本書能讓初學者茅塞頓開,輕鬆解讀、掌握統計學的兩個重要的概念,使得統計學變得富有意義,不再艱深難懂,是一段深入理解統計學的完整學習體驗。對於初學者及想一窺統計學堂奧的讀者,這是一本不可多得的好書。
本書呈現給讀者一個絕佳的統計學習課程,不僅易學好用,並且以獨特的風格提供了豐富詳實的說明。假如你對其他艱深難懂的統計學望而卻步,你會深深愛上這本書。本書將改變讀者對統計是一門難學的科學的印象,讀者讀完此書後定會發現其實學統計很輕鬆!
作者序
統計學的樂趣,在於它的「跳躍」
筆者在大學系上專攻的是數學,但那時卻對機率和統計一點都不感興趣。不僅如此,甚至認為無論從哪種角度來看,涉及到「現實」的機率和統計都不是數學。以往筆者總覺得數學完全是概念式的、抽象的東西,不可能會和現實有交集。
原本抱持這樣觀念的筆者,與統計學第一次交手是在年過三十五歲,決定報考經濟學研究所的時候。看著研究所的考古題,筆者心想自己在大學沒修過經濟相關課程,選擇經濟學的試題一定會吃虧。而統計學試題的話雖然同樣都不懂,但選擇這邊還可能比較有利。
所以,筆者買了好幾本統計學的教科書一一讀完,但不管哪一本都覺得看了似懂非懂,只有一知半解,令人心焦難耐。幸好在那些書籍當中,筆者遇上了霍爾(P. G. Hoel)的《數理統計:理論與應用》(Introduction to Mathematical Statistics)(培風館),在朦朧之間勉強認清了統計學的定位。霍爾著作的架構安排,明顯不同於其他書籍照本宣科的寫法,從而解決了筆者一部分的疑惑。
雖說有幸考上了研究所,然而當時的狀況卻完全稱不上學會了統計學,有種張開嘴吞吞吐吐地講不出什麼東西來的煩悶感,但卻弄不清疑點何在,因此筆者在研究所裡上完了所有統計學課程,這就是和統計學的第二次交手。
研究所開的課程不愧是由專業的統計學者來授課,令筆者獲益良多,在學習的過程中總算明白了「吞吞吐吐講不出來的東西」是什麼。
若用一句話來形容,那就是在統計學的邏輯中有某種「跳躍」的特質。在本書正文裡也有提到,推論統計是一種「由部分推測全體」的「歸納法」,而熟悉數學這種完美演繹法的筆者終於了解到,要能夠看懂並接納這種充滿跳躍的邏輯體系,就非得在腦中暫時切換掉習慣的思考方式才行。到了這個階段,筆者對統計學的了解,總算能夠達到和教科書一樣的程度。
第三次和統計學交手,是以帝京大學的教職員身分教授學生統計學。當然,筆者可以按照教科書的難度來授課,但要是教的人只能理解教科書難度的東西,聽課的人就無法達到相同水準的認知。筆者認為學生的理解之所以不夠透徹,問題不在他們的努力不夠,而在於教的人想法太膚淺。
因此這一回,筆者要以「自己的頭腦、自己的作風」從根本重新思考統計學。
筆者想以更自然、更明快、更直覺的方式,去解釋統計學「跳躍」的真面目。幸而這時筆者以一名經濟學家身分在鑽研數理經濟學研究的其中一環??「機率論的決策理論」,而在埋首於學問、認真探討何謂機率的當中,亦同時完成了自己對統計學中「跳躍」部分的獨家看法。
這項筆者的個人見解就是書中所稱呼的「預測命中區間」,它是在探討「機率中的時態在本質上是什麼」的過程中,所衍生出來的副產品。這種想法從未出現在筆者過去所讀到的教科書上,或許確實屬於異端的思維。然而在這項見解成型之後,筆者終於消解了心中對於推論統計的那股煩悶感,因此本書亦會將這項觀念完整提出。當然,這單單只是「見解」的問題,就算無法理解這一點,也不會對統計的計算和操作流程造成任何障礙,請讀者可以放心。
以這樣的個人觀點來寫書,或許會讓人以為筆者對於統計學方法抱持著批判性,不過事實卻完全相反。
筆者認為,統計學正因這樣的「跳躍」性,才能夠與現實有緊密的連結,唯有如此見解才能把統計學刻畫地栩栩如生。想必筆者是因為離開了數學的世界,跨足到闡明俗事現實的經濟學領域,才能夠衍生出這樣的想法。希望各位讀者也能藉由本書對統計學產生興趣,享受它「跳躍」的一面,進而運用在生活上面。
雖然筆者是機率論專家,卻不是統計學專才,為求慎重起見,筆者邀請了計量經濟學者──駒澤大學的飯田泰之先生替本書監修。感謝飯田先生在倉促之下仍欣然接受請託,由於當時進度緊迫,或許過程中會有一些漏看或約略讀過的而未挑出的毛病,當然,若有如此缺失全是筆者一人的責任。
最後要感謝鑽石社的和田史子女士,本書從企劃到編輯都由她一手包辦。和田女士對原稿毫不留情地提問,讓本書的每一個環節都能達到淺顯易懂,這一切的成果都源自和田女士渴望從根本上理解統計學的熱忱,而這份熱忱不僅是筆者,相信讀者也一定可以感受得出來。要是本書能夠滿足讀者您的期待,這都是拜編輯的熱忱之賜,希望大家能對此給予讚賞。
前言 本書是這樣一本統計學專著
本書是為以下讀者而寫的統計學入門書:
.第一次學習統計學的人。
.想重新學習統計學的人。
.歷經無數挫折,至今還尚未融會貫通的人。
.正為成績一落千丈而苦惱的人。
本書有別於其他教科書,具備了幾項優勢特徵,這裡就先簡單列出幾點吧!在第0講中會對此做完善的介紹,想要了解詳情的讀者請翻閱那一章節。
1「要是再刪減下去,就不算是統計學了」。這本堪稱最簡要的入門書是以最少的數學運算工具、以及最淺顯的字句所寫成。
2本書幾乎不談機率方面的知識,也完全用不到微積分和Sigma符號。書中用到的數學相當於國中程度,最難的部分僅止於根號和一次不等式。就算不懂高中數學、或是忘了也沒有關係。
3每一講都提供簡單的填充練習題,最適合自學使用。
4第一部將從最基本的概念開始學起,務求在最短時間內學會檢定和區間估計這兩項統計學最重要的項目。
5在第二部裡,將深入探討第一部的內容,運用代表統計學衣缽真傳的t分配,最有效率地完成小樣本的檢定和區間估計。只要能夠掌握基礎,就可以充分理解這個部分。
6親身體會標準差的意義,透過簡單的計算題和具體案例徹底解說。
7以統計學的角度明白股票和投資信託的風險,選擇金融商品時就能更精打細算。
那麼,我們就馬上開始吧!