統計學一點都不難!
本書特色
- 針對台灣讀者全新修訂,讓學習統計的道路更暢通!
- 生活化舉例,瞬間掌握重點。
- EXCEL 實作教學,即學即用!
- 由淺入深,不知不覺中已功力大增!
只要翻開第一頁,開始讀,就代表你要懂了!
「機率、統計」是一種數學的活用方法,目的是幫助我們「掌握資訊的特色」,進而「預測未來」。
懂得利用EXCEL做出專業統計圖表,便能讓主管刮目相看、平步青雲;
無論你是職場新鮮人、自己開店當老闆,學會機率、統計的概念都能在資訊爆炸的今日撥開迷霧,洞見方向。
數字最誠實,想要掌握資料的本質、預測未來潮流,機率與統計是最聰明有效的工具。
作者簡介:
鈴木香織
京都大學情報研究科博士前期課程修了 (情報學碩士 )。曾任大型 IT 企業研究員 ,現任職於 大型 SI 企業, 負責人工智慧(Artificial Intellegence)與機械學習的研究、調查。
相關著作
《圖解 機率、統計》
竹原一彰
青山學院大理工研究科博士前期課程修了 (理學碩士 )。
現任職於大型 SI 企業 ,負責 應用「統計的 機械學習理論」AI 與自然語言處理應用的研究、開發。
相關著作
《圖解 機率、統計》
譯者簡介:
李貞慧
台大工商管理學系畢業,日本國立九州大學經濟學碩士,取得中國生產力中心第十屆中日同步口譯人才培訓研習班結業證書,擅長中日對譯,目前專職從事醫學、核能、光電、機械設備、電機工程、金融商業、美容等口筆譯工作。
作者序
前言
大家聽到「機率、統計」會想到什麼呢?我想在我們的身邊,常有機會聽到用機率表示的資訊,像是氣象預報或市場趨勢
預測等。這種預測未來的資訊,其背後就是機率、統計理論的活用。
現在大家從網路上很輕易地就可以取得大量的文章或統計資料。用來從這些資料中找出定律的機率、統計知識,地位因此可以說是越來越重要了。
而且這些知識也廣泛應用在自然科學、經濟學、心理學等範疇中,今後與其他範疇交流的機會也必然會增加,實在是一門非常有趣且有未來性的學問。
本書針對第一次接觸到「機率、統計」的人,彙整了短期內可學會機率、統計的內容,包含統計能做到什麼樣的估計與檢定等重要概念。
為了避免突然接觸定義或公式會嚇壞初學者,也為了討厭數學的人,所以解說時盡量從為什麼會這麼想、為什麼必須有這樣的理論切入。再經由仔細的圖解、用Excel 的初步實驗等加以補充,希望能讓讀者對機率、統計有正確的認識。當然,第3 章以後就是正規的內容,會出現比較難的定義或公式,但相信讀者還是可以理解機率、統計的。
學會機率、統計的完整概念之後,本書也針對目前廣受矚目的應用範疇,如「資料探勘」(data mining)或「自然語言處
理」(natural language processing)等,進行簡單的的基礎解說,內容精采豐富。
〈本書目的〉
本書四大目標:
1. 由平均或變異數等基本統計量之計算,到估計、檢定為止,讓讀者理解機率、統計的完整概念。
2. 同時理解這些概念與理論,為什麼會這麼想、為什麼必須有這樣的公式。
3. 了解資料探勘或自然語言處理等應用範疇,成為進一步學習的動機。
4. 可以用Excel 進行機率、統計的初步實驗。
希望各位讀者都能理解到機率、統計的基礎與樂趣,甚至讓本書成為你進一步學習的動機,這就是我們最高的喜悅。
最後在此向製作本書相關之編輯群、設計人員、插圖人員等,致上最深的謝意。
鈴木香織、竹原一彰
前言
大家聽到「機率、統計」會想到什麼呢?我想在我們的身邊,常有機會聽到用機率表示的資訊,像是氣象預報或市場趨勢
預測等。這種預測未來的資訊,其背後就是機率、統計理論的活用。
現在大家從網路上很輕易地就可以取得大量的文章或統計資料。用來從這些資料中找出定律的機率、統計知識,地位因此可以說是越來越重要了。
而且這些知識也廣泛應用在自然科學、經濟學、心理學等範疇中,今後與其他範疇交流的機會也必然會增加,實在是一門非常有趣且有未來性的學問。
本書針對第一次接觸到「機率、統計」的人,彙整了短期內可學會機...
目錄
Ch1 沒有公式!統計、機率入門
1-1 什麼是統計?......知道統計可以做什麼
1-2 機率、統計的起源......思考機制的機率與分析結果的統計
1-3 機率、統計的基本概念......了解機率與統計的概念差異
1-4 統計的二大範圍......敘述統計與推論統計
1-5 了解樣本與母體的特徵......用敘述統計了解資料的特徵
1-6 推論並理解未知的樣本......推論統計的手法:估計與檢定
1-7 用數值表示可能發生的程度......偶發事件的發生法則
1-8 機率與推論統計的密切關係......機率的關鍵字就是推論統計
1-9 機率、統計的應用......由資料探勘到文章開採
1-10 統計軟體的介紹......試算表軟體與統計解析軟體
Ch2 不可不知!統計的便利工具
2-1 理解資料的特微、性質......統計的第一個角色:敘述統計
2-2 直方圖......將頻率改以圖形表示,掌握離散的全貌
2-3 統計量......表示樣本、母體的特徵
2-4 平均數......最初做為資料基準的數值
2-5 中位數(中間值、中數)......按大小排列樣本時位於中間位置的數值
2-6 眾數......樣本內最容易出現的數值
2-7 樣本變異數① 表示資料離散程度......了解樣本的離散程度
2-8 樣本變異數② 誤差的平方......合計差的平方
2-9 由統計量掌握樣本趨勢的訣竅......左右的均衡與尾部的長度
2-10 母體與母數......隱藏在樣本之下的母體
2-11 不偏估計量......母數估計量與樣本敘述統計量的誤差
2-12 不偏變異數、標準差......母數的估計量與樣本敘述統計量的誤差
Excel的利用① 求統計量的函數
Ch3 統計背後的主角!機率的基礎
3-1 了解機率的第一步① 機率的基礎......請記住這個關鍵字:機率與機率變數
3-2 了解機率的第一步② 事件與離散程度......請記住這個關鍵字:試驗與機率分配
3-3 機率分配與母數......機率分配與統計量
3-4 使用機率分配的優點......可以推論不在樣本內的事件
3-5 機率分配與期望值、變異數......由機率分配計算期望值、變異數的方法
3-6 常態分配① 代表性的機率分配......常態分配與標準常態分配
3-7 常態分配② 常態分配的母數......常態分配的μ與 σ
3-8 常態化、標準化......偏差值的計算方法
3-9 大數法則......理想的機率分配與現實的誤差
3-10 中央極限定理與常態分配......樣本平均與常態分配的關係
3-11 樣本與統計量的分配......常態分配、t分配、X2分配
3-12 各種機率分配......周遭常見的機率分配
3-13 二項分配......銅板正反面的分配
3-14 Poisson分配......表示故障率與意外率的分配
Excel的利用② 由製作樣本資料到偏差值
Ch4 利用線索,進行推理,找出真相!估計
4-1 估計......估計就是推論母體的性質
4-2 信賴水準與信賴區間......最常用的是95%或99%的信賴係數
4-3 常態分配之母體平均數估計① ......找出樣本的機率分配
4-4 常態分配之母體平均數估計② ......常態分配表的查法與信賴區間之設定
4-5 常態分配之母體平均數估計③ ......導出區間估計所需的不等式
4-6 常態分配之母體平均數估計④ ......復習區間估計的步驟
4-7 t分配之母體平均數估計① ......導入t分配的理由
4-8 t分配之母體平均數估計② ......t分配表的看法
4-9 t分配之母體平均數估計③ ......使用t分配實踐區間估計
4-10 X2分配之區間估計① ......有關統計量 X2
4-11 X2分配之區間估計② ......X2分配表的查法
4-12 X2分配之區間估計③ ......使用 X2分配實踐區間估計
Excel的利用③ 求出機率分配的信賴區間
Ch5 驗證,假設,找出真相!檢定
5-1 假設與檢定......什麼是假設、檢定?
5-2 虛無假設與對立假設......檢定時建立假設的方法
5-3 雙尾檢定與單尾檢定......設定適合對立假設的棄卻域
5-4 t檢定① 雙尾檢定......使用t分配之母體平均數雙尾檢定
5-5 t檢定② t分配表......由雙尾檢定的t分配導出結論
5-6 X2檢定① 母體變異數檢定......使用 X2分配之母體變異數檢定
5-7 X2檢定② X2分配表......由單尾檢定之 X2分配導出結論
Excel的利用④ t檢定
Excel的利用⑤ X2檢定
Ch6 統計的精髓!資料探勘之應用
6-1 什麼是資料探勘......發現隱藏的知識與法則的技術
6-2 關聯法則① 購物籃分析......讓資料探勘一舉成名的技術
6-3 關聯法則② 關聯法則的機制......找出機制的二大重點
6-4 關聯法則③ 關聯與因果的差異......重點是同時發生,還是依序發生
6-5 分類預測① 分類預測問題......了解代表性的分類預測技術
6-6 分類預測② K鄰近法的機制......估計分類的計算步驟
6-7 分類預測③ K鄰近法範例......了解特定未知生物的過程
6-8 分類預測④ K鄰近法與直方圖的關係......直方圖的做法與應用
6-9 分群① 分類的手法......將樣本分成群集的手法
6-10 分群② k-means分群法的機制......決定群集重心推論平均
6-11 分群③ k-means分群法的範例......k-means分群法的注意事項
6-12 分群④ 時間序列分群法......用k-means分群法解讀銷售數量資料
6-13 分群⑤ 階層式分群法......樹狀圖的計算方法
6-14 使用分群抽出特徵......要探勘複雜的圖像資料
Ch7 統計的精髓!語言資料的統計學
7-1 語言資料的統計學......語言與統計學的交點
7-2 齊普夫定律① 定律的含義......出現頻率與順序的密切關係
7-3 齊普夫定律② 使用定律計算......試試看齊普夫定律
7-4 資訊量① 資訊量的測量法與圖表化......因發生機率而異的資訊量
7-5 資訊量② 資訊量的定義......使用函數計算資訊量
7-6 熵① 全體資訊源的不確定性......求出資訊源產生的平均值
7-7 熵② 計算與性質......計算求出不確定性
7-8 機率論語言模型入門......用機率掌握語言的機制
7-9 N-gram語言模型① Shannon Game ......單純又有力的機率論語言模型
7-10 N-gram語言模型② N-gram語言模型定義......使用2-gram語言模型的單字出現機率
7-11 N-gram語言模型③ 字串的出現機率......計算字串的出現機率
7-12 語言熵......測量語言複雜性的指標
7-13 聊天機器人① 會話程式......人類的對話機制
7-14 聊天機器人② N-gram語言模型的應用......要讓程式發生語言文字
7-15 語言資料的統計學彙總......為了進一步學習
附錄 請記起來! 符號&公式、圖表
Ch1 沒有公式!統計、機率入門
1-1 什麼是統計?......知道統計可以做什麼
1-2 機率、統計的起源......思考機制的機率與分析結果的統計
1-3 機率、統計的基本概念......了解機率與統計的概念差異
1-4 統計的二大範圍......敘述統計與推論統計
1-5 了解樣本與母體的特徵......用敘述統計了解資料的特徵
1-6 推論並理解未知的樣本......推論統計的手法:估計與檢定
1-7 用數值表示可能發生的程度......偶發事件的發生法則
1-8 機率與推論統計的密切關係......機率的關鍵字就是推論統計
1-9 機率、統計的應用......由資料探勘...