本書以紮實的統計學理為根基,從樣本與母體的核心概念出發,系統性建構推論統計架構。內容涵蓋z檢定、t檢定、卡方檢定、F檢定、變異數分析、迴歸模型與貝氏方法,並深入解析其假設條件與適用情境。相較一般教材,本書特別強調現代統計實務的重要觀念,包括二元變項的常態近似條件,以及超越傳統Wald法的比例信賴區間估計,提升分析的準確性與可信度。書中結合多元案例,強化數據解讀能力,協助理解p值、信賴區間與效應量之意涵,並延伸探討民調判讀、設計效應、有效樣本數與列聯表分析等議題。在大數據與人工智慧時代,本書亦融入最新統計標準與方法,協助讀者建立嚴謹且具前瞻性的統計思維。
作者簡介:
張清濠
學歷:
國立交通大學電子研究所博士
經歷:
作者於研究所期間主修通訊與信號處理,奠定紮實之工程與數理基礎。1979年至1997年間任職於中華電信訓練所(現中華電信學院)擔任講師,致力於通訊專業人才培育;其後轉任中華電信研究所(現中華電信研究院),專注於標準時間與頻率(Standard Time and Frequency)之研究與應用。2000年進入產業界,於海德威電子工業股份有限公司歷任副總經理與總經理,主導IC後段設計,累積豐富實務經驗。自2005年起,先後於彰化師範大學、輔祥實業及亞洲大學任職,持續投入教學與產學合作。其研究領域涵蓋信號處理、統計信號處理、類神經網路與機器學習,並致力於整合理論與實務,推動工程與資料科學之跨域發展。
作者序
為什麼寫這本書?
許多統計教材往往著重於數學推導,卻在不知不覺中拉開了與讀者之間的距離,使統計成為一門看似艱深、難以親近的學科。如何跨越這道「親和力的鴻溝」,一直是統計教育者共同努力的方向。事實上,在統計推論中,思維邏輯的重要性並不亞於數學技巧。我過去擔任以推論統計為基礎的論文口試委員時,深刻體會到這一點:使用錯誤的統計方法、誤解統計結果,是研究實務中最常見的問題。因此,本書特別強調統計思維的培養,這也是筆者撰寫本書的主要動機之一。
此外,統計思維並非只存在於學術研究中,它其實深深滲透在我們的日常生活裡。例如:
• 飯前血糖為120 mg/dL,與同年齡族群相比是否偏高?
• 電動車平均耗電量為162.0 Wh/km,與同型車相比是否合理?
這些看似簡單的問題,其實都需要統計推論的觀點才能得到有意義的答案。
在更宏觀的層面,現代AI 的發展也與統計思想密不可分。大型語言模型之所以能展現驚人的能力,背後依賴的是頻率學派(Frequentist)的精神:透過海量文本資料,學習語言中不同表達方式的共同結構。而聊天機器人根據使用者回饋持續調整回應、在既有知識與新證據之間取得平衡,則體現了貝氏學派(Bayesian)的核心理念。這兩大統計學派的邏輯框架,正深刻影響著我們如何理解資料、處理不確定性,以及與智慧系統互動。
因此,本書希望帶領讀者從生活、研究與科技三個面向,重新認識統計思維的價值。統計不只是計算,更是一種理解世界的方式;不只是工具,更是一套面對不確定性的思考框架。這正是筆者撰寫本書的另一個重要動機。
為什麼需要這本書?
在資訊爆炸的時代,數據與統計結果幾乎無所不在。新聞報導常以「研究顯示⋯⋯ 」作為開場,廣告宣稱「90% 的使用者推薦⋯⋯ 」,民調機構公布「有效樣本1,070 人,在95% 信賴水準下,抽樣誤差±3%」,醫藥公司則以「第三期臨床試驗結果達統計顯著」作為產品訴求。這些資訊看似科學、客觀,但若缺乏統計素養,我們往往難以判斷其可信度與侷限。
更重要的是,在AI 與大數據快速發展的今日,統計思維已成為理解資料與做出判斷的核心能力。從大型語言模型的訓練,到推薦系統的運作,再到金融市場的風險評估,統計方法都是不可或缺的基礎。缺乏統計知識,就如同在數位時代中少了一項基本工具,難以有效理解資訊、做出判斷,甚至無法參與許多新興領域的討論。
本書的目的,即在於協助讀者建立穩固的統計思維,理解數據背後的邏輯,並能在面對各類資訊時做出更清晰、更有根據的判斷。
本書特色
生活化:每個統計概念都從日常情境出發。為什麼Google 搜尋結果如此精準?為什麼天氣預報有時失準?為什麼網路購物平台總能推薦你想要的商品?這些現象背後都有統計學的影子。
結合時事:從疫情數據分析到選舉預測,從氣候變遷到社群媒體現象,我們以最新的時事案例說明統計原理。統計學不是靜態的知識,而是理解世界的活的工具。
強調學理基礎:在重視實用性的同時,本書不犧牲學理的嚴謹性。每個概念都會交代其數學基礎與邏輯脈絡,讓讀者不僅知其然,更能知其所以然。
深入淺出:複雜的統計概念以簡潔的語言與貼近生活的比喻呈現。我們相信,任何統計概念都能用日常語言理解,關鍵在於找到合適的切入角度。
本書適合誰?
本書適合希望建立統計推論基礎的讀者,包括大學生、研究生、社會科學與工程領域的研究者,以及希望在資料科學與AI 時代提升統計素養的一般讀者。你不需要高深的數學背景,只需要基本代數能力與對資料的好奇心。
本書內容:
本書依統計推論的邏輯順序編排,從樣本與母體的基本概念出發,逐步建立各類統計檢定、迴歸模型、比例推論與進階應用的完整架構。
第一至第二章:統計推論的基礎概念
本書首先介紹樣本與母體的關係,說明樣本如何代表母體,並建立平均值、變異數與樣本分布等基本統計量的概念。這兩章奠定後續推論方法所需的數學與邏輯基礎。
第三至第四章:均值推論的方法(z 檢定與t 檢定)
接著介紹最常用的均值檢定方法。z 檢定處理大樣本或母體標準差已知的情況;t檢定則適用於小樣本與未知標準差的情境。兩章內容涵蓋檢定統計量的建構、分布特性與應用條件。
第五至第六章:類別資料與變異數的檢定(卡方與F 檢定)
當研究問題涉及頻率或類別變項時,卡方檢定提供檢驗變項關聯性的工具;而F檢定則用於比較不同群體的變異數,評估其穩定度。這兩章補足均值檢定以外的常見推論需求。
第七至第八章:迴歸分析與分類模型
線性迴歸用於分析自變項與依變項之間的線性關係;邏輯斯迴歸則處理二元分類問題,廣泛應用於醫療、行銷與社會科學。這兩章介紹模型建構、參數估計與結果解讀,是統計推論與資料科學的重要連結。
第九章:貝氏分析
本章介紹貝氏統計的基本概念,說明如何結合先驗知識與新資料進行推論。內容涵蓋貝氏定理、後驗分布與常見應用,是理解現代統計與AI 的重要基礎。
第十章:p 值的應用與反思
本章探討p 值的意義、限制與常見誤用,並說明在研究實務中可能出現的統計陷阱。透過案例分析,協助讀者建立更成熟的統計判斷能力。
第十一至第十二章:比例推論、信賴區間與民調實務
這兩章聚焦比例資料的推論方法,包括Wald、Wilson 等信賴區間的比較,以及民調中抽樣誤差與設計效應的處理。內容強調實務判讀的重要性,協助讀者正確理解民調結果。
第十三至第十四章:效應量與列聯表分析
效應量提供補充p 值的重要指標,用於衡量差異的實質大小;列聯表則是分析類別資料的基本工具,可用於檢定關聯性並衡量其強度。這兩章補強統計推論的完整性。
第十五章:回顧與前瞻
最後一章從「樣本與母體」、「關聯與預測」、「數據與判斷」三個面向統整全書內容,並討論統計在大數據、人工智慧與智慧應用中的角色,說明統計思維在現代資料環境中的持續重要性。
如何使用這本書?
雖然在寫作時我們盡力讓每一章都能獨立閱讀,但為避免重複,章節之間仍難免需要相互參照。如果你是統計學的新手,建議依照章節順序閱讀,因為後續內容多半建立在前面介紹的概念之上。
本書特別重視範例與演練。這些範例並非單純的計算題,而是引導你培養統計思維的練習,讓你在操作中理解推論的邏輯與侷限。
此外,本書並非工具書。考量到讀者取得輔助軟體的便利性,我們以Excel 為示範工具,說明如何利用內建函數計算統計量與p 值,協助你在實務中快速上手。
最後的話
統計學帶給我們的,不僅是分析數據的方法,更是一種在不確定的世界中保持理性與清明的能力。它提醒我們以謙遜的態度面對複雜現象,以嚴謹的方式檢視證據,以批判的眼光思考問題。
在假訊息氾濫、資訊真假難辨的時代,統計素養已成為現代公民不可或缺的核心能力。筆者期望這本書能成為你理解統計的嚮導,協助你在數字的海洋中辨識方向,在資訊的迷霧中看見真相。
願我們一同走進統計學的世界,探索數字背後的故事,並以統計思維作為理解現代社會的鑰匙。
作者 張清濠
2026 年3 月31 日於台中
為什麼寫這本書?
許多統計教材往往著重於數學推導,卻在不知不覺中拉開了與讀者之間的距離,使統計成為一門看似艱深、難以親近的學科。如何跨越這道「親和力的鴻溝」,一直是統計教育者共同努力的方向。事實上,在統計推論中,思維邏輯的重要性並不亞於數學技巧。我過去擔任以推論統計為基礎的論文口試委員時,深刻體會到這一點:使用錯誤的統計方法、誤解統計結果,是研究實務中最常見的問題。因此,本書特別強調統計思維的培養,這也是筆者撰寫本書的主要動機之一。
此外,統計思維並非只存在於學術研究中,它其實深深滲透在我們的日常...
目錄
第一章 樣本與母體
1.1 母體
1.2 樣本
1.3 歷史教訓
1.4 抽樣方法
1.5 數位落差與AI 挑戰
1.6 抽樣誤差與抽樣偏差
1.7 跨領域應用
1.8 從樣本推論母體
1.9 倫理考量
1.10 總結
課後作業
第二章 揭開樣本中隱藏的資訊
2.1 樣本資料描述
2.2 樣本分布型態
2.3 中央極限定理
2.4 樣本均值的抽樣分布
2.5 樣本變異數公式推導
2.6 標準差與標準誤
2.7 Z 統計量
2.8 二項分布
2.9 當樣本為單一觀測值時
2.10 總結
課後作業
第三章 推論統計的基礎:z 檢定
3.1 標準化的意義
3.2 z 檢定:定義與假設
3.3 z 檢定步驟
3.4 p 值的計算
3.5 二項分布樣本比例的z 檢定
3.6 信賴區間
3.7 相關Excel 函數
3.8 z 檢定的應用
3.9 為何需要t 檢定
3.10 總結
課後作業
第四章 小樣本的均值檢定:t 檢定
4.1 理論基礎
4.2 假設條件
4.3 t 檢定種類
4.4 信賴區間
4.5 Welch’s t 與Student’s t 檢定之比較
4.6 t 檢定的應用
4.7 t 檢定與z 檢定的比較
4.8 注意事項與侷限性
4.9 相關Excel 函數
4.10 總結
課後作業
第五章 類別變項檢定:卡方檢定
5.1 卡方分布
5.2 樣本變異數如何連結到卡方分布
5.3 進階閱讀:自由度為n - 1 的卡方分布
5.4 卡方檢定
5.5 進階閱讀:Pearson 卡方統計量
5.6 卡方檢定基本假設
5.7 卡方檢定執行步驟
5.8 卡方檢定常見應用
5.9 適合度檢定
5.10 獨立性檢定
5.11 同質性檢定
5.12 相關Excel 函數
5.13 總結
課後作業
第六章 變異數檢定:F 檢定
6.1 從樣本變異數到F 分布
6.2 F 分布特性
6.3 變異數比較
6.4 雙尾p 值
6.5 變異數比較的應用
6.6 變異數分析
6.7 ANOVA 的應用
6.8 ANOVA 分析的事後比較
6.9 F 檢定與t 檢定的關係
6.10 相關Excel 函數
6.11 總結
課後作業
第七章 線性迴歸分析
7.1 關於迴歸
7.2 從連續數據到趨勢預測
7.3 線性迴歸
7.4 最小平方法
7.5 迭代演算法
7.6 延伸閱讀:變項的共線性
7.7 殘差分析
7.8 線性迴歸模型評估指標
7.9 延伸閱讀:迴歸係數的標準誤
7.10 相關Excel 函數
7.11 總結
課後作業
第八章 類別變項分類:邏輯斯迴歸
8.1 邏輯斯迴歸:從擬合直線到決策邊界
8.2 邏輯斯迴歸的應用
8.3 從線性迴歸到邏輯斯迴歸:理論基礎
8.4 最大概似估計
8.5 最佳決策邊界
8.6 勝算比
8.7 邏輯斯迴歸模型評估指標
8.8 使用Excel Solver 找模型係數
8.9 單一自變項的迴歸模型設計
8.10 總結
課後作業
第九章 貝氏分析
9.1 頻率學派與貝氏學派
9.2 從先驗到後驗:貝氏推論基礎
9.3 貝氏統計特性
9.4 貝氏統計應用
9.5 貝氏推論
9.6 可信區間
9.7 延伸閱讀:馬可夫鏈蒙地卡羅法
9.8 樸素貝氏分類器
9.9 平滑處理
9.10 Excel 計算例
9.11 延伸範例解析
9.12 總結
課後作業
第十章 p 值背後的真相
10.1 認識幾個名詞
10.2 p 值基本概念
10.3 α 與β 間錯綜複雜的關係
10.4 α 與β 的權衡策略
10.5 多重檢定問題
10.6 p 值的真正意涵
10.7 多重檢定校正法
10.8 p 值曲線
10.9 總結
課後作業
第十一章 比例推論與信賴區間:理論基礎與民調實務
11.1 抽樣誤差是什麼
11.2 單一比例信賴區間
11.3 同一樣本下兩個二項比例之差的信賴區間
11.4 獨立樣本下兩個二項比例之差的信賴區間
11.5 顯著性檢定與信賴區間的對應關係
11.6 三人以上選舉的判讀規則
11.7 總結
課後作業
第十二章 設計效應與有效樣本
12.1 抽樣誤差來源
12.2 抽樣偏差來源
12.3 設計效應
12.4 減少設計效應的策略
12.5 範例:設計效應與有效樣本數
12.6 決定樣本數的考量因素
12.7 設計效應的報告與應用
12.8 總結
課後作業
第十三章 效應量的分類與應用
13.1 顯著性與效應量
13.2 效應量的估計與解釋
13.3 效應量的分類與應用
13.4 常見的效應量
13.5 範例:效應量的應用
13.6 貝氏觀點下的效應量與證據強度
13.7 效應量與信賴區間
13.8 總結
課後作業
第十四章 列聯表分析
14.1 列聯表的基本概念
14.2 列聯表分析:目的與方法
14.3 列聯表分析的推論基礎
14.4 列聯表的效應量
14.5 效應量的信賴區間
14.6 範例:效應量數據解讀
14.7 分層列聯表分析
14.8 Breslow-Day 同質性檢定
14.9 CMH 檢定
14.10 r×c 列聯表
14.11 總結
課後作業
第十五章 回顧與前瞻
15.1 本書內容回顧
15.2 統計數據的侷限性
15.3 統計思維在大數據與人工智慧中的角色
15.4 總結
後記
附錄A t 分布的來源
A.1 有關t 分布的兩種不確定性來源
A.2 樣本變異數本質上是「平方的和」
A.3 樣本平均數與樣本變異數相互獨立(常態分布獨有的性質)
A.4 將「平均數的不確定性」與「標準誤的不確定性」結合
A.5 總結
附錄B 邏輯斯迴歸進階模型評估指標
B.1 對數損失(Log Loss)
B.2 Pseudo-R2 指標
B.3 概似比檢定(Likelihood Ratio Test, LRT)
B.4 計算例
B.5 評估指標總結
附錄C Score Test 與Wilson 信賴區間的關係
C.1 Score Test 是什麼?
C.2 反轉Score Test 得到Wilson 區間
C.3 為何中心點會向0.5 收縮?
C.4 結論 407
附錄D 貝氏因子的數學推導
D.1 模型設定
D.2 邊際概似
D.3 貝氏因子
附錄E 超幾何分布與Fisher’s Exact Test
E.1 超幾何分布的定義
E.2 分布特性
E.3 與二項分布的關係
E.4 超幾何分布與2×2 列聯表
E.5 Fisher’s exact test 的基本邏輯
E.6 與卡方檢定的關係
E.7 結論
附錄F 統計檢定方法指南
參考文獻
第一章 樣本與母體
1.1 母體
1.2 樣本
1.3 歷史教訓
1.4 抽樣方法
1.5 數位落差與AI 挑戰
1.6 抽樣誤差與抽樣偏差
1.7 跨領域應用
1.8 從樣本推論母體
1.9 倫理考量
1.10 總結
課後作業
第二章 揭開樣本中隱藏的資訊
2.1 樣本資料描述
2.2 樣本分布型態
2.3 中央極限定理
2.4 樣本均值的抽樣分布
2.5 樣本變異數公式推導
2.6 標準差與標準誤
2.7 Z 統計量
2.8 二項分布
2.9 當樣本為單一觀測值時
2.10 總結
課後作業
第三章 推論統計的基礎:z 檢定
3.1 標準化的意義
3.2 z 檢定:定義與假設
3.3 z 檢定步驟...