公衛、醫療健康相關系所、公衛師國家考試,一定要必備的一本書!
各大學公衛相關系所的學者們齊力著作。
│當代公共衛生學叢書│
臺灣於2020年完成公共衛生師立法,每年舉行國家考試,科目包含:衛生法規及倫理、生物統計學、流行病學、衛生行政與管理、環境與職業衛生、與健康社會行為學。本叢書由各領域專家共同撰寫,不管是當成授課教材或學生自習,都是最佳選擇。
│生物統計學│
《生物統計學》涵蓄本領域重要的核心能力及觀念,內容分為五大單元:一、描述性統計與基礎機率概念;二、估計與檢定的統計推論;三、常用統計檢定方法,四、相關指標與迴歸分析;五、抽樣與存活資料分析。除解說原理,各章都有實例資料與統計軟體程式,提升自行分析的能力。
作者簡介:
陳為堅 國立臺灣大學流行病學與預防醫學研究所特聘教授;國家衛生研究院副院長
李玉春 國立陽明交通大學衛生福利研究所、跨專業長期照顧與管理碩士學位學程兼任教授
陳保中 國家衛生研究院國家環境醫學研究所特聘研究員兼所長;國立臺灣大學環境與職業健康科學研究所特聘教授
蕭朱杏 國立臺灣大學健康數據拓析統計研究所教授
梁文敏 中國醫藥大學醫務管理學系教授
作者群
(依姓名筆劃排列)
王世亨 國家衛生研究院高齡醫學暨健康福祉研究中心副研究員
王彥雯 國立臺灣大學健康數據拓析統計研究所助理教授
李中一 國立成功大學公共衛生學科暨研究所教授
李文宗 國立臺灣大學健康數據拓析統計研究所教授
林逸芬 國立陽明交通大學公共衛生研究所教授
梁文敏 中國醫藥大學醫務管理學系教授
梁富文 高雄醫學大學公共衛生學系副教授
陳錦華 臺北醫學大學大數據科技及管理研究所教授
楊奕馨 國家衛生研究院癌症研究所研究員
温淑惠 慈濟大學公共衛生學系教授
蕭朱杏 國立臺灣大學健康數據拓析統計研究所教授
章節試閱
第 6 章 點估計與區間估計及應用
前 言
統計學主要分為描述性統計(descriptive statistics)與推論性統計(inferential statistics)兩大部分。而推論性統計的基礎,主要係建立在前一章所介紹的統計值之機率分布(或稱抽樣分布)之上。推論性統計中最常見的兩大部分為估計(estimation)與假說檢定(或稱假設檢定hypothesis testing),而估計又分為點估計(point estimation)及區間估計(interval estimation)。在推論性統計的入門課程上,最常見到透過樣本平均值( )的抽樣分布,來帶領大家瞭解估計與假說檢定的基本原理。本單元主要著重於估計的部分,假說檢定則在後續的章節介紹。
第一節 點估計
一、母體參數的點估計
點估計(point estimation)是指根據樣本資料求得一統計值(例如 、s2)來估計未知母體參數(例如 μ、δ2)的方法,因而此統計值又稱為估計(estimate)或點估計值(point estimate),其公式通常稱為點估計式(point estimator)。例如以 估計 μ,符號上可記為 ,則 稱為μ的估計式,若由樣本資料得到 =8,則稱8為μ的估計值(estimate)。同理,若以 s2 估計 δ2,符號上可記為 , 稱為 δ2 的估計式,若由樣本資料得到 s2=1.44,則稱1.44為 δ2 的估計值。
二、用標準誤來表示點估計可能的誤差
點估計畢竟只提供一個值,並無法表現出可能的誤差大小,而且實務上,一般僅利用一組樣本資料來進行推估,所以可以想見不同組樣本所得到的估計值將有所不同,且與真值之間的誤差亦有所不同。那麼,統計學上是如何來瞭解甚至控制這些可能誤差呢?前面單元所介紹的統計值的抽樣分布可用來作為說明這些誤差的依據。以 估計 μ 為例, 之抽樣分布中的標準差可用來表示估計值與真值μ之間可能的誤差大小,故一般而言,估計值的抽樣分布中的標準差,又稱為標準誤(standard error, se),命名原因主要是它可以用來表示估計值與真值之間誤差的大小。標準誤與標準差在應用時,主要不同之處在於標準誤一般係用於評估誤差大小,而標準差則是用於描述資料的分散程度;兩者均是描述分散程度的指標,只是標準誤是描述估計值(或稱統計值或點估計值)的分散程度。再以估計 μ 為例, 之抽樣分布中的標準差 ,若從描述資料來看,它可表示 的分散程度,然而從統計推論來看,它稱之為平均值的標準誤(standard error of the mean),可用以推論樣本平均值與母體平均值之間的誤差大小。
標準誤在推論性統計上是非常重要且常見的指標,然而,其公式中有些參數是未知的需要由樣本去估計。例如上例平均值的標準誤,其中母體參數經常是未知的,故可用樣本標準差 s 去估計 δ,其估計式為 ,其中 s 為樣本標準差,定義為 。
範例一:某研究者感興趣的特質是臺灣幼稚園大班學童的身高,研究者在兒童樂園收集了100位大班學童自願受試者的身高,計算出樣本平均值為115公分及樣本標準差為4公分。試估計臺灣幼稚園大班學童身高平均值,以及平均值的標準誤?
首先以樣本平均值推估母群體平均值,可得
接著,估計平均值的標準誤如下:
[...]
第 6 章 點估計與區間估計及應用
前 言
統計學主要分為描述性統計(descriptive statistics)與推論性統計(inferential statistics)兩大部分。而推論性統計的基礎,主要係建立在前一章所介紹的統計值之機率分布(或稱抽樣分布)之上。推論性統計中最常見的兩大部分為估計(estimation)與假說檢定(或稱假設檢定hypothesis testing),而估計又分為點估計(point estimation)及區間估計(interval estimation)。在推論性統計的入門課程上,最常見到透過樣本平均值( )的抽樣分布,來帶領大家瞭解估計與假說檢定的基本原理。本...
作者序
本書最主要的目的是希望能呈現公共衛生與生物醫學領域中必須具備的生物統計學知識。內容包含了生物統計學的基礎與應用,基礎的部分在多數同類型的教科書中都找得到,但本書敘述的方式不以數學推導為主,較偏重利用例子的方式來說明與論述,尤其著重在公共衛生與生物醫學領域中的應用,好讓讀者理解這些知識在實務上與現代人的關係。舉例來說,有些作者可能偏好將條件機率表達成數學式子,本書則強調在日常生活或相關研究中,哪些情境使用了條件機率。又例如羅吉斯迴歸模式可以表示變數之間的關係,本書則增加章節來說明羅吉斯迴歸模式在現代統計學習、機器學習中的應用。
本書不同於其他書籍的第二個特點是,在介紹資料收集時,本書介紹了全國性調查資料、臨床試驗資料、全民健康保險資料庫及人體生物資料庫等,希望能引導讀者進入數據的寶庫中思考問題,進而引發統計運用的需求。本書還有一個特點是增加了程式語言的編碼說明,在不同的章節中,加入EXCEL 或是R 程式語言的編碼來說明如何進行分析。
本書還有一個特別的地方是納入了抽樣方法與存活分析,這兩類統計方法經常使用於公共衛生調查研究或是生物醫學相關研究當中,也是現今相關研究者必須具備的知識。所以本書的第五部分包含了一章抽樣設計與分析以及一章存活資料分析,希望能讓讀者具備這兩類方法的基本知識,未來有能力研讀更進階的相關統計書籍。
本書的編寫是以教科書的方式著手,內容分為五篇,分別是第一篇的描述性統計及基礎機率概念、第二篇的估計與檢定的統計推論、第三篇的常用的統計檢定方法之原理、假設、使用時機、計算及應用、第四篇的相關指標與迴歸分析、第五篇的抽樣與存活資料分析。全部內容不易在一個學期內教完,兩個學期可能是比較理想的狀況。每一章前面的學習目標,讓讀者容易掌握重點與脈絡,建議讀者讀完每一章後,可以逐一檢視是否達標,並嘗試自己表達學習到的成果,讓統計不再只是─ 生物iv 統計學一堆的數學符號,而是有故事性的學科。此外,每一章後面均附有練習題目,讓讀者可以藉此機會評估自己對該章內容的理解程度。本書的內容也參考了考選部制定的公共衛生師考試中「生物統計學」這個科目的命題大綱,有興趣的考生也可以使用本書作為參考書籍。
這本書是受到陳拱北基金會的邀請,在當代公共衛生學叢書的總主編陳為堅老師、李玉春老師、陳保中老師的帶領下才有機會完成。參與本書撰寫及審查的老師來自臺灣不同學校與單位,還有編輯助理楊文愷、賴柏融兩位同學的協助,在大家同心協力之下,才可能完成,感謝每一位參與及支持的人。
主編:蕭朱杏、梁文敏 謹誌
本書最主要的目的是希望能呈現公共衛生與生物醫學領域中必須具備的生物統計學知識。內容包含了生物統計學的基礎與應用,基礎的部分在多數同類型的教科書中都找得到,但本書敘述的方式不以數學推導為主,較偏重利用例子的方式來說明與論述,尤其著重在公共衛生與生物醫學領域中的應用,好讓讀者理解這些知識在實務上與現代人的關係。舉例來說,有些作者可能偏好將條件機率表達成數學式子,本書則強調在日常生活或相關研究中,哪些情境使用了條件機率。又例如羅吉斯迴歸模式可以表示變數之間的關係,本書則增加章節來說明羅吉斯迴歸模式在現...
目錄
第一篇 描述性統計與基礎機率概念
第1 章 資料的收集與呈現 │陳錦華
第2 章 瞭解與表達資料的特性 │梁富文
第3 章 生活中的機率與應用 │温淑惠
第4 章 母體的機率模式與特性 │蕭朱杏
第二篇 估計與檢定的統計推論
第5 章 統計值之抽樣分布 │王世亨
第6 章 點估計與區間估計及應用 │梁文敏
第7 章 假說檢定 │王世亨
第8 章 假說檢定可能發生的錯誤及樣本數的推估 │梁文敏
第三篇 常用的統計檢定方法之原理、假設、使用時機、計算及應用
第9 章 單一樣本的統計檢定 │陳錦華
第10 章 兩組樣本的統計檢定 │王彥雯.
第11 章 類別資料的相關性分析與檢定:列聯表分析 │蕭朱杏 .
第12 章 多組樣本的統計檢定 │李中一
第13 章 無母數統計方法 │楊奕馨
第四篇 相關指標與迴歸分析
第14 章 簡單及複線性迴歸分析 │温淑惠
第15 章 簡單及複羅吉斯迴歸分析 │王彥雯
第五篇 抽樣與存活資料分析
第16 章 抽樣設計和分析 │李文宗
第17 章 存活資料分析 │林逸芬
附表
名詞索引
第一篇 描述性統計與基礎機率概念
第1 章 資料的收集與呈現 │陳錦華
第2 章 瞭解與表達資料的特性 │梁富文
第3 章 生活中的機率與應用 │温淑惠
第4 章 母體的機率模式與特性 │蕭朱杏
第二篇 估計與檢定的統計推論
第5 章 統計值之抽樣分布 │王世亨
第6 章 點估計與區間估計及應用 │梁文敏
第7 章 假說檢定 │王世亨
第8 章 假說檢定可能發生的錯誤及樣本數的推估 │梁文敏
第三篇 常用的統計檢定方法之原理、假設、使用時機、計算及應用
第9 章 單一樣本的統計檢定 │陳錦華
第10 章 兩組樣本的統計檢...