第09章数值变量资料的统计推断ppt课件.ppt
《第09章数值变量资料的统计推断ppt课件.ppt》由会员分享,可在线阅读,更多相关《第09章数值变量资料的统计推断ppt课件.ppt(111页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 数值变量资料的统计推断数值变量资料的统计推断流行病与卫生统计学系流行病与卫生统计学系 王增珍王增珍.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。回顾上一章内容:回顾上一章内容:集中趋势指标:集中趋势指标:算术均数、中位数、几何均数算术均数、中位数、几何均数离散趋势指标离散趋势指标:全距、四分位数间距、全距、四分位数间距、方差、标准差、变异系数方差、标准差、变异系数正态分布:正态分布:概念、特征、面积规律、应用概念、特征、面积规律、应用医学参考值估计医学参考值估计:步骤、估计方法步骤、估计方法.A.研究武汉市大一学
2、生男性身高。研究武汉市大一学生男性身高。B.根据某几个学校男大一学生的入学体检身根据某几个学校男大一学生的入学体检身高资料,推测武汉市大一学生男性身高。高资料,推测武汉市大一学生男性身高。总体参数的估计总体参数的估计.A.经常参加锻炼的女子脉搏是否等于经常参加锻炼的女子脉搏是否等于74次次/分;分;B.比较来自中国广东省与河北省的一年级男大学生身比较来自中国广东省与河北省的一年级男大学生身高。以在武汉大学和华中科技大学的两省男生为样高。以在武汉大学和华中科技大学的两省男生为样本,得出样本均值分别为本,得出样本均值分别为168.2cm与与169.9cm,推,推测总体均值是否相等。测总体均值是否相
3、等。推测某个总体参数是否等于某个值或两个推测某个总体参数是否等于某个值或两个或两个以上的总体参数是否相等或两个以上的总体参数是否相等.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。本次讲授内容本次讲授内容n均数的抽样误差均数的抽样误差nt分布,分布,t分布与分布与u分布的区别分布的区别n总体均数的可信区间估计总体均数的可信区间估计.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。一、均数的抽样误差和标准误一、均数的抽样误差和标准误第一节 均数的抽样误差与总体均数的估
4、计.例如,从总体均数例如,从总体均数为为4.83 /L4.83 /L、标准差、标准差 为为 0.52 /L 0.52 /L的正态分布总体的正态分布总体N N(4.83,0.522)(4.83,0.522)中,随机中,随机 抽取抽取1010人为一个样本人为一个样本(n n=10=10),并计算该样本的均数、),并计算该样本的均数、标准差。如此重复抽取标准差。如此重复抽取100100次(次(g=100g=100),可得到),可得到100100份份 样本,可得到样本,可得到100100对均数对均数 和标准差和标准差S。正态总体=4.83=0.521.4.58,0.382.4.90,0.453.4.7
5、6,0.49 99.4.87,0.59100.4.79,0.39S.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。抽样误差抽样误差 sampling error of meansampling error of mean:由于抽样而引起的差异。:由于抽样而引起的差异。.图图9-1 随机抽样所得随机抽样所得100个样本均数的分布个样本均数的分布.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。标准误标准误(standard error,SE)概念:概念:样本均数的标准
6、差,可用于衡量抽样误样本均数的标准差,可用于衡量抽样误差的大小。差的大小。未知未知已知已知.计计算算了了100个个样样本本的的标标准准差差S,由由此此可可计计算算样本的标准误大小。样本的标准误大小。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。100个样本均数的抽样分布特点:样本均数的抽样分布特点:100个样本均数中,各样本均数间存在差样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。异,但各样本均数在总体均数周围波动。样本均数的分布曲线为中间高,两边低,样本均数的分布曲线为中间高,两边低,左右对称,近似服从左
7、右对称,近似服从正态分布正态分布。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。标准误的特点:当样本例数当样本例数n一定时,标准一定时,标准误与标准差呈正比;误与标准差呈正比;当标准差一定时,标准误与当标准差一定时,标准误与样本含量样本含量n的平方根呈反比。的平方根呈反比。通过增加样本含量通过增加样本含量n来降低抽样误差。来降低抽样误差。.n=5n=103 3个抽样实验结果图示个抽样实验结果图示.标准误的用途标准误的用途衡量抽样误差的大小;衡量抽样误差的大小;估计总体均数的置信区间;估计总体均数的置信区间;用于假设检验。用于假
8、设检验。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。标准误与标准差的区别与联系标准误与标准差的区别与联系区别:区别:标准误标准误 标准差标准差定义反映抽样误差 反映个体变异用途总体均数可信区间 医学参考值范围进行统计学检验 计算标准误、CV联系:联系:当当n一定时标准差大,标准误也大一定时标准差大,标准误也大.抽样实验小结抽样实验小结 样样本的均数本的均数围绕总围绕总体均数上下波体均数上下波动动。均数的均数的标标准差即准差即标标准准误误 样样本均数的本均数的标标准准误误(Standard Error)Standard Err
9、or)计计算公式算公式为为:样样本本标标准差准差/从正从正态总态总体体N N(,(,2 2)中抽取中抽取样样本,本,获获得均数得均数的分布仍近似呈正的分布仍近似呈正态态分布分布N N(,(,2 2/n n)。.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。二、二、t 分布分布(t-distribution)随机变量随机变量X XN N(m m,2 2)标准正态分布标准正态分布N N(0 0,1 12 2)u变换.均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自
10、由度:n n-1-1.图9-1 不同自由度下的t 分布图.t t 分布的特征分布的特征 以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于时,t分布即为u分布。.附表附表9-1 t 界值表界值表.参数的估计参数的估计点估计:点估计:由样本统计量由样本统计量 直接估计总体参数直接估计总体参数区间估计:区间估计:在一定置信度在一定置信度(Confidence level)下,估计总)下,估计总体参数可能存在的范围体参数可能存在的范围三、总体均数的可信区间估计三、总体
11、均数的可信区间估计.估计正确的概率估计正确的概率(1(1 )称为可信度或置信度称为可信度或置信度(confidence levelconfidence level),常取),常取9595或或9999。置信区间置信区间(confidence interval,CIconfidence interval,CI)是根据)是根据一定的置信度估计得到的区间。一定的置信度估计得到的区间。总总体体均均数数的的95%95%置置信信区区间间的的涵涵义义是是指指:从从理理论论上上来来说说,做做100100次次抽抽样样,可可算算得得100100个个置置信信区区间间,平平均均有有9595个个置置信信区区间间包包括括总
12、总体体均均数数,只只有有5 5个个置置信区间不包括总体均数。信区间不包括总体均数。(一)置信区间的有关概念(一)置信区间的有关概念.(二)总体均数置信区间的计算(二)总体均数置信区间的计算 未知,且未知,且n 较小,较小,按按t分布分布 已知,或已知,或 未知但未知但n足够大,按足够大,按 u 分布分布.u0.05/2=1.962.未知但未知但n较大时,按较大时,按u分布计算总体均数分布计算总体均数的可信区间。双侧的可信区间。双侧1-可信区间为:可信区间为:3.已知时,总体均数双侧已知时,总体均数双侧1-可信区间为:可信区间为:u0.05/2=1.96=.(四)总体均数可信区间与参考值范围的区
13、别(四)总体均数可信区间与参考值范围的区别.本讲小结 均数的抽样误差均数的抽样误差 标准误:计算公式、意义和特点标准误:计算公式、意义和特点 t分布及其特征分布及其特征 总体均数可信区间总体均数可信区间 含义含义 估计方法估计方法 与医学参考值的区别与医学参考值的区别.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。正态曲线下面积分布规律是正态曲线下面积分布规律是:A.1.96 A.1.96范围内占曲线下面积的范围内占曲线下面积的99%99%B.1.96 B.1.96范围内占曲线下面积的范围内占曲线下面积的95%95%C.1 C.
14、1 范围内占曲线下面积的范围内占曲线下面积的68%68%D.2.58 D.2.58范围内占曲线下面积的范围内占曲线下面积的95%95%E.2.58 E.2.58范围内占曲线下面积的范围内占曲线下面积的99%99%课堂练习题课堂练习题.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。某市某市120120名名1212岁男孩平均身高岁男孩平均身高X=143.10cm,X=143.10cm,S=5.67cm,S=5.67cm,则身高在则身高在128.24-157.96cm128.24-157.96cm范围内的范围内的理论频数最接近下列哪个
15、值理论频数最接近下列哪个值?A.114 B.119 A.114 B.119 C.64 D.72 C.64 D.72 E.96 E.96课堂练习题课堂练习题.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。衡量抽样误差大小的统计指标是:衡量抽样误差大小的统计指标是:A.A.标准差标准差 B.B.变异系数变异系数 C.C.方差方差 D.D.标准误标准误课堂练习题课堂练习题.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。关于关于t t值有值有:A.A.与总体均数和样本均数
16、之差成正比与总体均数和样本均数之差成正比 B.B.与标准误成反比与标准误成反比 C.C.与样本含量有关与样本含量有关 D.D.自由度一定时自由度一定时,t,t值愈大值愈大,P,P值越小值越小 E.E.符合正态分布符合正态分布 课堂练习题课堂练习题.数值变量资料的统计推断数值变量资料的统计推断第二节第二节 假设检验的基本思想和基本步骤假设检验的基本思想和基本步骤.学习要点:1.1.熟悉假设检验的基本思想和步骤;熟悉假设检验的基本思想和步骤;2.2.掌握掌握t t检验和检验和u u检验的方法;检验的方法;.(一)假设检验的基本思想(一)假设检验的基本思想利用反证法的思想假设检验的基本思想和步骤假设
17、检验的基本思想和步骤 利用小概率反证法思想,从问题的对立面(利用小概率反证法思想,从问题的对立面(H H0 0)出发间接判断要解决的问题(出发间接判断要解决的问题(H H1 1)是否成立。然后在)是否成立。然后在H H0 0成立的条件下计算检验统计量,最后获得成立的条件下计算检验统计量,最后获得P P值来判值来判断。当断。当P P小于或等于预先规定的概率值小于或等于预先规定的概率值,就是小概,就是小概率事件。根据小概率事件的原理:小概率事件在一次率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设怀
18、疑原假设H H0 0,认为其对立面,认为其对立面H H1 1成立,该结论可能犯成立,该结论可能犯大小为大小为的错误。的错误。.例例9.2 某某地地抽抽样样调调查查了了2626名名男男性性管管理理人人员员的的空空腹腹 血血 糖糖,均均 数数 为为 4.84mol/L4.84mol/L,标标 准准 差差 为为0.85mol/L0.85mol/L。已已知知大大量量调调查查的的一一般般健健康康成成年年男男性性空空腹腹静静脉脉血血糖糖的的均均数数为为4.70mol/L4.70mol/L。试试问问能能否否认认为为该该地地健健康康男男性性管管理理人人员员的的空空腹腹血血糖糖的的均均值与一般正常健康成年男性的
19、的均值不同?值与一般正常健康成年男性的的均值不同?.差异的原因:差异的原因:(1)由于抽样误差造成的由于抽样误差造成的.(实际上实际上 ,但,但由于抽样误差由于抽样误差 不能很好代表不能很好代表 )(2)该地男性管理人员的空腹血糖与一般健康成年该地男性管理人员的空腹血糖与一般健康成年男性空腹静脉血糖男性空腹静脉血糖()().假设检验的目的就是假设检验的目的就是判断差异的原因判断差异的原因:求出由抽样误差造成此差异的可能性求出由抽样误差造成此差异的可能性(概率概率P)有有多大多大!若若 P 较大较大(P0.05),认为是由于抽样误差造成的。,认为是由于抽样误差造成的。原因(原因(1),实际上),
20、实际上 若若 P 较小较小(P0.05),认为不是由于抽样误差造成的。,认为不是由于抽样误差造成的。原因(原因(2),实际上),实际上 .(二)假设检验的基本步骤(二)假设检验的基本步骤1.1.建立假设,确定检验水准建立假设,确定检验水准2.2.选定检验统计方法,计算检验统计量选定检验统计方法,计算检验统计量3.3.确定确定P P值,作出推断结论值,作出推断结论.1、建立假设,确定检验水准建立假设,确定检验水准H0:(无效(无效假设)假设)=0H1:(备择假设)(备择假设)0(0)检验水准的意义及确定检验水准的意义及确定单、双侧检验的选择:单、双侧检验的选择:(1 1)根据专业知识)根据专业知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 09 数值 变量 资料 统计 推断 ppt 课件
限制150内