统计学课件-ch03总体均数的估计与假设检验.ppt
《统计学课件-ch03总体均数的估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《统计学课件-ch03总体均数的估计与假设检验.ppt(126页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验1课件讲述内容:讲述内容:n第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误n第二节第二节 t t 分布分布n第三节第三节 总体均数的估计总体均数的估计n第四节第四节 t t 检验检验n第五节第五节 假设检验的注意事项假设检验的注意事项n第六节第六节 正态性检验和两样本方差比较的正态性检验和两样本方差比较的 F F 检验检验2课件第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误3课件统计推断:由样本信息推断总体特征统计推断:由样本信息推断总体特征。样本统计指标样本统计指标(统计量)(统计量)总体统计指标总体统计指
2、标(参数)(参数)正态(分布)总体:正态(分布)总体:推断推断 !说明!说明!为说明抽样误差规律,先用一个实例,后为说明抽样误差规律,先用一个实例,后引出理论。引出理论。4课件图图3-11999年某市年某市18岁男生身高岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图 5课件见见P3436表表3-16课件将将此此100个个样样本本均均数数看看成成新新变变量量值值,则则这这100个样本均数构成一个样本均数构成一新分布新分布,绘制直方图。,绘制直方图。图图3-2从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布随机抽样所得样本均数分布7课件 ,各样本均数各样
3、本均数未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样样本本均均数数的的分分布布为为中中间间多多,两两边边少少,左左右右基基本本对称。对称。样样本本均均数数的的变变异异范范围围较较之之原原变变量量的的变变异异范范围围大大大缩小。大缩小。可可算算得得这这100个个样样本本均均数数的的均均数数为为167.69cm、标标准准差为差为1.69cm。样本均数的抽样分布具有如下样本均数的抽样分布具有如下特点:特点:8课件1、抽样误差:、抽样误差:由个体变异产生的、抽样造成的样由个体变异产生的、抽样造成的样本统计量与总体参数的差别本统计量与总体参数的差别 均数的抽样误差:均
4、数的抽样误差:由于抽样造成的由于抽样造成的样本均数与总体均数的差别样本均数与总体均数的差别 原因:原因:1 1)抽样)抽样 2 2)个体差异)个体差异9课件本书以本书以n=60n=60为界限为界限10课件表表示示样样本本统统计计量量抽抽样样误误差差大大小小的的统统计计指标。指标。均均数数标标准准误误:说说明明均均数数抽抽样样误误差差的的大小,总体计算公式大小,总体计算公式(3-1)2、标准误标准误(standarderror,SE)实质:样本均数的标准差实质:样本均数的标准差11课件数理统计证明:数理统计证明:12课件若用样本标准差若用样本标准差S 来估计来估计,(3-2)降低抽样误差的途径有
5、降低抽样误差的途径有:通过增加样本含量通过增加样本含量n;通过设计减少通过设计减少S。13课件第二节第二节t 分布分布(t-distribution)14课件一、一、t 分布分布的概念的概念15课件16课件式中式中为自由度为自由度(degreeoffreedom,df)3实实际际工工作作中中,由由于于 未未知知,用用 代代替替,则则 不不再再服服从从标标准准正正态态分分布布,而而服从服从t t 分布。分布。17课件二、二、t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度18课件图3-3不同自由度下的t 分布图19课件1特征:特征:20课件2 t界界值值表表:详详见见附附表表2,
6、可可反反映映t分分布布曲曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用表示。表示。21课件-tt022课件23课件第三节第三节 总体均数的估计总体均数的估计24课件一、参数估计一、参数估计 用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数(和用样本均数(和标准差)推断总体均数。标准差)推断总体均数。25课件26课件按按预预先先给给定定的的概概率率(1 )所所确确定定的的包包含未知总体参数的一个范围。含未知总体参数的一个范围。总总体体均均数数的的区区间间估估计计:按按预预先先
7、给给定定的的概概率率(1 )所所确确定定的的包包含含未未知知总总体体均均数数的的一个范围。一个范围。如如给给定定=0.05,该该范范围围称称为为参参数数的的95%可可信信区区间或置信区间;间或置信区间;如如给给定定=0.01,该该范范围围称称为为参参数数的的99%可可信信区区间或置信区间。间或置信区间。2区间估计区间估计(intervalestimation):27课件二、总体均数可信区间的计算二、总体均数可信区间的计算28课件 1.1.单一总体均数的可信区间单一总体均数的可信区间29课件30课件P25,15号样本号样本31课件32课件33课件例例3-3某地抽取正常成年人某地抽取正常成年人20
8、0名,测得名,测得其血清胆固醇的均数为其血清胆固醇的均数为3.64mmol/L,标准差,标准差为为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数的固醇均数的95%可信区间。可信区间。34课件故故该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的双双侧侧95%可信区间为可信区间为(3.47,3.81)mmol L。35课件36课件37课件38课件例例3-4为为了了解解氨氨甲甲喋喋呤呤(MTX)对对外外周周血血IL-2水水平平的的影影响响,某某医医生生将将61名名哮哮喘喘患患者者随随机机分分为为两两组组。其其中中对对照照组组29例例(),采采用用安安慰慰
9、剂剂;实实验验组组32例例(),采采用用小小剂剂量量氨氨甲甲喋喋呤呤(MTX)进进行行治治疗疗。测测得得对对照照组组治治疗疗前前IL-2的的均均数数为为20.10IU/ml(),标标准准差差为为7.02IU/ml();试试验验组组治治疗疗前前IL-2的的均均数数为为16.89IU/ml(),标标准准差差为为8.46IU/ml()。问问两两组组治治疗疗前前基基线线的的IL-2总总体均数相差有多大?体均数相差有多大?39课件第一步:第一步:40课件能否下两组能否下两组IL-2的总体均数的总体均数“不同不同”或或“有差别有差别”的结的结论?论?41课件三、可信区间的确切涵义三、可信区间的确切涵义42
10、课件 观察观察p25p25表表3-13-1:当当1 =95%时,在算得的时,在算得的100个可信区间中,有个可信区间中,有95个可信区间包含个可信区间包含了总体均数,而另外了总体均数,而另外5个个(表表3-1中第中第20号、号、31号、号、54号、号、76号和号和82号号)不包不包括。括。43课件如如果果能能够够进进行行重重复复抽抽样样试试验验,平平均均有有1 (如如95%)的的可可信信区区间间包包含含了了总总体体参参数数,而而不不是是总总体体参参数数落落在在该该范范围围的的可可能能性性为为1 。但但在在实实际际工工作作中中,只只能能根根据据一一次次试试验验结结果果估估计计可可信信区区间间,如
11、如例例3-3,95%的的可可信信区区间间为为3.473.81mmol L,就就认认为为该区间包含了总体均数该区间包含了总体均数 。可信区间的确切涵义:44课件一一是是可可信信度度1 ,愈愈接接近近1愈愈好好,如如99%的的可信度比可信度比95%的可信度要好;的可信度要好;二是区间的宽度,区间愈窄愈好。二是区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。在在可可信信度度确确定定的的情情况况下下,增增加加样样本本含含量量可可减减小区间宽度。小区间宽度。可信区间估计的优劣取决于两个方面可信区间估计的优劣取决于两个方面:45课件四、总体均数可信区间
12、四、总体均数可信区间与参考值范围的区别与参考值范围的区别46课件*也可用对应于双尾概率时也可用对应于双尾概率时),*也可用对应于双尾概率时也可用对应于双尾概率时)表表3-2总体均数的可信区间与参考值范围的区别总体均数的可信区间与参考值范围的区别47课件第四节第四节t 检验检验48课件1 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t t检验检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2 2、两个样本均数、两个样本均数 与与 比较的比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3 3、配对设计资料均数比较
13、的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数 与 是否有差别用配对设计。t t 检验,亦称检验,亦称student student t t 检验检验,有有下述情况下述情况:49课件 对于大样本对于大样本,也可以近似用也可以近似用u u检验检验50课件t 检验的应用条件:检验的应用条件:51课件 假设检验过去称显著性检验。它是利假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否是否成立。然后在成立。然后在H0成立的条件下计算检验成立的条件下计算检验统计量,最
14、后获得统计量,最后获得P值来判断值来判断。假设检验基本思想及步骤基本思想及步骤52课件例例3-5某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,算算得得其其 均均 数数 为为 130.83g/L,标标 准准 差差 为为25.74g/L。问问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白白是是否否不不同同于于正正常常成成年年男男性性平平均均值值140g/L?53课件 假假设设检检验验的的目目的的就就是是判判断断差差别别是由哪种情况造成的是由哪种情况造成的单纯单纯抽样误差造成的抽样误差造成的抽样误差和本质差异造成的抽样误差和本质差异造成的54课件正
15、常成年男性正常成年男性血红蛋白血红蛋白140g/L130.83g/L男性铅作业工人男性铅作业工人血红蛋白血红蛋白140g/L一种假设一种假设H0另一种假设另一种假设H1抽样误差抽样误差总体不同总体不同55课件56课件H1的的内内容容直直接接反反映映了了检检验验单单双双侧侧。若若H1中中只只是是 0或或 0,则则此此检检验验为为单单侧侧检检验验。它不仅考虑有无差异,而且还考虑差异的方向。它不仅考虑有无差异,而且还考虑差异的方向。单单双双侧侧检检验验的的确确定定,首首先先根根据据专专业业知知识识,其其次次根根据据所所要要解解决决的的问问题题来来确确定定。若若从从专专业业上上看看一一种种方方法法结结
16、果果不不可可能能低低于于或或高高于于另另一一种种方方法法结结果果,此此时时应应该该用用单单侧侧检检验验。一一般般认认为为双双侧侧检检验较保守和稳妥。验较保守和稳妥。57课件(3)检检验验水水准准,过过去去称称显显著著性性水水准准,是是预预先先规规定定的的概概率率值值,它它确确定定了了小小概概率率事事件件的的标标准准。在在实实际际工工作作中中常常取取 =0.05。可可根根据据不同研究目的给予不同设置。不同研究目的给予不同设置。58课件 根据变量和资料类型、设计方根据变量和资料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类
17、型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量59课件 P的的含含义义是是指指从从H0规规定定的的总总体体随随机机抽抽样样,抽抽得得等等于于及及大大于于(或或/和和等等于于及及小小于于)现现有有样样本本获获得得的的检检验统计量验统计量(如如t、u等等)值的概率。值的概率。例例 3-5的的 P值值 可可 用用 图图 3-5说说 明明,P为为 在在=0=140g/L的的前前提提条条件件下下随随机机抽抽样样,其其t小小于于及及等等于于2.138和大于及等于和大于及等于2.138的概率。的概率。3.确定确定P值值60课件图图3-5例例3-5中中P值示意图值示意图61
18、课件62课件若若,是否也能下,是否也能下“无差别无差别”或或“相等相等”的结论?的结论?63课件一、单样本一、单样本t检验检验(onesample/groupt-test)即即样样本本均均数数(代代表表未未知知总总体体均均数数)与与已已知知总总体体均均数数 0(一一般般为为理理论论值值、标标准准值值或或经经过过大大量量观观察察所所得得稳稳定定值值等等)的的比比较较。其其检验统计量按下式计算检验统计量按下式计算64课件例例3-5某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,算算得得其其均均数数为为130.83g/L,标标准准差差为为25.74g
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课件 ch03 总体 估计 假设检验
限制150内