05第五章抽样推断1526.pptx
《05第五章抽样推断1526.pptx》由会员分享,可在线阅读,更多相关《05第五章抽样推断1526.pptx(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章抽抽 样样 推推 断断 第第一一节节 抽样推断及其特点抽样推断及其特点 第第二二节节 总体参数估计总体参数估计 第第三三节节 假设检验概述假设检验概述3/25/20231第五章第五章 抽样推断抽样推断 不不象象其其他他科科学学,统统计计从从来来不不打打算算使使自自己己完完美美无无缺缺,统统计计意意味味着着你你永永远远不不需需要确定无疑要确定无疑 Gudmund R.Iversen统计名言统计名言3/25/20232第五章第五章 抽样推断抽样推断参数估计在统计方法中的地位参数估计在统计方法中的地位3/25/20233第五章第五章 抽样推断抽样推断大学生每周上网花多少时间?大学生每周上
2、网花多少时间?为为了了解解学学生生每每周周上上网网花花费费的的时时间间,中中国国人人民民大大学学公公共共管管理理学学院院的的4名名本本科科生生对对全全校校部部分分本本科科生生做做了了问问卷卷调调查查。调调查查的的对对象象为为中中国国人人民民大大学学在在校校本本科科生生,调调查查内内容容包包括括上上网网时时间间、途途径径、支支出出、目目的的、关关心心的的校校园园网网内内容容,以以及及学学生生对对收收费费的的态态度度,包包括括收收费费方方式式、价价格格等等问问卷卷调调查查由由调调查查员员直直接接到到宿宿舍舍发发放放并并当当场场回回收收。对对四四个个年年级级中中每每年年级级各各发发60份份问问卷卷,
3、其其中中男男、女女生生各各30份份。共共收收回回有有效效问问卷卷共共200份份。其其中中有有关关上上网网时时间间方面的数据经整理如下表所示方面的数据经整理如下表所示 3/25/20234第五章第五章 抽样推断抽样推断大学生每周上网花多少时间?大学生每周上网花多少时间?回答类别人数(人)频率(%)3小时以下321636小时3517.569小时3316.5912小时2914.512小时以上7135.5合计200100平均上网时间为平均上网时间为8.58小时,标准差为小时,标准差为0.69小时。全校学生小时。全校学生每周的平均上网时间是多少?每周上网时间在每周的平均上网时间是多少?每周上网时间在12
4、小时以小时以上的学生比例是多少?你做出估计的理论依据是什么?上的学生比例是多少?你做出估计的理论依据是什么?3/25/20235第五章第五章 抽样推断抽样推断第第一一节节抽样推断及其特点抽样推断及其特点1.1 抽样推断的特点抽样推断的特点1.2 总体参数和样本统计量总体参数和样本统计量1.3 抽样推断的基本条件抽样推断的基本条件1.4 抽样推断的误差抽样推断的误差3/25/20236第五章第五章 抽样推断抽样推断1.1 抽样推断及其特点抽样推断及其特点抽样推断抽样推断(统计推断统计推断)按随机原则从总体中抽取部分单位构成按随机原则从总体中抽取部分单位构成样本,在一定的可靠程度下,根据样本的数样
5、本,在一定的可靠程度下,根据样本的数量特征对总体的数量特征加以推断的方法。量特征对总体的数量特征加以推断的方法。抽样推断的方法抽样推断的方法:总体参数的估计总体参数的估计总体参数的假设检验。总体参数的假设检验。3/25/20237第五章第五章 抽样推断抽样推断1.1 抽样推断及其特点抽样推断及其特点抽样推断的特点抽样推断的特点1.抽样推断必须遵循随机原则。抽样推断必须遵循随机原则。2.对抽样误差可以事先加以计算和控制。对抽样误差可以事先加以计算和控制。3.具有经济性、时效性,应用广泛的特点。具有经济性、时效性,应用广泛的特点。4.可对全面调查的结果进行检验和修正。可对全面调查的结果进行检验和修
6、正。3/25/20238第五章第五章 抽样推断抽样推断 利用样本统计量推断总体参数利用样本统计量推断总体参数目目 的的特特 点点易易 求求 未未 知知 不唯一、随机变量不唯一、随机变量 唯一、常量唯一、常量性性 质质 样本的指标样本的指标 总体的指标总体的指标含含 义义1.2 总体参数和样本统计量总体参数和样本统计量常常 见见样样 本本 统统 计计 量量总总 体体 参参 数数总体参数与样本统计量的比较总体参数与样本统计量的比较3/25/20239第五章第五章 抽样推断抽样推断1.2 总体参数和样本统计量总体参数和样本统计量样样 本本 统统 计计 量量总体参数和样本统计量的计算公式总体参数和样本
7、统计量的计算公式 总总 体体 参参 数数3/25/202310第五章第五章 抽样推断抽样推断1.3 抽样推断的基本条件抽样推断的基本条件 抽样推断的基本条件抽样推断的基本条件 1.选择统计量选择统计量优良估计量优良估计量。2.合适的允许误差合适的允许误差精确性精确性。3.可接受的置信度可接受的置信度可靠性可靠性。精确性和可靠性是一对矛盾。要根据问精确性和可靠性是一对矛盾。要根据问题的性质和研究的需要在二者间权衡。题的性质和研究的需要在二者间权衡。3/25/202311第五章第五章 抽样推断抽样推断1.4 抽样推断的误差抽样推断的误差 统统 计计 误误 差差登记性误差登记性误差代表性误差代表性误
8、差系统误差系统误差抽样误差抽样误差可消除可消除可消除可消除可控制可控制统计误差的分类统计误差的分类3/25/202312第五章第五章 抽样推断抽样推断1.4 抽样推断的误差抽样推断的误差 抽样误差抽样误差1.抽样实际误差:抽样实际误差:对某一样本而言,由随机因素引起的对某一样本而言,由随机因素引起的样本统计量与总体参数在数量上的差异样本统计量与总体参数在数量上的差异就是抽样实际误差。就是抽样实际误差。3/25/202313第五章第五章 抽样推断抽样推断1.4 抽样推断的误差抽样推断的误差 2.抽样平均(标准)误差抽样平均(标准)误差:抽样平均误差是抽样平均数的标准差,它抽样平均误差是抽样平均数
9、的标准差,它反映样本平均数(样本成数)与总体平均数反映样本平均数(样本成数)与总体平均数(总体成数)之间的平均差异程度。(总体成数)之间的平均差异程度。3/25/202314第五章第五章 抽样推断抽样推断1.4 抽样推断的误差抽样推断的误差 总体标准差和成数的确定:总体标准差和成数的确定:总体变化不大,采用过去总体指标数值做代总体变化不大,采用过去总体指标数值做代替;替;用样本标准差用样本标准差(x)或样本成数或样本成数 p 替代;替代;对于成数,可取对于成数,可取 P=0.5;如果有多个;如果有多个 P 值,值,取其最接近取其最接近 0.5 的的P 做替代。做替代。3/25/202315第五
10、章第五章 抽样推断抽样推断1.4 抽样推断的误差抽样推断的误差 3.抽样极限(允许)误差抽样极限(允许)误差是样本统计量与被估计的总体参数之是样本统计量与被估计的总体参数之绝对离差的最大允许值,常用绝对离差的最大允许值,常用表示,可表示,可简称为简称为极限误差极限误差或或允许误差允许误差。3/25/202316第五章第五章 抽样推断抽样推断1.4 抽样推断的误差抽样推断的误差 和和的关系:的关系:Z 概率度,概率度,Z 表示表示以抽样平均误差为标准以抽样平均误差为标准单位对极限误差的度量值。由单位对极限误差的度量值。由Z 确定的概率保确定的概率保证程度证程度F(Z)置信度。置信度。3/25/2
11、02317第五章第五章 抽样推断抽样推断极限误差标准化的意义:极限误差标准化的意义:ZN(0,1)Z Z0-SD D+D D-X X X(2,X Nx1.4 抽样推断的误差抽样推断的误差 3/25/202318第五章第五章 抽样推断抽样推断第二节第二节总体参数的估计总体参数的估计2.1 总体参数估计概述总体参数估计概述2.2 点估计点估计2.3 区间估计区间估计2.4 样本容量的确定样本容量的确定3/25/202319第五章第五章 抽样推断抽样推断2.1 总体参数估计概述总体参数估计概述 总体参数估计就是以样本统计量来估总体参数估计就是以样本统计量来估计总体参数。计总体参数。参数估计要求:参数
12、估计要求:1.精确性精确性适当的极限误差范围;适当的极限误差范围;2.可靠性可靠性估计结果正确的概率。估计结果正确的概率。参数估计参数估计点估计点估计和和区间估计区间估计。3/25/202320第五章第五章 抽样推断抽样推断2.2 点估计点估计(point estimate)点估计点估计就是根据总体参数与样本统计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量量之间的内在联系,直接以样本统计量作为相应总体参数的估计值,点估计又作为相应总体参数的估计值,点估计又称为称为定值估计定值估计。常用的点估计量有:常用的点估计量有:3/25/202321第五章第五章 抽样推断抽样推断1.参参数
13、数估估计计(parameter estimation)就就是是用用样样本本统统计计量量去去估估计计总体的参数总体的参数2.估计量:用于估计总体参数的统计量的名称估计量:用于估计总体参数的统计量的名称如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量3.参数用参数用 表示,估计量表示,估计量用用 表示表示4.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值如果样本均值如果样本均值 x=80,则,则80就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimato
14、r&estimated value)3/25/202322第五章第五章 抽样推断抽样推断优良估计量的三个标准:优良估计量的三个标准:E(统计量统计量)总体参数总体参数1.无偏性:无偏性:(unbiasedness)(unbiasedness)2.2 点估计点估计3/25/202323第五章第五章 抽样推断抽样推断2.一致性:一致性:(consistency)优良估计量的三个标准:优良估计量的三个标准:2.2 点估计点估计3/25/202324第五章第五章 抽样推断抽样推断xXX优良估计量的三个标准:优良估计量的三个标准:2.2 点估计点估计3/25/202325第五章第五章 抽样推断抽样推断3
15、.有效性:有效性:(efficiency)(efficiency)优良估计量的三个标准:优良估计量的三个标准:2.2 点估计点估计3/25/202326第五章第五章 抽样推断抽样推断优良估计量优良估计量总体参数总体参数2.2 点估计点估计3/25/202327第五章第五章 抽样推断抽样推断推断总体推断总体反映样本的反映样本的离散程度离散程度作用作用公式公式符号符号样样 本本 方方 差差2.2 点估计点估计3/25/202328第五章第五章 抽样推断抽样推断总体参数的点估计总体参数的点估计:原则原则:总体参数估计值总体参数估计值就取就取统统计量的值计量的值作用:作用:区间估计的基础。区间估计的基
16、础。2.2 点估计点估计3/25/202329第五章第五章 抽样推断抽样推断2.3 区间估计区间估计(interval estimate)一一 区间估计的含义:区间估计的含义:概率概率 P1?区间大小区间大小 估计的精确性;估计的精确性;概率高低概率高低 估计的准确性。估计的准确性。总体参数总体参数3/25/202330第五章第五章 抽样推断抽样推断区间估计区间估计(interval estimate)1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个估估计计区区间间,该该区区间间由由样样本本统统计计量量加加减减估估计计误误差差而而得得到到2.根根据据样样本本统
17、统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量比比如如,某某班班级级平平均均分分数数在在7585之之间间,置置信信水水平平是是95%样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限3/25/202331第五章第五章 抽样推断抽样推断区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x9
18、9%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x3/25/202332第五章第五章 抽样推断抽样推断1.将将构构造造置置信信区区间间的的步步骤骤重重复复很很多多次次,置置信信区区间间包包含含总总体体参参数数真真值值的的次次数数所所占占的的比比例例,也也称称置置信度信度 2.表示为表示为(1-为是总体参数为是总体参数未在未在区间内的比例区间内的比例 3.常用的置信水平值有常用的置信水平值有 99%,95%,90%相应的相应的 为为0.01,0.05,0.1
19、0置信水平置信水平(confidence level)3/25/202333第五章第五章 抽样推断抽样推断1.由样本估计量构造出的总体参数在一定置信水平下的估计由样本估计量构造出的总体参数在一定置信水平下的估计区间区间2.统计学家在某种程度上确信这个区间会包含真正的总体参统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间数,所以给它取名为置信区间3.如果用某种方法构造的所有区间中有如果用某种方法构造的所有区间中有95%的区间包含总体的区间包含总体参数的真值,参数的真值,5%的区间不包含总体参数的真值,那么,的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水
20、平为用该方法构造的区间称为置信水平为95%的置信区间。同的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述样,其他置信水平的区间也可以用类似的方式进行表述置信区间的表述置信区间的表述(confidence interval)3/25/202334第五章第五章 抽样推断抽样推断1.总总体体参参数数的的真真值值是是固固定定的的,而而用用样样本本构构造造的的区区间间则则是是不不固固定定的的,因因此此置置信信区区间间是是一一个个随随机机区区间间,它它会会因因样样本本的的不同而变化,而且不是所有的区间都包含总体参数不同而变化,而且不是所有的区间都包含总体参数2.实实际际估估计计时时往往往往只
21、只抽抽取取一一个个样样本本,此此时时所所构构造造的的是是与与该该样样本本相相联联系系的的一一定定置置信信水水平平(比比如如95%)下下的的置置信信区区间间。我我们们只只能能希希望望这这个个区区间间是是大大量量包包含含总总体体参参数数真真值值的的区区间间中中的的一一个个,但但它它也也可可能能是是少少数数几几个个不不包包含含参参数数真真值值的的区区间中的一个间中的一个置信区间的表述置信区间的表述(confidence interval)3/25/202335第五章第五章 抽样推断抽样推断1.当当抽抽取取了了一一个个具具体体的的样样本本,用用该该样样本本所所构构造造的的区区间间是是一一个个特特定定的
22、的常常数数区区间间,我我们们无无法法知知道道这这个个样样本本所所产产生生的的区区间间是是否否包包含含总总体体参参数数的的真真值值,因因为为它它可可能能是是包包含含总总体体均均值值的的区区间中的一个,也可能是未包含总体均值的那一个间中的一个,也可能是未包含总体均值的那一个2.一一个个特特定定的的区区间间总总是是“包包含含”或或“绝绝对对不不包包含含”参参数数的的真真值,不存在值,不存在“以多大的概率包含总体参数以多大的概率包含总体参数”的问题的问题3.置置信信水水平平只只是是告告诉诉我我们们在在多多次次估估计计得得到到的的区区间间中中大大概概有有多多少少个个区区间间包包含含了了参参数数的的真真值
23、值,而而不不是是针针对对所所抽抽取取的的这这个个样样本所构建的区间而言的本所构建的区间而言的 置信区间的表述置信区间的表述(confidence interval)3/25/202336第五章第五章 抽样推断抽样推断置信区间的表述置信区间的表述(95%的置信区的置信区间间)从均值为从均值为从均值为从均值为185185的总体中抽出的总体中抽出的总体中抽出的总体中抽出n=10n=10的的的的2020个样本构造出个样本构造出个样本构造出个样本构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 我没有抓住参数!我没有抓住参数!点估计值点估计值点估计值点估计值 3/25/202337第五章
24、第五章 抽样推断抽样推断1.使使用用一一个个较较大大的的置置信信水水平平会会得得到到一一个个比比较较宽宽的的置置信信区区间间,而而使使用用一一个个较较大大的的样样本本则则会会得得到到一一个个较较准准确确(较较窄窄)的的区区间间。直观地说,较宽的区间会有更大的可能性包含参数直观地说,较宽的区间会有更大的可能性包含参数2.但实际应用中,过宽的区间往往没有实际意义但实际应用中,过宽的区间往往没有实际意义比比如如,天天气气预预报报说说“在在一一年年内内会会下下一一场场雨雨”,虽虽然然这这很很有有把把握握,但但有有什什么么意意义义呢呢?另另一一方方面面,要要求求过过于于准准确确(过过窄窄)的的区区间间同
25、同样样不不一一定定有有意意义义,因因为为过过窄窄的的区区间间虽虽然然看看上上去去很很准准确确,但但把把握握性性就就会会降降低低,除除非非无无限限制制增增加样本量,而现实中样本量总是有限的加样本量,而现实中样本量总是有限的3.区间估计总是要给结论留点儿余地区间估计总是要给结论留点儿余地 置信区间的表述置信区间的表述(confidence interval)3/25/202338第五章第五章 抽样推断抽样推断置信区间与置信水平的关系置信区间与置信水平的关系 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 05 第五 抽样 推断 1526
限制150内