《统计学第五抽样推断课件.ppt》由会员分享,可在线阅读,更多相关《统计学第五抽样推断课件.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于统计学第五抽样关于统计学第五抽样推断推断现在学习的是第1页,共55页第五章第五章 抽样推断抽样推断 第一节第一节 抽样推断概述抽样推断概述一、抽样推断的概念和特点二、抽样的方法四、抽样推断的主要内容五、抽样推断的理论依据现在学习的是第2页,共55页抽样推断的几个基本概念抽样推断的几个基本概念(一)总体和样本 1、总体:即统计所要认识对象的全体。总体单位数一般用“N”表示。2、样本(样本总体):即它是从总体中随机抽取出来,用来代表总体的那部分单位的组成集合体。样本单位数通常用“n”表示。现在学习的是第3页,共55页抽样推断的几个基本概念抽样推断的几个基本概念 (二)总体参数和统计量 1、总体
2、参数(又称总体指标),它是反映总体数量特征的综合指标。现在学习的是第4页,共55页抽样推断的几个基本概念抽样推断的几个基本概念 2、统计量(又称样本指标)。抽样推断必须自总体中随机抽取一定数量的单位组成样本,以该样本为对象可计算很多特征值,这些特征值或指标从不同的角度反映样本的数量特征,并具有不同的名称,这里可以统称为样本指标,或叫统计量。现在学习的是第5页,共55页抽样推断的几个基本概念抽样推断的几个基本概念 常用的总体参数和统计量:现在学习的是第6页,共55页抽样推断的几个基本概念抽样推断的几个基本概念(三)样本容量和样本个数 1、样本容量:即一个样本中所包含的单位数,一般用n表示。n30
3、为大样本,n30为小样本。2、样本个数:是指在一个总体中所有可能被抽取或可能构成的样本数目。注意注意:在实际统计中我们只是抽取一个样本,但进行抽样推断必须要考虑全部的可能样本。现在学习的是第7页,共55页抽样的方法抽样的方法 1:重复抽样(重置抽样)即每次从具有N个单位的总体中随机抽取一个单位(登记其序号和相应的标志值)之后,又将它重新放回总体,参加下一次抽选。2:不重复抽样(不重置抽样)即每次从具有N个单位的总体中随机抽取一个单位,但在登记其序号和相应的标志值之后,就不再将它重新放回总体参加下一次的抽选。现在学习的是第8页,共55页抽样推断的主要内容抽样推断的主要内容 抽样推断(统计推断)所
4、面临的问题是对总体的数量特征不了解或了解很少,而且需要利用有限的样本信息对它进行估计和判断,以达到对总体数量特征的认识。抽样推断在由样本资料推断总体资料时,包括以下两个内容:(一)总体参数的估计;(二)总体参数的假设检验。现在学习的是第9页,共55页抽样推断的理论依据抽样推断的理论依据 抽样推断是通过样本对总体的推算,这样统计量与被估算的总体指标之间的关系,就是推算的关键。而两者的关系主要通过统计量的分布来反映,且因样本量的大小而有所差别:(一)大样本统计量的推断依据:大数定律现在学习的是第10页,共55页抽样推断的理论依据抽样推断的理论依据(二)大样本统计量分布的依据 中心极限定理:中心极限
5、定理是指在一定的条件下,大量相互独立的随机现象的概率分布是以正态分布为极限的定理。因正态分布在概率论中占有中心地位,所以把以正态分布为极限的定理叫做中心极限定理。1、正态分布;2、中心极限定理。现在学习的是第11页,共55页抽样推断的理论依据抽样推断的理论依据 (三)小样本统计量的分布律 1、t分布;2、小样本均值的分布律。现在学习的是第12页,共55页第五章第五章 抽样推断抽样推断 第二节第二节 抽样误差抽样误差一、抽样误差的概念二、抽样平均误差的计算三、抽样极限误差四、抽样误差的概率度五、抽样估计的置信度现在学习的是第13页,共55页抽样误差的概念抽样误差的概念 抽样误差是指由于随机抽样的
6、偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起样本指标与总体指标之间的绝对离差:如:现在学习的是第14页,共55页抽样平均误差的计算抽样平均误差的计算 (一)抽样平均误差的定义公式 抽样平均误差是反映抽样误差一般水平的指标,即所有可能出现的样本指标与总体指标的标准差 1:样本平均数的抽样平均误差 k=f:全部可能的样本个数现在学习的是第15页,共55页抽样平均误差的计算抽样平均误差的计算(一)抽样平均误差的定义公式 2、样本成数的抽样平均误差 k=f:全部可能的样本个数 注意注意:上式只表明了抽样平均误差的涵义,并不能作为其计算公式。现在学习的是第16页,共55页抽样平均误差的计
7、算抽样平均误差的计算(二)抽样平均误差的计算方法 1、样本平均数的抽样平均误差 (1)重复抽样:现在学习的是第17页,共55页抽样平均误差的计算抽样平均误差的计算(二)抽样平均误差的计算方法 (2)不重复抽样:注意:在实际计算抽样平均误差时,当总体标准差未知时可以用样本标准差s来代替:现在学习的是第18页,共55页抽样平均误差的计算抽样平均误差的计算(三)影响抽样(平均)误差的因素 1、总体标志变异程度的大小(总体标准差的大小),它与成正比例变化。2、样本容量的大小,它与成反比例。3、抽样方法的不同,重复抽样的总是大于不重复抽样的。4、抽样的组织形式,抽样的组织形式不同,抽样误差也不同。现在学
8、习的是第19页,共55页抽样极限误差抽样极限误差 抽样极限误差是指抽样指标与总体指标之间抽样误差可允许的范围,又称为允许误差或抽样误差范围;它等于样本指标可允许变动的上下限与总体指标的绝对值。现在学习的是第20页,共55页抽样极限误差抽样极限误差 样本平均数的抽样极限误差:样本成数的抽样极限误差:现在学习的是第21页,共55页抽样误差的概率度抽样误差的概率度 基于概率估计要求,抽样极限误差x或p 通常需要以抽样平均误差x或p为标准单位来衡量;把抽样极限误差x或p分别除以x或p得相对数t,表示误差范围为抽样平均误差的t倍。t是测量抽样估计可靠程度的一个参数,称为抽样误差的概率度:现在学习的是第2
9、2页,共55页抽样估计的置信度抽样估计的置信度 抽样估计的置信度就是表明样本指标与总体指标的误差不超过一定范围的概率保证程度,它一般用F(t)表示。又称抽样估计的概率保证程度。现在学习的是第23页,共55页抽样估计的置信度抽样估计的置信度 1、总体平均数抽样估计的置信度:现在学习的是第24页,共55页抽样估计的置信度抽样估计的置信度 2、总体成数抽样估计的置信度:现在学习的是第25页,共55页抽样估计的置信度抽样估计的置信度3、置信区间与置信度的关系:由于样本统计量都服从一定的概率分布,且分布曲线下的面积(概率)之合必定等于,表明我们的抽样必然取得该统计量的所有观察值中的一个。如果在分布区域内
10、确定某一区间,则其面积就表示为该统计量在这一区间内的概率。前述构成的置信区间就是这样的一个区间,且置信区间是随估计量的随机性表现为随机区间,它与分布曲线构成的面积就是该随机区间的概率,这样该统计量的概率分布也就成为置信区间的概率分布了。现在学习的是第26页,共55页第五章第五章 抽样推断抽样推断 第三节 抽样估计的方法一、总体参数的点估计二、总体参数的区间估计三、总量指标的抽样推算现在学习的是第27页,共55页总体参数的点估计总体参数的点估计(一)点估计的概念 点估计指用样本指标(样本统计量)直接代替总体指标(总体参数)的估计方法,也叫定值估计:现在学习的是第28页,共55页总体参数的点估计总
11、体参数的点估计(二)抽样估计的优良标准 在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优良的标准。衡量一个样本统计量是否是总体参数的优良的估计量一般有如下三条标准,即:无偏性、一致性和有效性。现在学习的是第29页,共55页总体参数的点估计总体参数的点估计(二)抽样估计的优良标准 1、无偏性。即如果样本统计量的数学期望值等于被估计的总体参数本身,则该统计量是被估计参数的无偏估计量:现在学习的是第30页,共55页总体参数的点估计总体参数的点估计 2、一致性:即当样本容量n充分大时,若样本统计量充分地靠近被估计的参数本身。则该统计量是被估计参数的一致估计量。即:现在学习的
12、是第31页,共55页总体参数的点估计总体参数的点估计 3、有效性:有效性是指无偏性估计量中方差最小的估计量。无偏估计量只考虑估计值的平均结果是否等于待估计参数的真值,而不考虑估计的每个可能值及其次数分布与待估计参数真值之间离差的大小和散布程度现在学习的是第32页,共55页总体参数的点估计总体参数的点估计(三)点估计量的确定(三)点估计量的确定 1、总体平均数的估计量:样本平均数是总体平均数的一个无偏、有效和一致性的估计量;现在学习的是第33页,共55页总体参数的点估计总体参数的点估计 2、总体成数(比重)的估计量选择:选择样本成数(比重)p为总体成数(比重)P的估计量。是因为p也是P的有效、一
13、致和无偏性的估计量;3、总体方差的估计量选择:由于随着样本容量n的增大,E()趋于,所以选择它作为的估计量。现在学习的是第34页,共55页总体参数的区间估计总体参数的区间估计(一)区间估计的概念 在统计分析中,我们常常用一个区间及其出现的概率来估计总体参数。这种估计总体参数的方法称为区间估计。具体地说,区间估计是用估计量所构成的区间来估计总体参数,并以一定的概率保证总体参数将落在所估计的区间内。现在学习的是第35页,共55页总体参数的区间估计总体参数的区间估计(二)区间估计的方法及要素 1、总体平均数的区间估计 即:(置信区间)(置信度)现在学习的是第36页,共55页总体参数的区间估计总体参数
14、的区间估计(二)区间估计的方法及要素 2、总体成数的区间估计 即:(置信区间)(置信度)现在学习的是第37页,共55页总体参数的区间估计总体参数的区间估计例 某制造厂的产品重量服从正态分布,其总体标准差15千克,平均重量未知。现随机抽取一个n=250的样本,计算结果是 65千克。以95的置信度估计总体平均重量的置信区间。解:本题已知条件为:样本容量n=250,X N(65,15);置信水平为95;现在学习的是第38页,共55页总体参数的区间估计总体参数的区间估计查正态概率双侧临界值表有:t=1.96x=tx=1.960.9487=1.86 则,651.86 65+1.86 即95%的估计区间为
15、:63.14 66.86 计算结果说明有95的把握认为总体平均数介于63.14千克到66.86千克之间。现在学习的是第39页,共55页总量指标的抽样推算总量指标的抽样推算 抽样调查的如期完成,能使我们得到两个重要的抽样指标:一个是代表抽样总体(样本)一般特征的样本平均数,或称抽样平均数;一个是反映某一标志的单位数在样本中所占的比重,或称抽样成数。有了这两个表示抽象调查结果的综合指标,就可以对于某些未知的结果进行预测与预算。现在学习的是第40页,共55页总量指标的抽样推算总量指标的抽样推算 根据抽样结果,推算总体的总量指标可以有如下两种方法:(一)直接换算法(二)修正系数法现在学习的是第41页,
16、共55页第五章第五章 抽样推断抽样推断 第四节 抽样的组织形式一、抽样设计的有关问题二、抽样组织方式三、样本容量的确定现在学习的是第42页,共55页抽样设计的有关问题抽样设计的有关问题(一)抽样方案的主要内容 确定调查的目的;确定调查对象调查单位和报告单位;拟定调查提纲、确定调查项目、并设计调查表;确定调查的时间;确定调查的组织实施计划。现在学习的是第43页,共55页抽样设计的有关问题抽样设计的有关问题(二)随机抽样的方法 1、重复抽样;2、不重复抽样;3、概率调查问题:(1)等概率抽样调查;(2)不等概率调查。现在学习的是第44页,共55页抽样组织方式抽样组织方式 抽样组织方式是指在抽样时对
17、总体的加工整理形式,根据对总体的加工整理形式不同,在随机抽样中抽样的组织形式很多,如:简单纯随机抽样、分类抽样、等距抽样、整群抽样和多阶段抽样等。现在学习的是第45页,共55页抽样组织方式抽样组织方式 (一)简单随机抽样:简单随机抽样又称为纯随机抽样,它是不对总体作任何加工整理,直接从总体中随机抽取调查单位的抽样调查方法。所以也叫简单随机抽样。简单随机抽样是最常用的纯随机抽样。它必须满足下列两条要求:(1)代表性;(2)独立性。现在学习的是第46页,共55页抽样组织方式抽样组织方式(二)类型抽样 类型抽样又称分层或分类抽样。它是先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽取一定
18、单位构成样本的抽样组织方式。现在学习的是第47页,共55页抽样组织方式抽样组织方式(三)等距抽样 等距抽样又称机械抽样或系统抽样它是先将总体单位按某一标志排序,然后按照固定的顺序和相同的间隔来抽选样本单位的抽样组织形式。例如,N=20 n=4 则:现在学习的是第48页,共55页抽样组织方式抽样组织方式(四)整群抽样 整群抽样也叫分群抽样或集团抽样,是将总体划分为若干群,然后以群为单位从中随机抽取部分群。对中选群中的所有单位进行全面调查的抽样组织方式。现在学习的是第49页,共55页抽样组织方式抽样组织方式(五)多阶段抽样 抽样调查中,如果抽出的样本单位直接就是总体单位,叫单阶段抽样,如简单随机抽
19、样、等距抽样、类型比例抽样。如果先将总体进行分组,从中随机抽出一些组,然后再从中选的组中随机抽取总体单位,叫二阶段抽样。如整群抽样就是第二阶段抽样比为100%的一种特殊的两阶段抽样。如果将总体进行多层次分组,然后依次在各层中随机抽组,直到抽到总体单位,叫多阶段抽样。现在学习的是第50页,共55页样本容量的确定样本容量的确定(一)确定抽样样本容量的必要性 样本容量就是抽样数目;根据大数定理,在抽样调查中样本容量越多,样本对总体的代表性越大,抽样误差越小;样本容量减少,抽样误差就要增大。因此,确定样本容量时,应在保证满足抽样调查对数据的估计精确度和概率把握程度下,尽量缩小抽样数目,即为必要抽样数目。现在学习的是第51页,共55页样本容量的确定样本容量的确定(二)影响样本容量的因素 1、总体被研究标志的变异程度。2、允许的误差范围。3、抽样推断的可靠程度1或F(t)。4、抽样的方式和方法。现在学习的是第52页,共55页样本容量的确定样本容量的确定(三)简单随机抽样的样本容量1、平均数估计的样本容量:(1)重复抽样时:(2)不重复抽样时:现在学习的是第53页,共55页样本容量的确定样本容量的确定2、成数估计的样本容量。(1)重复抽样时,(2)不重复抽样时,现在学习的是第54页,共55页感感谢谢大大家家观观看看现在学习的是第55页,共55页
限制150内