抽样推断统计学.ppt
《抽样推断统计学.ppt》由会员分享,可在线阅读,更多相关《抽样推断统计学.ppt(189页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 抽样估计抽样估计一、抽样调查的概念一、抽样调查的概念 又称为抽样推断,是指按照随又称为抽样推断,是指按照随机原则从总体中抽取部分样本单位机原则从总体中抽取部分样本单位进行调查,利用这部分单位的实际进行调查,利用这部分单位的实际资料计算样本指标,并据以推算总资料计算样本指标,并据以推算总体相应指标的一种统计方法。体相应指标的一种统计方法。第一节抽样调查的概念及作用第一节抽样调查的概念及作用1.抽样调查是一种非全面调查抽样调查是一种非全面调查2.目的在于推断总体的数量特征目的在于推断总体的数量特征3.3.抽样必须遵循随机原则抽样必须遵循随机原则4.4.抽样调查必然存在可控误差抽样调查
2、必然存在可控误差二、抽样调查的特点二、抽样调查的特点三、抽样调查的作用三、抽样调查的作用1.对于不可能进行全面调查,但又需要掌握对于不可能进行全面调查,但又需要掌握其全面情况的现象,只能采取抽样调查的其全面情况的现象,只能采取抽样调查的2.方式。方式。2.对于理论上存在全面调查的可能性,但实际对于理论上存在全面调查的可能性,但实际中却不可能进行或经济上不合算或资料的中却不可能进行或经济上不合算或资料的质量无法保证的现象,只能采用抽样调查。质量无法保证的现象,只能采用抽样调查。3.对于某些时效性要求较高的调查,往往采用对于某些时效性要求较高的调查,往往采用抽样的形式。抽样的形式。4.抽样调查能满
3、足经济性的要求。抽样调查能满足经济性的要求。5.抽样调查可以补充和修正全面调查的结果抽样调查可以补充和修正全面调查的结果1.全及总体:全及总体:也称母体,简称总体,指也称母体,简称总体,指所要认识的研究对象全体。它是由所所要认识的研究对象全体。它是由所研究范围内具有某种共同性质的全体研究范围内具有某种共同性质的全体单位所组成的集合体。单位所组成的集合体。2.样本总体:样本总体:又称子样,是从总体中抽又称子样,是从总体中抽取出来,作为代表这一总体的那部分取出来,作为代表这一总体的那部分单位组成的集合体。单位组成的集合体。第二节抽样推断的一般问题第二节抽样推断的一般问题一、总体与样本一、总体与样本
4、1.参数:参数:反映总体某种属性的综合指标。反映总体某种属性的综合指标。是根据总体各个单位的标志值或标志是根据总体各个单位的标志值或标志属性计算的,所以参数的数据是由总属性计算的,所以参数的数据是由总体各单位标志值或标志特征决定的。体各单位标志值或标志特征决定的。2.统计量:统计量:是根据样本各单位标志值或是根据样本各单位标志值或标志属性计算的综合指标。标志属性计算的综合指标。在抽样调查中,总体参数的具体数值在抽样调查中,总体参数的具体数值 事先未知,需用样本统计量来估计。事先未知,需用样本统计量来估计。二、参数和统计量二、参数和统计量参数(总体指标):参数(总体指标):也称总体特征数,是说明
5、总体数量特也称总体特征数,是说明总体数量特征或规律性的数字。征或规律性的数字。(1)设总体单位数为)设总体单位数为N(2)X 为标志总量为标志总量(3)总体平均数为:)总体平均数为:(4)总体方差)总体方差(5)总体标准差)总体标准差(6)PMN为总体成数为总体成数 总体成数方差、标准差。总体成数方差、标准差。统计量(样本指标)统计量(样本指标)(1)样本容量为)样本容量为n(2)x 称为样本标志总量称为样本标志总量(3)样本平均数:样本平均数:(4)样本方差)样本方差(5)样本标准差)样本标准差(6)pmn 称为样本成数称为样本成数 总体成数方差、标准差总体成数方差、标准差样本统样本统计量计
6、量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量抽样分布抽样分布样本统计量所有可能值的概样本统计量所有可能值的概率分布率分布主要样本主要样本统计量统计量平均数比率(成数)方差平均数比率(成数)方差抽抽 样样 方方 法法 均均 值值 方方 差差(1)从无限总)从无限总体抽体抽 样和有限样和有限总体放回抽样总体放回抽样(2)从有限总)从有限总体不放回抽样体不放回抽样抽样误差抽样误差抽
7、抽 样样 方方 法法 均均 值值 方方 差差(1)从无限)从无限总体抽总体抽 样和样和有限总体放回有限总体放回抽样抽样(2)从有限)从有限总体不放回总体不放回抽样抽样根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,的分布就近似正的分布就近似正态分布。(态分布。(np和和nq大于大于5时)时)抽样误差抽样误差1.重复抽样和不重复抽样重复抽样和不重复抽样三、抽样方法和样本可能数目三、抽样方法和样本可能数目重复抽样:重复抽样:也称重置抽样。指从一个总也称重置抽样。指从一个总体体N个单位中每次抽取一个单位,把结个单位中每次抽取一个单位,把结果登记下来,又重新放回原总体,参加果登记下
8、来,又重新放回原总体,参加下一次抽取。下一次抽取。不重复抽样:不重复抽样:也称不重置抽样。指每次也称不重置抽样。指每次从一个样本中抽取一个单位,连续进从一个样本中抽取一个单位,连续进行行n次抽取构成一个样本,但每次抽出次抽取构成一个样本,但每次抽出的单位就不放回参加下一次抽取。的单位就不放回参加下一次抽取。2.考虑顺序抽样和不考虑顺序抽样考虑顺序抽样和不考虑顺序抽样考虑顺序抽样:考虑顺序抽样:指从总体指从总体N个单位中抽个单位中抽取取n个单位组成样本,不但要考虑样本个单位组成样本,不但要考虑样本各单位的性质是否相同,还要考虑不同各单位的性质是否相同,还要考虑不同性质各单位的中选顺序。性质各单位
9、的中选顺序。不考虑顺序抽样:不考虑顺序抽样:指从总体指从总体N个单位中个单位中抽取抽取n个单位组成样本,只考虑样本各个单位组成样本,只考虑样本各单位的成分如何,而不考虑各单位的单位的成分如何,而不考虑各单位的中选顺序。中选顺序。3.把抽选方式和是否考虑样本中各单位把抽选方式和是否考虑样本中各单位的顺序结合起来的四种情况及其样本的顺序结合起来的四种情况及其样本可能数目(可能数目(M):):1)考虑顺序的重复抽样)考虑顺序的重复抽样2)考虑顺序的不重复抽样)考虑顺序的不重复抽样3)不考虑顺序的重复抽样)不考虑顺序的重复抽样4)不考虑顺序的不重复抽样)不考虑顺序的不重复抽样1.大数定律及其重要意义大
10、数定律及其重要意义四、抽样调查的数理基础四、抽样调查的数理基础 大数定律:大数定律:又称大数法则,是说明大量又称大数法则,是说明大量的随机现象的平均结果具有稳定性质的法的随机现象的平均结果具有稳定性质的法则。说明如果被研究的总体数量特征是由则。说明如果被研究的总体数量特征是由大量的相互独立的随机变量形成的,而且大量的相互独立的随机变量形成的,而且每个变量对总体的影响都相对地小、那么每个变量对总体的影响都相对地小、那么对大量随机变量加以综合平均的结果,变对大量随机变量加以综合平均的结果,变量的个别影响相互抵消,而显现出他们共量的个别影响相互抵消,而显现出他们共同作用的倾向,使总体数量特征具有稳定
11、同作用的倾向,使总体数量特征具有稳定性。性。即:即:如果随机变量总体存在着有限的平均如果随机变量总体存在着有限的平均数和方差,则对于足够多的抽样单位数数和方差,则对于足够多的抽样单位数n,可以以几乎趋近于,可以以几乎趋近于1的概率,来期望抽的概率,来期望抽样平均数与总体平均数的绝对离差为任意样平均数与总体平均数的绝对离差为任意小,即对任意小的正数小,即对任意小的正数 ,有,有 从理论上解释了样本与总体之从理论上解释了样本与总体之间的内在联系,即随着样本单位数间的内在联系,即随着样本单位数n的增加,样本平均数有接近于总的增加,样本平均数有接近于总体平均数的趋势,或说,样本平均体平均数的趋势,或说
12、,样本平均数在概率上收敛于总体平均数。数在概率上收敛于总体平均数。大数定律对于抽样推断的重要意义大数定律对于抽样推断的重要意义2.正态分布的有关定理正态分布的有关定理 若总体很大且服从正态分布,则从若总体很大且服从正态分布,则从该总体中抽取容量为该总体中抽取容量为n的样本平均的样本平均 数数 也服从正态分布也服从正态分布 ,且且其平均数等于总体平均数其平均数等于总体平均数 ,标,标 准差准差 (重复抽样)或(重复抽样)或 (不重复抽样)(不重复抽样).而标准随机变量而标准随机变量 则服从标准正态分布则服从标准正态分布N(0,1)(1)正态分布再生定理)正态分布再生定理 若总体很大且变量若总体很
13、大且变量X的平均数的平均数 和和标准差标准差 都是有限的数,但不都是有限的数,但不服从正态分布,只要样本足够大服从正态分布,只要样本足够大(n30),样本平均数的分布就),样本平均数的分布就趋近于正态分布趋近于正态分布 ,且有且有 ,标准差,标准差 (重(重 复抽样)或复抽样)或 (不重复抽(不重复抽样)。而标准随机变量样)。而标准随机变量 则服从标准正态分布则服从标准正态分布N(0,1).(2)中心极限定理)中心极限定理第三节抽样推断的基本原理第三节抽样推断的基本原理一、抽样估计的优良标准一、抽样估计的优良标准 无偏性无偏性 一致性一致性 有效性有效性评价准则评价准则的数学期望的数学期望等于
14、总体参等于总体参数,即数,即该估计量称该估计量称为无偏估计为无偏估计无偏性无偏性有效性有效性当当 为为 的无的无偏估计时,偏估计时,方方差差 越小,越小,无偏估计越有无偏估计越有效。效。一致性一致性对于无限总体,对于无限总体,如果对任意如果对任意则称则称 是是的一致估计。的一致估计。估计量估计量二、抽 样 误 差1.抽样误差的概念和意义抽样误差的概念和意义抽样误差是指抽样指标与总体指标之抽样误差是指抽样指标与总体指标之间的离差。间的离差。抽样误差不包括下面两类误差:抽样误差不包括下面两类误差:登记性登记性误差:误差:在调查过程中由于观察、在调查过程中由于观察、测量、登记、计算上的差错而引起的误
15、差。测量、登记、计算上的差错而引起的误差。系统性误差:系统性误差:由于违反抽样调查的随由于违反抽样调查的随机原则,造成样本的代表性不足所引起的误机原则,造成样本的代表性不足所引起的误差。差。2.抽样误差的影响因素抽样误差的影响因素 总体各单位标志值的变异程度总体各单位标志值的变异程度。在其他条件不变的情况下,总体各单位标志在其他条件不变的情况下,总体各单位标志值的变异程度愈大,抽样误差也愈大,反之值的变异程度愈大,抽样误差也愈大,反之则愈小。则愈小。样本单位数的多少样本单位数的多少。在其他条件不变的情况下,样本单位数愈多,在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小,反之则愈大。抽样
16、误差就愈小,反之则愈大。抽样方法抽样方法。抽样方法不同,抽样误差也不同。一般,重抽样方法不同,抽样误差也不同。一般,重复抽样的误差比不重复抽样的误差要大。复抽样的误差比不重复抽样的误差要大。抽样的组织形式抽样的组织形式。不同的抽样组织形式,有不同的抽样误差。不同的抽样组织形式,有不同的抽样误差。三、抽样平均误差三、抽样平均误差 1.1.抽样平均误差概念抽样平均误差概念 样本平均数(样本成数)对总体平均数样本平均数(样本成数)对总体平均数(或总体成数)的标准差。(或总体成数)的标准差。表示样本平均数的平均误差,表示样本平均数的平均误差,表表示样本成数的平均误差,示样本成数的平均误差,M表示样本可
17、表示样本可能数目。则:能数目。则:2.抽样平均误差的计算抽样平均误差的计算当抽样方式为当抽样方式为重复抽样重复抽样时时 它说明在重复抽样的条件下,抽样平它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本均误差与总体标准差成正比,与样本容量的平方根成反比。容量的平方根成反比。当抽样方式为不当抽样方式为不重复抽样重复抽样时时例:有5个工人的日产量分别为:6,8,10,12,14件,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平,则抽样平均误差为多少?解:总体均值:总体标准差:抽样平均误差:若用不重复抽样的方法:若用不重复抽样的方法:在计算抽样平均误差时,
18、通常得不到总体在计算抽样平均误差时,通常得不到总体标准差的数值,一般用样本标准差来代替标准差的数值,一般用样本标准差来代替总体标准差。总体标准差。根据样本平均误差和总体标准差的关系,根据样本平均误差和总体标准差的关系,可得到可得到样本成数样本成数的平均误差的计算公式:的平均误差的计算公式:1.在重复抽样下:在重复抽样下:2.在不重复抽样下:在不重复抽样下:例:某企业生产的产品,按正常生产经验,合格例:某企业生产的产品,按正常生产经验,合格率为率为90%。现从。现从5000件产品中抽取件产品中抽取50件进行检验,件进行检验,求合格率的抽样平均误差。求合格率的抽样平均误差。解:解:在重复抽样条件下
19、:在重复抽样条件下:不重复抽样条件下:不重复抽样条件下:四、抽样极限误差四、抽样极限误差 抽样极限误差是指样本和总体指标之间误抽样极限误差是指样本和总体指标之间误差的可能范围。由于总体指标是一个确定的数,差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕总体指标上下波动的,它而样本指标则是围绕总体指标上下波动的,它与总体指标之间既有正离差,也有负离差,样与总体指标之间既有正离差,也有负离差,样本指标变动的上限或下限与总体指标之差的绝本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,我们将对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差可能
20、范围称这种以绝对值形式表示的抽样误差可能范围称为为抽样极限误差抽样极限误差。也称作也称作允许误差、误差范允许误差、误差范围、误差置信限。围、误差置信限。设设x与与p分别表示样本平均数与样分别表示样本平均数与样本成数的抽样极限误差,则有:本成数的抽样极限误差,则有:上述公式变换为不等式可表示成上述公式变换为不等式可表示成:抽样误差的概率度抽样误差的概率度把极限误差除以相应的抽样平均误差,便得把极限误差除以相应的抽样平均误差,便得到数值到数值Z,表示误差范围为抽样平均误差的,表示误差范围为抽样平均误差的Z倍。倍。Z是测量估计可靠程度的一个参数,称为是测量估计可靠程度的一个参数,称为抽样误差的抽样误
21、差的概率度概率度。其公式为:。其公式为:抽样估计的置信度就是表明抽样指标抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的和总体指标的误差不超过一定范围的概率保证程度。抽样时,估计抽样误概率保证程度。抽样时,估计抽样误差的范围大小称为抽样估计的精确程差的范围大小称为抽样估计的精确程度;估计这一范围的概率是多少称为度;估计这一范围的概率是多少称为抽样估计的可靠程度。抽样估计的可靠程度。抽样误差范围增大时,抽样估计抽样误差范围增大时,抽样估计的置信度也大,抽样精确程度则降低,的置信度也大,抽样精确程度则降低,反之亦然。反之亦然。四、抽样估计的置信度四、抽样估计的置信度 由于提高把握程
22、度,会增大允由于提高把握程度,会增大允许误差,使估计精度降低,而缩小许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会允许误差,提高估计的精度,又会降低估计的把握程度,所以降低估计的把握程度,所以在实际在实际中应根据具体情况,先确定一个合中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相或先确定一个允许误差范围再求相应的把握程度。应的把握程度。68.27%95.45%99.73%当当z=1时,时,F(z)=68.27%当当z=1.96时,时,F(z)=95%当当z=2时,时,F(z)=95.45%当当z=3时,时,
23、F(z)=99.73%常用常用概率度概率度Z值及相应的值及相应的概率保证程度概率保证程度为:为:六、抽样推断的方法六、抽样推断的方法 抽样推断的方法,即参数估计抽样推断的方法,即参数估计就是以所计算的样本指标来估就是以所计算的样本指标来估计相应的总体指标。计相应的总体指标。参数估计参数估计有点估计有点估计和和区间估计区间估计两种形式。两种形式。(一)(一)点估计点估计 也称定值估计,即直接以抽样也称定值估计,即直接以抽样指标值代表总体指标的估计值。指标值代表总体指标的估计值。通常评选估计量优良有三个标通常评选估计量优良有三个标准,即准,即:*无偏性无偏性 *有效性有效性 *一致性一致性点估计的
24、方法点估计的方法*矩估计法矩估计法 *顺序统计量法顺序统计量法 *最大似然法最大似然法 *最小二乘法最小二乘法点估计的缺点点估计的缺点 由于一次只随机抽取一个样本,由于一次只随机抽取一个样本,因样本不同,估计值会有很大差因样本不同,估计值会有很大差异,因此一次只随机抽一个样本异,因此一次只随机抽一个样本的点估计值不能恰当代表所要估的点估计值不能恰当代表所要估计的总体参数,即点估计的主要计的总体参数,即点估计的主要缺点是没有解决参数估计的精确缺点是没有解决参数估计的精确度与可靠性问题。度与可靠性问题。(二)(二)区间估计区间估计 对于总体的未知指标对于总体的未知指标X,根据样本构造的根据样本构造
25、的两个统计量两个统计量x1、x2,(x1x2),使随机区,使随机区间间(x1,x2)包含包含X的概率等于给定值的概率等于给定值1 (01),即即 P(x1Xx2)1 则称则称1为为置信概率置信概率,也就是,也就是估计的可靠估计的可靠程度,程度,也称为也称为置信度置信度。为显著水平,为显著水平,(x1,x2)称为称为X的置信区间,的置信区间,x1,x2分别称为置信下限和置信上限。分别称为置信下限和置信上限。根据所给条件不同有两种方法:根据所给条件不同有两种方法:1.根据已给定的置信度的要求,利用根据已给定的置信度的要求,利用概率表查出这个概率保证程度所对概率表查出这个概率保证程度所对应的概率度应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 推断 统计学
限制150内