欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    抽样推断统计学.ppt

    • 资源ID:86855840       资源大小:1.35MB        全文页数:189页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    抽样推断统计学.ppt

    第九章第九章 抽样估计抽样估计一、抽样调查的概念一、抽样调查的概念 又称为抽样推断,是指按照随又称为抽样推断,是指按照随机原则从总体中抽取部分样本单位机原则从总体中抽取部分样本单位进行调查,利用这部分单位的实际进行调查,利用这部分单位的实际资料计算样本指标,并据以推算总资料计算样本指标,并据以推算总体相应指标的一种统计方法。体相应指标的一种统计方法。第一节抽样调查的概念及作用第一节抽样调查的概念及作用1.抽样调查是一种非全面调查抽样调查是一种非全面调查2.目的在于推断总体的数量特征目的在于推断总体的数量特征3.3.抽样必须遵循随机原则抽样必须遵循随机原则4.4.抽样调查必然存在可控误差抽样调查必然存在可控误差二、抽样调查的特点二、抽样调查的特点三、抽样调查的作用三、抽样调查的作用1.对于不可能进行全面调查,但又需要掌握对于不可能进行全面调查,但又需要掌握其全面情况的现象,只能采取抽样调查的其全面情况的现象,只能采取抽样调查的2.方式。方式。2.对于理论上存在全面调查的可能性,但实际对于理论上存在全面调查的可能性,但实际中却不可能进行或经济上不合算或资料的中却不可能进行或经济上不合算或资料的质量无法保证的现象,只能采用抽样调查。质量无法保证的现象,只能采用抽样调查。3.对于某些时效性要求较高的调查,往往采用对于某些时效性要求较高的调查,往往采用抽样的形式。抽样的形式。4.抽样调查能满足经济性的要求。抽样调查能满足经济性的要求。5.抽样调查可以补充和修正全面调查的结果抽样调查可以补充和修正全面调查的结果1.全及总体:全及总体:也称母体,简称总体,指也称母体,简称总体,指所要认识的研究对象全体。它是由所所要认识的研究对象全体。它是由所研究范围内具有某种共同性质的全体研究范围内具有某种共同性质的全体单位所组成的集合体。单位所组成的集合体。2.样本总体:样本总体:又称子样,是从总体中抽又称子样,是从总体中抽取出来,作为代表这一总体的那部分取出来,作为代表这一总体的那部分单位组成的集合体。单位组成的集合体。第二节抽样推断的一般问题第二节抽样推断的一般问题一、总体与样本一、总体与样本1.参数:参数:反映总体某种属性的综合指标。反映总体某种属性的综合指标。是根据总体各个单位的标志值或标志是根据总体各个单位的标志值或标志属性计算的,所以参数的数据是由总属性计算的,所以参数的数据是由总体各单位标志值或标志特征决定的。体各单位标志值或标志特征决定的。2.统计量:统计量:是根据样本各单位标志值或是根据样本各单位标志值或标志属性计算的综合指标。标志属性计算的综合指标。在抽样调查中,总体参数的具体数值在抽样调查中,总体参数的具体数值 事先未知,需用样本统计量来估计。事先未知,需用样本统计量来估计。二、参数和统计量二、参数和统计量参数(总体指标):参数(总体指标):也称总体特征数,是说明总体数量特也称总体特征数,是说明总体数量特征或规律性的数字。征或规律性的数字。(1)设总体单位数为)设总体单位数为N(2)X 为标志总量为标志总量(3)总体平均数为:)总体平均数为:(4)总体方差)总体方差(5)总体标准差)总体标准差(6)PMN为总体成数为总体成数 总体成数方差、标准差。总体成数方差、标准差。统计量(样本指标)统计量(样本指标)(1)样本容量为)样本容量为n(2)x 称为样本标志总量称为样本标志总量(3)样本平均数:样本平均数:(4)样本方差)样本方差(5)样本标准差)样本标准差(6)pmn 称为样本成数称为样本成数 总体成数方差、标准差总体成数方差、标准差样本统样本统计量计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量抽样分布抽样分布样本统计量所有可能值的概样本统计量所有可能值的概率分布率分布主要样本主要样本统计量统计量平均数比率(成数)方差平均数比率(成数)方差抽抽 样样 方方 法法 均均 值值 方方 差差(1)从无限总)从无限总体抽体抽 样和有限样和有限总体放回抽样总体放回抽样(2)从有限总)从有限总体不放回抽样体不放回抽样抽样误差抽样误差抽抽 样样 方方 法法 均均 值值 方方 差差(1)从无限)从无限总体抽总体抽 样和样和有限总体放回有限总体放回抽样抽样(2)从有限)从有限总体不放回总体不放回抽样抽样根据中心极限定理,只要样本足够大,根据中心极限定理,只要样本足够大,的分布就近似正的分布就近似正态分布。(态分布。(np和和nq大于大于5时)时)抽样误差抽样误差1.重复抽样和不重复抽样重复抽样和不重复抽样三、抽样方法和样本可能数目三、抽样方法和样本可能数目重复抽样:重复抽样:也称重置抽样。指从一个总也称重置抽样。指从一个总体体N个单位中每次抽取一个单位,把结个单位中每次抽取一个单位,把结果登记下来,又重新放回原总体,参加果登记下来,又重新放回原总体,参加下一次抽取。下一次抽取。不重复抽样:不重复抽样:也称不重置抽样。指每次也称不重置抽样。指每次从一个样本中抽取一个单位,连续进从一个样本中抽取一个单位,连续进行行n次抽取构成一个样本,但每次抽出次抽取构成一个样本,但每次抽出的单位就不放回参加下一次抽取。的单位就不放回参加下一次抽取。2.考虑顺序抽样和不考虑顺序抽样考虑顺序抽样和不考虑顺序抽样考虑顺序抽样:考虑顺序抽样:指从总体指从总体N个单位中抽个单位中抽取取n个单位组成样本,不但要考虑样本个单位组成样本,不但要考虑样本各单位的性质是否相同,还要考虑不同各单位的性质是否相同,还要考虑不同性质各单位的中选顺序。性质各单位的中选顺序。不考虑顺序抽样:不考虑顺序抽样:指从总体指从总体N个单位中个单位中抽取抽取n个单位组成样本,只考虑样本各个单位组成样本,只考虑样本各单位的成分如何,而不考虑各单位的单位的成分如何,而不考虑各单位的中选顺序。中选顺序。3.把抽选方式和是否考虑样本中各单位把抽选方式和是否考虑样本中各单位的顺序结合起来的四种情况及其样本的顺序结合起来的四种情况及其样本可能数目(可能数目(M):):1)考虑顺序的重复抽样)考虑顺序的重复抽样2)考虑顺序的不重复抽样)考虑顺序的不重复抽样3)不考虑顺序的重复抽样)不考虑顺序的重复抽样4)不考虑顺序的不重复抽样)不考虑顺序的不重复抽样1.大数定律及其重要意义大数定律及其重要意义四、抽样调查的数理基础四、抽样调查的数理基础 大数定律:大数定律:又称大数法则,是说明大量又称大数法则,是说明大量的随机现象的平均结果具有稳定性质的法的随机现象的平均结果具有稳定性质的法则。说明如果被研究的总体数量特征是由则。说明如果被研究的总体数量特征是由大量的相互独立的随机变量形成的,而且大量的相互独立的随机变量形成的,而且每个变量对总体的影响都相对地小、那么每个变量对总体的影响都相对地小、那么对大量随机变量加以综合平均的结果,变对大量随机变量加以综合平均的结果,变量的个别影响相互抵消,而显现出他们共量的个别影响相互抵消,而显现出他们共同作用的倾向,使总体数量特征具有稳定同作用的倾向,使总体数量特征具有稳定性。性。即:即:如果随机变量总体存在着有限的平均如果随机变量总体存在着有限的平均数和方差,则对于足够多的抽样单位数数和方差,则对于足够多的抽样单位数n,可以以几乎趋近于,可以以几乎趋近于1的概率,来期望抽的概率,来期望抽样平均数与总体平均数的绝对离差为任意样平均数与总体平均数的绝对离差为任意小,即对任意小的正数小,即对任意小的正数 ,有,有 从理论上解释了样本与总体之从理论上解释了样本与总体之间的内在联系,即随着样本单位数间的内在联系,即随着样本单位数n的增加,样本平均数有接近于总的增加,样本平均数有接近于总体平均数的趋势,或说,样本平均体平均数的趋势,或说,样本平均数在概率上收敛于总体平均数。数在概率上收敛于总体平均数。大数定律对于抽样推断的重要意义大数定律对于抽样推断的重要意义2.正态分布的有关定理正态分布的有关定理 若总体很大且服从正态分布,则从若总体很大且服从正态分布,则从该总体中抽取容量为该总体中抽取容量为n的样本平均的样本平均 数数 也服从正态分布也服从正态分布 ,且且其平均数等于总体平均数其平均数等于总体平均数 ,标,标 准差准差 (重复抽样)或(重复抽样)或 (不重复抽样)(不重复抽样).而标准随机变量而标准随机变量 则服从标准正态分布则服从标准正态分布N(0,1)(1)正态分布再生定理)正态分布再生定理 若总体很大且变量若总体很大且变量X的平均数的平均数 和和标准差标准差 都是有限的数,但不都是有限的数,但不服从正态分布,只要样本足够大服从正态分布,只要样本足够大(n30),样本平均数的分布就),样本平均数的分布就趋近于正态分布趋近于正态分布 ,且有且有 ,标准差,标准差 (重(重 复抽样)或复抽样)或 (不重复抽(不重复抽样)。而标准随机变量样)。而标准随机变量 则服从标准正态分布则服从标准正态分布N(0,1).(2)中心极限定理)中心极限定理第三节抽样推断的基本原理第三节抽样推断的基本原理一、抽样估计的优良标准一、抽样估计的优良标准 无偏性无偏性 一致性一致性 有效性有效性评价准则评价准则的数学期望的数学期望等于总体参等于总体参数,即数,即该估计量称该估计量称为无偏估计为无偏估计无偏性无偏性有效性有效性当当 为为 的无的无偏估计时,偏估计时,方方差差 越小,越小,无偏估计越有无偏估计越有效。效。一致性一致性对于无限总体,对于无限总体,如果对任意如果对任意则称则称 是是的一致估计。的一致估计。估计量估计量二、抽 样 误 差1.抽样误差的概念和意义抽样误差的概念和意义抽样误差是指抽样指标与总体指标之抽样误差是指抽样指标与总体指标之间的离差。间的离差。抽样误差不包括下面两类误差:抽样误差不包括下面两类误差:登记性登记性误差:误差:在调查过程中由于观察、在调查过程中由于观察、测量、登记、计算上的差错而引起的误差。测量、登记、计算上的差错而引起的误差。系统性误差:系统性误差:由于违反抽样调查的随由于违反抽样调查的随机原则,造成样本的代表性不足所引起的误机原则,造成样本的代表性不足所引起的误差。差。2.抽样误差的影响因素抽样误差的影响因素 总体各单位标志值的变异程度总体各单位标志值的变异程度。在其他条件不变的情况下,总体各单位标志在其他条件不变的情况下,总体各单位标志值的变异程度愈大,抽样误差也愈大,反之值的变异程度愈大,抽样误差也愈大,反之则愈小。则愈小。样本单位数的多少样本单位数的多少。在其他条件不变的情况下,样本单位数愈多,在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小,反之则愈大。抽样误差就愈小,反之则愈大。抽样方法抽样方法。抽样方法不同,抽样误差也不同。一般,重抽样方法不同,抽样误差也不同。一般,重复抽样的误差比不重复抽样的误差要大。复抽样的误差比不重复抽样的误差要大。抽样的组织形式抽样的组织形式。不同的抽样组织形式,有不同的抽样误差。不同的抽样组织形式,有不同的抽样误差。三、抽样平均误差三、抽样平均误差 1.1.抽样平均误差概念抽样平均误差概念 样本平均数(样本成数)对总体平均数样本平均数(样本成数)对总体平均数(或总体成数)的标准差。(或总体成数)的标准差。表示样本平均数的平均误差,表示样本平均数的平均误差,表表示样本成数的平均误差,示样本成数的平均误差,M表示样本可表示样本可能数目。则:能数目。则:2.抽样平均误差的计算抽样平均误差的计算当抽样方式为当抽样方式为重复抽样重复抽样时时 它说明在重复抽样的条件下,抽样平它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本均误差与总体标准差成正比,与样本容量的平方根成反比。容量的平方根成反比。当抽样方式为不当抽样方式为不重复抽样重复抽样时时例:有5个工人的日产量分别为:6,8,10,12,14件,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平,则抽样平均误差为多少?解:总体均值:总体标准差:抽样平均误差:若用不重复抽样的方法:若用不重复抽样的方法:在计算抽样平均误差时,通常得不到总体在计算抽样平均误差时,通常得不到总体标准差的数值,一般用样本标准差来代替标准差的数值,一般用样本标准差来代替总体标准差。总体标准差。根据样本平均误差和总体标准差的关系,根据样本平均误差和总体标准差的关系,可得到可得到样本成数样本成数的平均误差的计算公式:的平均误差的计算公式:1.在重复抽样下:在重复抽样下:2.在不重复抽样下:在不重复抽样下:例:某企业生产的产品,按正常生产经验,合格例:某企业生产的产品,按正常生产经验,合格率为率为90%。现从。现从5000件产品中抽取件产品中抽取50件进行检验,件进行检验,求合格率的抽样平均误差。求合格率的抽样平均误差。解:解:在重复抽样条件下:在重复抽样条件下:不重复抽样条件下:不重复抽样条件下:四、抽样极限误差四、抽样极限误差 抽样极限误差是指样本和总体指标之间误抽样极限误差是指样本和总体指标之间误差的可能范围。由于总体指标是一个确定的数,差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕总体指标上下波动的,它而样本指标则是围绕总体指标上下波动的,它与总体指标之间既有正离差,也有负离差,样与总体指标之间既有正离差,也有负离差,样本指标变动的上限或下限与总体指标之差的绝本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,我们将对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差可能范围称这种以绝对值形式表示的抽样误差可能范围称为为抽样极限误差抽样极限误差。也称作也称作允许误差、误差范允许误差、误差范围、误差置信限。围、误差置信限。设设x与与p分别表示样本平均数与样分别表示样本平均数与样本成数的抽样极限误差,则有:本成数的抽样极限误差,则有:上述公式变换为不等式可表示成上述公式变换为不等式可表示成:抽样误差的概率度抽样误差的概率度把极限误差除以相应的抽样平均误差,便得把极限误差除以相应的抽样平均误差,便得到数值到数值Z,表示误差范围为抽样平均误差的,表示误差范围为抽样平均误差的Z倍。倍。Z是测量估计可靠程度的一个参数,称为是测量估计可靠程度的一个参数,称为抽样误差的抽样误差的概率度概率度。其公式为:。其公式为:抽样估计的置信度就是表明抽样指标抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的和总体指标的误差不超过一定范围的概率保证程度。抽样时,估计抽样误概率保证程度。抽样时,估计抽样误差的范围大小称为抽样估计的精确程差的范围大小称为抽样估计的精确程度;估计这一范围的概率是多少称为度;估计这一范围的概率是多少称为抽样估计的可靠程度。抽样估计的可靠程度。抽样误差范围增大时,抽样估计抽样误差范围增大时,抽样估计的置信度也大,抽样精确程度则降低,的置信度也大,抽样精确程度则降低,反之亦然。反之亦然。四、抽样估计的置信度四、抽样估计的置信度 由于提高把握程度,会增大允由于提高把握程度,会增大允许误差,使估计精度降低,而缩小许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会允许误差,提高估计的精度,又会降低估计的把握程度,所以降低估计的把握程度,所以在实际在实际中应根据具体情况,先确定一个合中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相或先确定一个允许误差范围再求相应的把握程度。应的把握程度。68.27%95.45%99.73%当当z=1时,时,F(z)=68.27%当当z=1.96时,时,F(z)=95%当当z=2时,时,F(z)=95.45%当当z=3时,时,F(z)=99.73%常用常用概率度概率度Z值及相应的值及相应的概率保证程度概率保证程度为:为:六、抽样推断的方法六、抽样推断的方法 抽样推断的方法,即参数估计抽样推断的方法,即参数估计就是以所计算的样本指标来估就是以所计算的样本指标来估计相应的总体指标。计相应的总体指标。参数估计参数估计有点估计有点估计和和区间估计区间估计两种形式。两种形式。(一)(一)点估计点估计 也称定值估计,即直接以抽样也称定值估计,即直接以抽样指标值代表总体指标的估计值。指标值代表总体指标的估计值。通常评选估计量优良有三个标通常评选估计量优良有三个标准,即准,即:*无偏性无偏性 *有效性有效性 *一致性一致性点估计的方法点估计的方法*矩估计法矩估计法 *顺序统计量法顺序统计量法 *最大似然法最大似然法 *最小二乘法最小二乘法点估计的缺点点估计的缺点 由于一次只随机抽取一个样本,由于一次只随机抽取一个样本,因样本不同,估计值会有很大差因样本不同,估计值会有很大差异,因此一次只随机抽一个样本异,因此一次只随机抽一个样本的点估计值不能恰当代表所要估的点估计值不能恰当代表所要估计的总体参数,即点估计的主要计的总体参数,即点估计的主要缺点是没有解决参数估计的精确缺点是没有解决参数估计的精确度与可靠性问题。度与可靠性问题。(二)(二)区间估计区间估计 对于总体的未知指标对于总体的未知指标X,根据样本构造的根据样本构造的两个统计量两个统计量x1、x2,(x1x2),使随机区,使随机区间间(x1,x2)包含包含X的概率等于给定值的概率等于给定值1 (01),即即 P(x1Xx2)1 则称则称1为为置信概率置信概率,也就是,也就是估计的可靠估计的可靠程度,程度,也称为也称为置信度置信度。为显著水平,为显著水平,(x1,x2)称为称为X的置信区间,的置信区间,x1,x2分别称为置信下限和置信上限。分别称为置信下限和置信上限。根据所给条件不同有两种方法:根据所给条件不同有两种方法:1.根据已给定的置信度的要求,利用根据已给定的置信度的要求,利用概率表查出这个概率保证程度所对概率表查出这个概率保证程度所对应的概率度应的概率度 Z,然后结合抽样所得的然后结合抽样所得的抽样平均误差抽样平均误差 ,最后求出抽样误,最后求出抽样误差可能范围(极限误差)差可能范围(极限误差)。2.2.根据已给定的允许误差范围(极根据已给定的允许误差范围(极限误差限误差),),然后结合抽样所得的然后结合抽样所得的平均误差,将极限误差平均误差,将极限误差除以平均除以平均误差误差 ,求出概率度,求出概率度 Z 值,在从概值,在从概率表中查出有关率表中查出有关 Z 值所对应的置信值所对应的置信度度F(Z).1.总体平均数的区间估计总体平均数的区间估计表表达达式式其中,其中,为极限误差为极限误差步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计算;或计算样本标准差样本标准差 ,即,即 计算抽样平均误差:计算抽样平均误差:重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:【例【例A A】某企业生产某种产品的工某企业生产某种产品的工人有人有10001000人,某日采用不重复抽人,某日采用不重复抽样从中随机抽取样从中随机抽取100100人调查他们的人调查他们的当日产量,要求在当日产量,要求在9595的概率保的概率保证程度下,证程度下,估计该厂全部工人的估计该厂全部工人的日平均产量和日总产量。日平均产量和日总产量。按按 日产量分组日产量分组(件)(件)组中值组中值(件件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计100126004144100100名工人的日产量分组资料名工人的日产量分组资料解:解:则该企业工人人均产量则该企业工人人均产量 及日总产量及日总产量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.797124.797至至127.203127.203件之间,其日总产量在件之间,其日总产量在124797124797至至127303127303件之间,估计的可靠程度为件之间,估计的可靠程度为9595。【例【例B B】某乡水稻总面积某乡水稻总面积2000020000亩,亩,以不重置抽样方法从中随机抽取以不重置抽样方法从中随机抽取400400亩实割实测求得样本平均亩产亩实割实测求得样本平均亩产645645公公斤,标准差斤,标准差72.672.6公斤。要求极限误公斤。要求极限误差不超过差不超过7.27.2公斤,公斤,试对该乡水稻的试对该乡水稻的亩产和总产量作估计。亩产和总产量作估计。第一步:计算抽样平均误差第一步:计算抽样平均误差第二步:计算平均亩产和总产量的上下限第二步:计算平均亩产和总产量的上下限亩产下限亩产下限=645-7.2=637.8(公斤公斤)亩产上限亩产上限=645+7.2=652.2(公斤公斤)第三步:计算概率度第三步:计算概率度总产量下限总产量下限=20000637.8=1275.6(公斤公斤)总产量上限总产量上限=20000652.2=1304.4(公斤公斤)以以95.45%保证该乡水稻平均亩产在保证该乡水稻平均亩产在637.8至至652.2公斤之间,总产量在公斤之间,总产量在1275.6至至1304.4万公斤之间。万公斤之间。(二二)总体成数的区间估计总体成数的区间估计 表表达达式式其中,其中,为极限误差为极限误差步骤步骤 计算样本成数计算样本成数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;计算抽样平均误差:计算抽样平均误差:重复抽样条重复抽样条件下件下不重复抽样不重复抽样条件下条件下 计算抽样极限误差:计算抽样极限误差:确定总体成数的置信区间:确定总体成数的置信区间:【例【例B B】若例若例A A中工人日产量在中工人日产量在118118件以上者为完成生产定额任务,件以上者为完成生产定额任务,要求在要求在9595的概率保证程度下,的概率保证程度下,估计该厂全部工人中完成定额的估计该厂全部工人中完成定额的工人比重及完成定额的工人总数工人比重及完成定额的工人总数。按按 日产量分组(件)日产量分组(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100100名工人的日产量分组资料名工人的日产量分组资料完成定额完成定额的人数的人数幻灯片幻灯片 47解:解:则该企业全部工人中完成定额的工人比重则该企业全部工人中完成定额的工人比重 及完成定额的工人总数及完成定额的工人总数 的置信区间为:的置信区间为:即该企业工人中完成定额的工人比重即该企业工人中完成定额的工人比重在在0.84320.8432至至0.95680.9568之间,完成定额的之间,完成定额的工人总数在工人总数在843.2843.2至至956.8956.8人之间,估人之间,估计的可靠程度为计的可靠程度为9595。保证抽选样本时按照随机原则进行。保证抽选样本时按照随机原则进行。抽取样本单位时,应确保每个总体单位都有抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位。集和整理时,不能随意遗漏或更换样本单位。考虑样本合适的容量。考虑样本合适的容量。要兼顾抽样组织形式和抽样方法。要兼顾抽样组织形式和抽样方法。必须重视调查费用这个基本因素必须重视调查费用这个基本因素。在其他条件相同的情况下,选择费用最少的在其他条件相同的情况下,选择费用最少的方案。方案。一、抽样方案设计的原则一、抽样方案设计的原则第四节第四节 抽样组织设计抽样组织设计二、抽样方案的检查二、抽样方案的检查(一一)准确性检查准确性检查 所谓准确性检查,所谓准确性检查,看是否超过了方案所允许的误差的范看是否超过了方案所允许的误差的范围。若误差限小于或等于允许的误差,围。若误差限小于或等于允许的误差,即:即:x允许误差,则说明方案的设允许误差,则说明方案的设计符合准确性的要求,可以实施。若,计符合准确性的要求,可以实施。若,x允许误差,则说明方案不符合准允许误差,则说明方案不符合准确性的要求,就要对方案进行检查和确性的要求,就要对方案进行检查和修正,直至符合准确性的要求为止。修正,直至符合准确性的要求为止。(二二)代表性检查代表性检查所谓代表性检查,是将方案中的样所谓代表性检查,是将方案中的样本指标与过去已掌握的总体同一指本指标与过去已掌握的总体同一指标进行对比,看其比率是否超过所标进行对比,看其比率是否超过所规定的要求。规定的要求。编制抽样框编制抽样框 确定抽样方法确定抽样方法 确定抽样组织方式确定抽样组织方式 确定样本容量确定样本容量三、三、抽样方案设计的主要内容抽样方案设计的主要内容(一)(一)抽样框抽样框 指包括全部抽样单位的名单框架或清指包括全部抽样单位的名单框架或清指包括全部抽样单位的名单框架或清指包括全部抽样单位的名单框架或清单表,仅对有限总体而言单表,仅对有限总体而言单表,仅对有限总体而言单表,仅对有限总体而言总体单位名称表总体单位名称表地段抽样框地段抽样框区域抽样框区域抽样框在商场的大门口在商场的大门口在微波炉柜台前在微波炉柜台前在某个住宅小区在某个住宅小区中山路中山路桥西区桥西区桥东区桥东区华北地区华北地区东北地区东北地区居民一组居民一组居民二组居民二组某公司在大连进行微某公司在大连进行微波炉市场调查:波炉市场调查:在市区街道旁边在市区街道旁边(二二)确定抽样方法确定抽样方法重复抽样重复抽样又被称作重置抽样、有放回抽样又被称作重置抽样、有放回抽样抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取特点特点同一总体单位有可能被重复抽中,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行。而且每次抽取都是独立进行。不重复抽样不重复抽样又被称作不重置抽样、不放回又被称作不重置抽样、不放回抽样抽样抽出抽出个体个体登记登记特征特征继续继续抽取抽取特点特点同一总体中每个单位被抽中的机会并同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不均等,在连续抽取时,每次抽取都不是独立进行。不是独立进行。是最为常用的抽样方法,用于无限总是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。体和许多有限总体样本单位的抽样。1.1.简单随机抽样简单随机抽样简单抽样也称纯随机抽样,是在总体单位简单抽样也称纯随机抽样,是在总体单位均匀混合的情况下,按随机原则逐个抽出样均匀混合的情况下,按随机原则逐个抽出样本的抽样方法。本的抽样方法。比较适合于在总体单位标志变异较小,总体比较适合于在总体单位标志变异较小,总体单位数不是很多的情况。单位数不是很多的情况。(三)确定抽样组织方式(三)确定抽样组织方式计算样本平均数计算样本平均数计算样本标准差计算样本标准差计算抽样平均误差计算抽样平均误差 (重复)(重复)(不重复)(不重复)推断。推断。若已知置信度,对置信区间作出推断;若已若已知置信度,对置信区间作出推断;若已知允许误差范围,对置信度作出判断。知允许误差范围,对置信度作出判断。简单随机抽样推断步骤简单随机抽样推断步骤(1)总体平均数的推断)总体平均数的推断计算样本成数计算样本成数计算抽样成数方差计算抽样成数方差计算成数抽样平均误差计算成数抽样平均误差 (重复);(重复);(不重复)(不重复)推断。推断。若已知置信度,对置信区间作出推断;若若已知置信度,对置信区间作出推断;若已知允许误差范围,对置信度作出判断。已知允许误差范围,对置信度作出判断。(2)总体成数的推断)总体成数的推断 重复抽样重复抽样 不重复抽样不重复抽样必要抽样数目的确定必要抽样数目的确定(1)样本平均数给定时必要抽样数目的确定)样本平均数给定时必要抽样数目的确定计算结果通常向上进位计算结果通常向上进位【例【例A A】某食品厂要检验本月生产某食品厂要检验本月生产的的1000010000袋某产品的重量,根据上袋某产品的重量,根据上月资料,这种产品每袋重量的标月资料,这种产品每袋重量的标准差为准差为2525克。要求在克。要求在95.4595.45的概的概率保证程度下,平均每袋重量的率保证程度下,平均每袋重量的误差范围不超过误差范围不超过5 5克,应抽查多少克,应抽查多少袋产品?袋产品?解:解:重复抽样重复抽样 不重复抽样不重复抽样(2 2)样本成数给定时必要抽样数目的确定)样本成数给定时必要抽样数目的确定【例【例B】某企业对一批总数为某企业对一批总数为5000件的件的产品进行质量检查,过去几次同类调查产品进行质量检查,过去几次同类调查所得的产品合格率为所得的产品合格率为93、95、96,为了使合格率的允许误差不超过为了使合格率的允许误差不超过3,在,在99.73 的概率保证程度下,应抽查多少的概率保证程度下,应抽查多少件产品?件产品?【分析】因为共有三个过去的合格率的【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其资料,为保证推断的把握程度,应选其中方差最大者,即中方差最大者,即P=93。解:解:2.类型抽样类型抽样 类型抽样又称类型抽样又称分层抽样分层抽样,是指在抽,是指在抽样之前,先将总体依照某种标准划分为样之前,先将总体依照某种标准划分为若干互不重叠且穷尽的子总体,即每个若干互不重叠且穷尽的子总体,即每个单位必属于且仅属于一个子总体,称这单位必属于且仅属于一个子总体,称这些子总体为类或层,然后,在各层中独些子总体为类或层,然后,在各层中独立抽取样本单位,总体样本由各层样本立抽取样本单位,总体样本由各层样本组成,根据各层样本汇总对总体参数作组成,根据各层样本汇总对总体参数作出估计。出估计。这种方式应用最为广泛。这种方式应用最为广泛。类型抽样能使样本结构更接近于总体结构,类型抽样能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标提高样本的代表性;能同时推断总体指标和各子总体的指标。和各子总体的指标。总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取 类型抽样分组是要遵循的原则类型抽样分组是要遵循的原则 层内的齐一性,即被划入同一层的个层内的齐一性,即被划入同一层的个 体单位要尽可能的近似。体单位要尽可能的近似。层间的差距性,即在不同层内的单位层间的差距性,即在不同层内的单位 尽可能使其有较大的差异。尽可能使其有较大的差异。类型抽样的估计量和推断步骤类型抽样的估计量和推断步骤(1)类型抽样的估计量)类型抽样的估计量 抽样误差的确定抽样误差的确定重复抽样下重复抽样下:样本平均数的平均误差:样本平均数的平均误差:其中,其中,样本成数的平均误差:样本成数的平均误差:其中,其中,不重复抽样下:不重复抽样下:样本平均数的平均误差:样本平均数的平均误差:样本成数的平均误差:样本成数的平均误差:必要抽样数目的确定必要抽样数目的确定 重复重复抽样下:抽样下:样本平均数的必要抽样数目:样本平均数的必要抽样数目:样本成数的必要抽样数目:样本成数的必要抽样数目:不重复不重复抽样下:抽样下:样本样本平均数平均数的必要抽样数目:的必要抽样数目:样本样本成数成数的必要抽样数目:的必要抽样数目:(2 2)类型抽样推断的步骤)类型抽样推断的步骤计算各组的组平均数计算各组的组平均数 其中,其中,i=1,2,k;j=1,2,fi 计算各组的组内方差计算各组的组内方差 i=1,2,k;j=1,2,fi 计算抽样的样本平均数计算抽样的样本平均数计算抽样样本的组内方差的平均数计算抽样样本的组内方差的平均数计算抽样的平均误差计算抽样的平均误差 (重复抽样)(重复抽样)计算抽样推断的极限误差计算抽样推断的极限误差 ,或确定抽样推断的置信度或确定抽样推断的置信度F(z)F(z).【例【例【例【例C C】某厂有职工某厂有职工某厂有职工某厂有职工33003300人,根据工作性质不人,根据工作性质不人,根据工作性质不人,根据工作性质不同分为管理人员和工人两部分,其中管理人同分为管理人员和工人两部分,其中管理人同分为管理人员和工人两部分,其中管理人同分为管理人员和工人两部分,其中管理人员员员员300300人,工人人,工人人,工人人,工人30003000人。现按比例抽选人。现按比例抽选人。现按比例抽选人。现按比例抽选1010 职职职职工进行月工资调查,这工进行月工资调查,这工进行月工资调查,这工进行月工资调查,这330330人的月工资资料人的月工资资料人的月工资资料人的月工资资料如下表所示,要求在如下表所示,要求在如下表所示,要求在如下表所示,要求在9595 的概率保证程度下的概率保证程度下的概率保证程度下的概率保证程度下(Z=1.96Z=1.96)对其平均收入做出区间估计。)对其平均收入做出区间估计。)对其平均收入做出区间估计。)对其平均收入做出区间估计。解:计算各组平均数:解:计算各组平均数:各组组内方差:各组组内方差:样本平均数:样本平均数:组内方差的平均数:组内方差的平均数:抽样平均误差:抽样平均误差:抽样极限误差:抽样极限误差:则该厂职工的平均月工资收入为则该厂职工的平均月工资收入为707.27-11.39,707.27+11.39,即以,即以95%的置信度推断该厂职工平均工资收的置信度推断该厂职工平均工资收入的置信区间为入的置信区间为695.88,718.66。结论结论第一,根据总体方差等于组间方差与组内平均方第一,根据总体方差等于组间方差与组内平均方差之和的定理,所以类型抽样的平均误差一般小差之和的定理,所以类型抽样的平均误差一般小于简单随机抽样的平均误差,只有当组间方差等于简单随机抽样的平均误差,只有当组间方差等于于0时,两者才相等。时,两者才相等。第二,由于总体方差是唯一确定的数值,因此在第二,由于总体方差是唯一确定的数值,因此在类型抽样分组时应该尽可能扩大组间方差,缩小类型抽样分组时应该尽可能扩大组间方差,缩小组内方差,即各组间的差异可以大,而各组内的组内方差,即各组间的差异可以大,而各组内的差异必须小,这样就可以减少抽样误差。差异必须小,这样就可以减少抽样误差。整群抽样也称集团抽样,是指在组织抽整群抽样也称集团抽样,是指在组织抽样调查时,将总样调查时,将总体单位的某些特征将总体单位的某些特征将总体分为若干部分,每一部分称为一个群,体分为若干部分,每一部分称为一个群,把每一群作为一个抽样单位,按群进行把每一群作为一个抽样单位,按群进行抽样,然后,对抽中的群进行全面调查抽样,然后,对抽中的群进行全面调查的组织形式。的组织形式。3.整群抽样整群抽样例:总体群数例:总体群数R=16 样本群数样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量样本容量简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差进行整群抽样的原则群内单位的变异性,即同一群体内群内单位的变异性,即同一群体内 的各单位,其统计特征值相差大一的各单位,其统计特征值相差大一 些好。些好。群间的齐一性,即群与群之间的统群间的齐一性,即群与群之间的统 计特征值相差小一些好。计特征值相差小一些好。整群抽样的估计量及其抽样平均误差整群抽样的估计量及其抽样平均误差设总体的全部设总体的全部N单位划分为单位划分为R群,每群包含群,每群包含M单位。单位。则则NRM。现在从总体。现在从总体R群中随机抽取群中随机抽取r群组成样本,群组成样本,并分别对中选并分别对中选r群的所有群的所有M单位进行调查。单位进行调查。第

    注意事项

    本文(抽样推断统计学.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开