欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第四章抽样调查与参数估计优秀课件.ppt

    • 资源ID:64370104       资源大小:5.23MB        全文页数:116页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第四章抽样调查与参数估计优秀课件.ppt

    第四章抽样调查与第四章抽样调查与参数估计参数估计第1页,本讲稿共116页4-2抽样调查与参数估计有关基本概念概率抽样方法总体参数估计总体与样本总体参数与样本统计量样本容量与样本个数重复抽样与不重复抽样抽样框与抽样单位概率抽样和非概率抽样多相抽样分层抽样简单随机抽样总体方差的参数估计总体比率的参数估计总体均值的参数估计抽样误差和非抽样误差整群抽样系统抽样多阶段抽样样本容量的参数确定第2页,本讲稿共116页4-3n抽样涉及的基本概念有:抽样涉及的基本概念有:n总体与样本总体与样本(见第一章见第一章)n样本容量与样本个数样本容量与样本个数n总体参数与样本统计量总体参数与样本统计量n重复抽样与不重复抽样重复抽样与不重复抽样n抽样框与抽样单位抽样框与抽样单位n概率抽样和非概率抽样概率抽样和非概率抽样n抽样的组织方式抽样的组织方式n抽样误差好非抽样误差抽样误差好非抽样误差n这些概念是统计学特有的,体现了统计学的这些概念是统计学特有的,体现了统计学的基本思想与方法。基本思想与方法。第一节 有关基本概念第3页,本讲稿共116页4-4一、总体和样本:总体是指研究对象的全体,它是由研究对象中的单元组成的。总体中包含单元的数目称作总体容量(或大小);样本是指抽样时按照抽样的规则所抽中的那部分单元所组成的集合。总体样本抽取样本推断总体第4页,本讲稿共116页4-5n1.总体:又称全及总体、母体,指所要研究对总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用性质的单位构成。总体单位数用 N 表示。表示。n2.样本:又称子样,来自总体,是从总体中按样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构随机原则抽选出来的部分,由抽选的单位构成。样本单位数用成。样本单位数用 n 表示。表示。n3.总体是唯一的、确定的,而样本是不确定的、总体是唯一的、确定的,而样本是不确定的、可变的、随机的。可变的、随机的。第5页,本讲稿共116页4-6二、样本容量与样本个数二、样本容量与样本个数n样本容量:一个样本中所包含的单位数,用样本容量:一个样本中所包含的单位数,用n表示。必要样本量是能够满足估计精度要求表示。必要样本量是能够满足估计精度要求的最少样本量。的最少样本量。n样本个数:又称样本可能数目,指从一个总样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。用体中所可能抽取的样本的个数。用A表示。表示。对于有限总体,样本个数可以计算出来。样对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。本个数的多少与抽样方法有关。(这个概念只这个概念只是对有限总体有意义,对无限总体没有意义!是对有限总体有意义,对无限总体没有意义!)n当当N和和n一定时,一定时,A的多少与抽样方法有关,的多少与抽样方法有关,其计算方法列表如下:其计算方法列表如下:第6页,本讲稿共116页4-7 抽样方法抽样方法放回抽样放回抽样不放回抽样不放回抽样考虑顺序考虑顺序不考虑顺序不考虑顺序第7页,本讲稿共116页4-8三、总体参数和样本统计量三、总体参数和样本统计量n总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。n样本统计量:根据样本分布计算的指标。是随机变量。样本统计量:根据样本分布计算的指标。是随机变量。平均数标准差、方差成数参数、2p统计量S、S2P 总体 样本第8页,本讲稿共116页四、重复抽样和不重复抽样四、重复抽样和不重复抽样n1、重复抽样又称放回抽样或重置抽样,它是指抽中一、重复抽样又称放回抽样或重置抽样,它是指抽中一个单位并登记有关信息后重新放回到总体中继续参加个单位并登记有关信息后重新放回到总体中继续参加下一次的抽选,这样逐次反复,直到抽够足够的单位下一次的抽选,这样逐次反复,直到抽够足够的单位为止。在重复抽样的条件下,每个单位中选的机会在为止。在重复抽样的条件下,每个单位中选的机会在各次抽样中都完全相等。各次抽样中都完全相等。n2、不重复抽样又称不放回抽样或不重置抽样,它是指抽中一、不重复抽样又称不放回抽样或不重置抽样,它是指抽中一个单位并登记有关信息后不再放回到总体中,而是继续从总个单位并登记有关信息后不再放回到总体中,而是继续从总体中余下的单位抽选样本单位,直到抽够足够的单位为止。体中余下的单位抽选样本单位,直到抽够足够的单位为止。在不重复抽样的条件下,每个单位中选的机会在各次抽样中在不重复抽样的条件下,每个单位中选的机会在各次抽样中是不相等的,每个单位只能被抽中一次。是不相等的,每个单位只能被抽中一次。4-9第9页,本讲稿共116页4-10 五、抽样框五、抽样框 n抽样框是在抽样前,为便于抽样工作的组织,在可能抽样框是在抽样前,为便于抽样工作的组织,在可能条件下编制的用来进行抽样的、记录或表明总体所有条件下编制的用来进行抽样的、记录或表明总体所有抽样单元的框架,在抽样框中,每个抽样单元都被编抽样单元的框架,在抽样框中,每个抽样单元都被编上号码。抽样框可以是一份清单(名单抽样框)、一上号码。抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框)。张地图(区域抽样框)。n编制抽样框是一个实际的、重要的问题,因此必须要编制抽样框是一个实际的、重要的问题,因此必须要认真对待。认真对待。n常见的抽样框问题可以概括为四种基本类型:常见的抽样框问题可以概括为四种基本类型:n(1)缺失一些元素,即抽样框涵盖不完全;缺失一些元素,即抽样框涵盖不完全;n(2)多个元素对应一个号码;多个元素对应一个号码;n(3)空白或存在异类元素;空白或存在异类元素;n(4)重复号码,即一个元素对应多个号码。重复号码,即一个元素对应多个号码。n对抽样框存在的缺陷要认真对待,有效处理。对抽样框存在的缺陷要认真对待,有效处理。第10页,本讲稿共116页n从抽样框中直接抽取的单位称为抽样单位。但它不一定是构成从抽样框中直接抽取的单位称为抽样单位。但它不一定是构成抽样框的最小单位。根据不同的抽样设计,抽样单位有较大的抽样框的最小单位。根据不同的抽样设计,抽样单位有较大的变动余地。例如在电视收视率的抽样调查中,抽样单位可以是变动余地。例如在电视收视率的抽样调查中,抽样单位可以是拥有电视机的家庭,也可以是每个电视观众。可以将较小的抽拥有电视机的家庭,也可以是每个电视观众。可以将较小的抽样单位的集合视为较大的抽样单位。在复杂抽样时,例如在多样单位的集合视为较大的抽样单位。在复杂抽样时,例如在多阶段抽样中,先抽取较大的抽样单位阶段抽样中,先抽取较大的抽样单位(称为初级单位称为初级单位),再从选,再从选出的初级单位中抽取次级单位出的初级单位中抽取次级单位(或二级单位或二级单位),往下还可以分,往下还可以分为更小的三级单位、四级单位,等等。为更小的三级单位、四级单位,等等。n 可以把抽样框中所包含抽样单位信息的丰富程度作为可以把抽样框中所包含抽样单位信息的丰富程度作为评价抽样框质量的一个标准。在好的抽样框中,抽样单位评价抽样框质量的一个标准。在好的抽样框中,抽样单位的信息比较丰富,这就为采用复杂的抽样设计的信息比较丰富,这就为采用复杂的抽样设计(如分层抽样如分层抽样)和不同的估计方法和不同的估计方法(如比率估计如比率估计)提供了条件。提供了条件。n 4-11第11页,本讲稿共116页4-12六、概率抽样和非概率抽样六、概率抽样和非概率抽样第12页,本讲稿共116页4-13(一)(一)非概率抽样非概率抽样1.非概率抽样及其优缺点非概率抽样及其优缺点n非概率抽样是用非随机的方法抽选样本。非概率抽样是用非随机的方法抽选样本。n优点:优点:n快速简便;快速简便;n费用相对比较低;费用相对比较低;n不需要任何抽样框;不需要任何抽样框;n对探索性研究和调查设计的开发很有用。对探索性研究和调查设计的开发很有用。n缺点:缺点:n不能对总体进行推断;不能对总体进行推断;n由于不知总体单元的入样概率,故不能计由于不知总体单元的入样概率,故不能计算估计值的抽样误差。算估计值的抽样误差。第13页,本讲稿共116页4-142.各种非概率抽样方法n方便抽样,又称任意抽样。样本单元的选取由调查员决定,又由被调查者主动提供信息。如街道拦截访问。n志愿者抽样。被调查者都是自愿参与调查。如网上问卷,自愿回答。n判断抽样。由专家有目的地挑选“有代表性”的样本进行调查。如典型调查。n配额抽样。从总体的各个子总体中选取特定数量的样本单元组成样本。如市场调查中,规定男女消费者的样本各多少。n 滚雪球抽样。适合于总体中某种较为稀少的特殊子总体而又缺少完整的抽样框。抽样时通过已知的少数个体获得信息逐渐扩大。第14页,本讲稿共116页4-15(二)概率抽样(二)概率抽样n概率抽样是从总体中随机抽选样本单元,被抽中的概率抽样是从总体中随机抽选样本单元,被抽中的单元既不取决于调查人员的愿望,也不取决于被被单元既不取决于调查人员的愿望,也不取决于被被调查者的态度。其次每一个单元都有一定的概率被调查者的态度。其次每一个单元都有一定的概率被抽中。抽中。n优点:可以对总体进行推断,并能计算估计值的优点:可以对总体进行推断,并能计算估计值的抽样误差。抽样误差。n缺点:相对于非概率抽样,设计比较复杂,而且费缺点:相对于非概率抽样,设计比较复杂,而且费用也比较高。用也比较高。n常见的概率抽样方法主要有:简单随机抽样、系常见的概率抽样方法主要有:简单随机抽样、系统抽样、与大小(或规模)成比例的概率统抽样、与大小(或规模)成比例的概率(PPS)抽抽样、整群抽样、分层抽样(样、整群抽样、分层抽样(STR)、多阶抽样、以)、多阶抽样、以及多相抽样等。及多相抽样等。第15页,本讲稿共116页七、抽样误差和非抽样误差七、抽样误差和非抽样误差n抽样误差是指由于抽选样本的随机性,用样本数据对总体抽样误差是指由于抽选样本的随机性,用样本数据对总体参数进行估计是所引起的误差。只有采取概率抽样方式才参数进行估计是所引起的误差。只有采取概率抽样方式才能产生样误差,得到估计量的精度,因此我们说抽样误差能产生样误差,得到估计量的精度,因此我们说抽样误差仅仅表现于概率抽样方式之中。与非概率抽样方式相比,仅仅表现于概率抽样方式之中。与非概率抽样方式相比,能够计算抽样误差是概率抽样最突出的优点。能够计算抽样误差是概率抽样最突出的优点。n非抽样误差是指除抽样误差以外的,由于各种原因而引非抽样误差是指除抽样误差以外的,由于各种原因而引起的误差,例如抽样框有缺陷,目标总体单位和抽样单起的误差,例如抽样框有缺陷,目标总体单位和抽样单位没有能够一一对应;调查中一些被调查者拒绝回答问位没有能够一一对应;调查中一些被调查者拒绝回答问题,调查人员没得到全部样本数据;由于各种原因题,调查人员没得到全部样本数据;由于各种原因(测量、测量、遗忘或有意隐瞒等遗忘或有意隐瞒等),调查中获得的原始数据不正确,以及,调查中获得的原始数据不正确,以及在对调查数据进行编码、录入、汇总过程中可能出现差错,在对调查数据进行编码、录入、汇总过程中可能出现差错,都会产生非抽样误差。都会产生非抽样误差。4-16第16页,本讲稿共116页八、样本量、费用与精度八、样本量、费用与精度n样本量是样本中包含抽样单位的数目,样本量的确定是抽样样本量是样本中包含抽样单位的数目,样本量的确定是抽样中的一个重要问题,样本量越大,抽样误差就越小,估计量中的一个重要问题,样本量越大,抽样误差就越小,估计量的精度就越高。但样本量有直接与费用有关,样本量越大调的精度就越高。但样本量有直接与费用有关,样本量越大调查的费用也就越高。样本量与调查费用之间是一种线性关系,查的费用也就越高。样本量与调查费用之间是一种线性关系,最简单的函数形式为最简单的函数形式为n式中,式中,C0是与样本量是与样本量n无关的固定费用,如抽样方案的设无关的固定费用,如抽样方案的设计计,抽样框的准备,调查的组织、宣传等项开支,抽样框的准备,调查的组织、宣传等项开支,c是与是与n有有关的费用,包括调查本身的费用、旅费、礼品费及数关的费用,包括调查本身的费用、旅费、礼品费及数据处理费等。据处理费等。4-17第17页,本讲稿共116页n然而样本量与调查精度之间是一种非线性关系。在样然而样本量与调查精度之间是一种非线性关系。在样本量较小时,每增加一个样本单位对提高精度的影响本量较小时,每增加一个样本单位对提高精度的影响比较大,随着样本量的增大,每增加一个样本单位的比较大,随着样本量的增大,每增加一个样本单位的影响就逐渐减少。影响就逐渐减少。n因此,一个好的抽样设计必须考虑精度与费用两个方面。这因此,一个好的抽样设计必须考虑精度与费用两个方面。这里想要说明的一层含义是:对于不同的调查项目,精度的要里想要说明的一层含义是:对于不同的调查项目,精度的要求是不同的,调查时应以满足需要的精度为原则,想要说明求是不同的,调查时应以满足需要的精度为原则,想要说明的另一唱层含义是,由于不同的抽样设计会有不同的费用和的另一唱层含义是,由于不同的抽样设计会有不同的费用和精度,因此对于一个具体的抽样设计,应尽量做到在一定费精度,因此对于一个具体的抽样设计,应尽量做到在一定费用下使精度最高,或在达到精度条件下使总费用最省,即使用下使精度最高,或在达到精度条件下使总费用最省,即使设计的效率最高,这样的抽样设计称为最优抽样设计。设计的效率最高,这样的抽样设计称为最优抽样设计。4-18第18页,本讲稿共116页4-19第二节 主要的概率抽样方法(一)简单随机抽样 1、定义:简单随机抽样是从总体的N个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n次,以抽中的n个单元组成简单随机样本。2、优点:(1)比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。3、缺点:(1)没有利用辅助信息;(2)样本分散,面访费用较高;(3)有可能抽到较差的样本;(4)抽选大样本比较费时。第19页,本讲稿共116页4-20(二)系统抽样 1、定义:又称等距抽样,对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个单元的抽样方法。2、抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n,在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,。起点rr+kr+2kr+3k第20页,本讲稿共116页4-21 圆形系统抽样方法:当N不能被n整除时,用圆形系统抽样法可以避免出现样本量可能不一致的情况。把总体单元假想排列在一个圆上,取 k=N/n 最接近的整数,作为间隔,然后在1到N之间,抽取随机起点 r,则被抽中的单元顺序号为:r,r+k,r+2k,r+(n-1)k。如:N=55,n=9,就取k=6,在1到55之间取一个随机起点。例如r=42,则被抽中的单元是42,48,54,5,11,17,23,29和35。第21页,本讲稿共116页4-223、系统抽样的优点(1)没有抽样框时可代替简单随机抽样方法简单;(2)不需要辅助的抽样框信息;(3)样本的分布比较好;估计值容易计算。4、系统抽样的缺点(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)不使用辅助信息使抽样效率不高;(3)使用概念框时,不能预先知道样本量;(4)没有一个无偏的方差估计量;(5)当N不能被n整除时会得到样本量不同的样本。第22页,本讲稿共116页4-23(三)整群抽样 1、定义:由若干个有联系的基本单元组成的集合称为群,抽样时以群为抽样单元的抽样方法就称为整群抽样。整群抽样示意图:黄色为总体红色为群白点为基本单元第23页,本讲稿共116页4-242、整群抽样的优点:(1)能大大减低收集数据的费用;(2)当总体单元自然形成的群时,容易取得抽样框,抽样也更容易;(3)当群内单元差异大,而不同群之间的差异小时,可以提高效率。3、缺点:(1)若群内个单元有趋同性,效率将会降低;(2)通常无法预先知道总样本量,因为不知道群内有多少单元;(3)方差估计比简单随机抽样更为复杂。第24页,本讲稿共116页4-25(四)分层抽样 1、定义:在抽样之前将总体分为同质的、互不重叠的若干子总体,也称为层。然后在每一个层独立地随机抽取样本。分层抽样示意图:第25页,本讲稿共116页4-262、优点:(1)由于性质相同的单元分在同一层,层内差异缩小,可以提高抽样效率;(2)可以得到各层子总体的估计;(3)操作与管理方便;(4)能避免得到一个“差”的样本。3、缺点:(1)对抽样框的要求比较高,必须有分层的辅助信息;(2)收集或编制抽样框的费用比较高;(3)若调查变量与分层的变量不相关,效率可能降低;(4)估计值的计算比简单随机抽样复杂。第26页,本讲稿共116页4-27(五)多阶抽样 1、定义:它是由两个或更多个连续的阶段抽取样本的方法。多阶抽样示意图:总体第一阶样本最终样本第27页,本讲稿共116页4-282、优点:(1)当群具有同质性时,多阶抽样的效率高于整群抽样;(2)样本的分布比简单随机抽样集中,采用面访可以节约时间和费用;(3)不需要整个总体单元的名录框,只要群的名录框和抽中群的单元名录框。3、缺点:(1)效率不如简单随机抽样;(2)通常不能提前知道最终的样本量;(3)调查的组织较整群抽样复杂;(4)估计值与抽样方差的计算较为复杂。第28页,本讲稿共116页4-29(六)多相抽样 1、定义:在同一个抽样框内,先抽一个大样本,收集基本的信息,然后在这个大样本中再抽一个子样本,收集调查的详细信息。多相抽样示意图:。第一相样本第二相样本第29页,本讲稿共116页4-30n2、优点:能显著提高估计值精度(与简单随、优点:能显著提高估计值精度(与简单随机抽样相比);能用来获得抽样框中所没有机抽样相比);能用来获得抽样框中所没有的辅助信息(特别是分层信息);适用于某的辅助信息(特别是分层信息);适用于某些调查指标的数据收集费用特别高,或会给些调查指标的数据收集费用特别高,或会给被调查者带来较重的回答负担的情况。被调查者带来较重的回答负担的情况。n3、缺点:如果需要根据第一相的结果来进行、缺点:如果需要根据第一相的结果来进行第二相调查,得到整个调查结果的时间比单第二相调查,得到整个调查结果的时间比单相调查长;由于对某些样本单元访问次数超相调查长;由于对某些样本单元访问次数超过一次,故所需费用比一相调查要多;调查过一次,故所需费用比一相调查要多;调查的组织会很复杂;估计值和抽样误差的计算的组织会很复杂;估计值和抽样误差的计算会相当复杂。会相当复杂。第30页,本讲稿共116页4-31抽样分布抽样分布n抽样分布的概念:由样本统计量的全部可能取值和与之相应抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。(主要求出样本平均数的的概率(频率)组成的分配数列。(主要求出样本平均数的期望与方差)期望与方差)n包括以下内容包括以下内容n重置抽样分布重置抽样分布n样本平均数的分布样本平均数的分布n样本成数的分布样本成数的分布n样本方差的分布样本方差的分布n不重置抽样分布不重置抽样分布n样本平均数的分布样本平均数的分布n样本成数的分布样本成数的分布n样本方差的分布样本方差的分布第31页,本讲稿共116页4-321.总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 2.分布通常是未知的分布通常是未知的3.可以假定它服从某种分布可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体第32页,本讲稿共116页4-331.一个样本中各观察值的分布一个样本中各观察值的分布 2.也称经验分布也称经验分布 3.当样本容量当样本容量n逐渐增大时,样本分布逐渐逐渐增大时,样本分布逐渐接近总体的分布接近总体的分布 样本分布样本分布(sample distribution)样样本本第33页,本讲稿共116页4-341.样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布n在重复选取容量为在重复选取容量为n的样本时,由该统计量的所有可能的样本时,由该统计量的所有可能取值形成的相对频数分布取值形成的相对频数分布 2.随机变量是随机变量是 样本统计量n样本均值样本均值,样本比例,样本方差等样本比例,样本方差等3.结果来自结果来自容量相同的的所有可能样本可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据理论基础,也是抽样推断科学性的重要依据 抽样分布抽样分布(sampling distribution)第34页,本讲稿共116页4-35抽样分布的形成过程抽样分布的形成过程(sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差样样本本第35页,本讲稿共116页样本均值的抽样分布样本均值的抽样分布第36页,本讲稿共116页4-371.在重复选取容量为在重复选取容量为n的样本时,由样本均值的样本时,由样本均值的所有可能取值形成的相对频数分布的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.推断总体均值推断总体均值 的理论基础的理论基础一、样本均值的抽样分布一、样本均值的抽样分布第37页,本讲稿共116页4-38样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4 。总总体体的的均均值值、方差及分布如下方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差第38页,本讲稿共116页4-39样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条件下,共有条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为n3,4n3,3n3,2n3,1n3n2,4n2,3n2,2n2,1n2n4,4n4,3n4,2n4,1n4n1,4n4n1,3n3n2n1n1,2n1,1n1n第二个观察值n第一个n观察值n所有可能的n=2 的样本(共16个)第39页,本讲稿共116页4-40样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计计算算出出各各样样本本的的均均值值,如如下下表表。并并给给出出样样本本均均值值的的抽样分布抽样分布n3.5n3.0n2.5n2.0n3n3.0n2.5n2.0n1.5n2n4.0n3.5n3.0n2.5n4n2.5n4n2.0n3n2n1n1.5n1.0n1n第二个观察值n第一个n观察值n16个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.5第40页,本讲稿共116页4-41样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.5=2.5 2=1.25=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x第41页,本讲稿共116页4-42样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布,x x 的的数数学学期期望望为为,方方差为差为 2 2/n n。即。即 x xN N(,2 2/n n)第42页,本讲稿共116页4-43中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近近似似服服从从均均值值为为,方方差差为为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x第43页,本讲稿共116页4-44中心极限定理中心极限定理(central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的的的的过过过过程程程程第44页,本讲稿共116页4-45抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本样本均值样本均值正态分布正态分布样本均值样本均值正态分布正态分布样本均值样本均值非正态分布非正态分布第45页,本讲稿共116页4-461.样本均值的数学期望样本均值的数学期望2.样本均值的方差样本均值的方差n重复抽样重复抽样n不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)第46页,本讲稿共116页4-47样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)比较及结论:比较及结论:比较及结论:比较及结论:1.1.样本均值的均值样本均值的均值(数学期望数学期望)等于总体均值等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n第47页,本讲稿共116页4-48统计量的标准误统计量的标准误(standard error)1.样样本本统统计计量量的的抽抽样样分分布布的的标标准准差差,称称为为统统计计量量的的标准误,也称为标准误差标准误,也称为标准误差2.标标准准误误衡衡量量的的是是统统计计量量的的离离散散程程度度,它它测测度度了了用用样本统计量估计总体参数的精确程度样本统计量估计总体参数的精确程度3.以以样样本本均均值值的的抽抽样样分分布布为为例例,在在重重复复抽抽样样条条件件下下,样本均值的标准误为样本均值的标准误为第48页,本讲稿共116页4-49估计的标准误估计的标准误(standard error of estimation)1.当计算标准误时涉及的总体参数未知时,用样本当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误统计量代替计算的标准误,称为估计的标准误2.以样本均值的抽样分布为例,以样本均值的抽样分布为例,当总体标准差当总体标准差 未知时,未知时,可用样本标准差可用样本标准差s代替,则代替,则在重复抽样条件下,在重复抽样条件下,样本样本均值的估计标准误均值的估计标准误为为第49页,本讲稿共116页样本比例的抽样分布样本比例的抽样分布第50页,本讲稿共116页4-511.总体总体(或样本或样本)中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数之比之比n不同性别的人与全部人数之比不同性别的人与全部人数之比n合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为4.比例比例(proportion)第51页,本讲稿共116页4-521.在重复选取容量为在重复选取容量为n的样本时,由样本比的样本时,由样本比例的所有可能取值形成的相对频数分布例的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.当样本容量很大时,样本比例的抽样分布当样本容量很大时,样本比例的抽样分布可用正态分布近似可用正态分布近似 4.推断总体比例推断总体比例 的理论基础的理论基础样本比例的抽样分布样本比例的抽样分布第52页,本讲稿共116页4-531.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差n重复抽样重复抽样n不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)第53页,本讲稿共116页样本方差的抽样分布样本方差的抽样分布第54页,本讲稿共116页4-55样本方差的分布样本方差的分布1.在重复选取容量为n n的的样样本本时时,由由样样本本方方差差的的所所有有可能取值形成的相对频数分布可能取值形成的相对频数分布2.2.对于来自正态总体的简单随机样本,则比值对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为的抽样分布服从自由度为 (n n-1)-1)的 2 2分布,即第55页,本讲稿共116页4-561.由由阿阿贝贝(Abbe)于于1863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(Hermert)和和卡卡皮皮尔尔逊逊(KPearson)分分别别于于1875年年和和1900年推导出来年推导出来2.设设 ,则,则3.令令 ,则,则 Y 服从自由度为服从自由度为1的的 2分布,即分布,即4.当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则的样本,则 2分布分布(2 distribution)第56页,本讲稿共116页4-571.分布的变量值始终为正分布的变量值始终为正 2.分分布布的的形形状状取取决决于于其其自自由由度度n的的大大小小,通通常常为为不不对对称称的的正正偏分布,但随着自由度的增大逐渐趋于对称偏分布,但随着自由度的增大逐渐趋于对称 3.期望为期望为E(2)=n,方差为,方差为D(2)=2n(n为自由度为自由度)4.可可加加性性:若若U和和V为为两两个个独独立立的的服服从从 2分分布布的的随随机机变变量量,U 2(n1),V 2(n2),则则U+V这这一一随随机机变变量量服服从从自自由由度度为为n1+n2的的 2分布分布 2分布分布(性质和特点性质和特点)第57页,本讲稿共116页4-58c c2分布分布(图示图示)选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2=(n-1)s2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体第58页,本讲稿共116页4-59c c2分布分布(例题的图示例题的图示)16个样本方差的分布样本方差样本方差s2s2取值的概率取值的概率0.04/160.56/1624/164.52/16第59页,本讲稿共116页4-60c c2分布分布(用用Excel计算计算c c2分布的概率分布的概率)1.1.利利用用ExcelExcel提提供供的的CHIDISTCHIDIST统统计计函函数数,计计算算c c2 2分分布布右右单尾的概率值单尾的概率值2.2.语语法法为为CHIDIST(CHIDIST(x x,df),df),其其中中dfdf为为自自由由度度,x x是是随随机机变变量量的取值的取值3.3.给给定定自自由由度度和和统统计计量量取取值值的的右右尾尾概概率率,也也可可以以利利用用“插入函数插入函数”命令来实现命令来实现4.4.计算自由度为计算自由度为8 8,统计量的取值大于,统计量的取值大于1010的概率的概率第60页,本讲稿共116页4-61c c2分布分布(用用Excel计算计算c c2分布的临界值分布的临界值)1.1.利利用用ExcelExcel提提供供的的CHIINVCHIINV统统计计函函数数,计计算算分分布布右右单单尾的概率值为尾的概率值为 的临界值的临界值2.2.语法为语法为CHIINV(CHIINV(,df),df),其中,其中dfdf为自由度为自由度3.3.给给定定自自由由度度和和分分布布右右尾尾概概率率为为 的的临临界界值值也也可可以以利利用用“插入函数插入函数”命令来实现命令来实现4.4.计算自由度为计算自由度为1010,右尾概率为,右尾概率为0.10.1的临界值的临界值第61页,本讲稿共116页4-62c c2分布分布(用用Excel生成生成c c2分布的临界值表分布的临界值表)第一步:第一步:将将c c c c2 2分布自由度分布自由度dfdf的值输入到工作表的的值输入到工作表的 A A列,将右尾概率的取值输入到第列,将右尾概率的取值输入到第1行行第二步第二步第二步第二步:在B2B2单元格输入公式单元格输入公式 “=CHIINV(B$1,$A2)”然后将其向下、向右复制即可得到分布 的临界值表的临界值表 第62页,本讲稿共116页4-63第三节第三节 总体参数估计总体参数估计n本节主要内容:本节主要内容:一、总体参数估计概述一、总体参数估计概述二、总体参数的点估计二、总体参数的点估计三、参数区间估计三、参数区间估计四、样本容量的确定四、样本容量的确定第63页,本讲稿共116页4-64一、总体参数估计概述一、总体参数估计概述n设待估计的总体参数是设待估计的总体参数是,用以估计该参数的统计量是,用以估计该参数的统计量是 ,抽样,抽样估计的估计的极限误差极限误差是是,即:,即:n极限误差是根据研究对象的变异程度和分析任务的性质来确定极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。的在一定概率下的允许误差范围。n参数估计的两个要求:参数估计的两个要求:n精度:估计误差的最大范围,通过极限误差来反映。显然,精度:估计误差的最大范围,通过极限误差来反映。显然,越越小,估计的精度要求越高,小,估计的精度要求越高,越大,估计的精度要求越低。极限误越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。差的确定要以实际需要为基本标准。n可靠性:估计正确性的一个概率保证,通常称为估计的置信度。可靠性:估计正确性的一个概率保证,通常称为估计的置信度。第64页,本讲稿共116页4-65二、总体参数的点估计二、总体参数的点估计n点估计的含义:直接以样本统计量作为相应点估计的含义:直接以样本统计量作为相应总体参数的估计量。总体参数的估计量。第65页,本讲稿共116页4-66优良估计量标准优良估计量标准n优良估计标准:优良估计标准:n无偏性:要求样本统计量的平均数等于被估计的总体参数本身。无偏性:要求样本统计量的平均数等于被估计的总体参数本身。n一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。n有效性:有效性:总体方差的无偏估计量为样本方差点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围 区间估计。第66页,本讲稿共116页4-67三、参数区间估计三、参数区间估计n参数区间估计的含义:估计总体参数的区间范围,并给出区间参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。估计成立的概率值。n其中:其中:1-(01)称为置信度;称为置信度;是区间估计的显著性水平,其取是区间估计的显著性水平,其取值大小由实际问题确定,经常取值大小由实际问题确定,经常取1%、5%和和10%。注意对

    注意事项

    本文(第四章抽样调查与参数估计优秀课件.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开