欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学原理第六章 抽样推断及参数估计.ppt

    • 资源ID:70027309       资源大小:1.44MB        全文页数:130页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学原理第六章 抽样推断及参数估计.ppt

    第六章第六章 抽抽样推断及参数估计样推断及参数估计 内容内容提要提要第一节第一节 抽样调查的一般抽样调查的一般问题问题第二节第二节 抽样抽样误差误差第三节第三节 总体指标的总体指标的推断推断第四节第四节 必要抽样数目的必要抽样数目的确定确定第五节第五节 统计量及抽样分布统计量及抽样分布内容提要内容提要 本章主要阐述了抽样调查的概念、本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响抽样特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样估织方式的抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样计推断;点估计和区间估计;必要抽样数目的确定。数目的确定。抽样调查的一般问题抽样调查的一般问题第一节第一节返回2一、抽样调查的概念、特点与作用一、抽样调查的概念、特点与作用 (一一)抽样调查的概念与特点抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的并根据这部分单位的资料推断总体数量特征的一种方法。一种方法。抽样调查具有下列三个主要特点:抽样调查具有下列三个主要特点:(1)(1)按随机原则抽取调查单位。按随机原则抽取调查单位。(2)(2)由部分推断全体。由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。(二二)抽样调查的作用抽样调查的作用 (1)(1)用于不可能进行全面调查的无限总体。用于不可能进行全面调查的无限总体。(2)(2)用于不可能进行全面调查而又需要了解全用于不可能进行全面调查而又需要了解全面情况的现象。面情况的现象。(3)(3)用于不必要进行全面调查的现象。用于不必要进行全面调查的现象。(4)(4)用于对全面调查的资料进行评价与修正。用于对全面调查的资料进行评价与修正。(5)(5)用于工业生产过程的质量控制。用于工业生产过程的质量控制。二、抽样调查中的几个基本概念二、抽样调查中的几个基本概念 (一一)全及总体和抽样总体全及总体和抽样总体 1.1.全及总体。全及总体简称总体或母体,全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。它是指所要调查研究对象的全体。2.2.抽样总体。抽样总体简称样本或子样,抽样总体。抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那部分它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。单位所构成的集合体。(二二)总体指标和样本指标总体指标和样本指标 1.1.总体指标。总体指标。总体指标也称为母体参数或全及指标,它总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。及指标也是唯一确定的。2.2.样本指标。样本指标。样本指标也称样本统计量或抽样指标,它样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。抽样指标的数值不是唯一确定的。三、抽样调查的组织方式三、抽样调查的组织方式 (一一)简单随机抽样简单随机抽样 简简单单随随机机抽抽样样也也叫叫纯纯随随机机抽抽样样,它它对对总总体体单单位位不不作作任任何何分分类类排排队队,而而是是直直接接从从总总体体中中随随机机抽抽取取一一部部分分单单位位来来组组成成样样本本的的抽抽样样组组织方式。织方式。(1)(1)抽签法。抽签法。(2)(2)随机数字法。随机数字法。(二二)类型抽样类型抽样 类类型型抽抽样样又又称称分分类类抽抽样样或或分分层层抽抽样样,它它是是先先将将总总体体按按某某个个主主要要标标志志进进行行分分组组(或或分分类类),再再按按随随机机原原则则从从各各组组中中抽抽取取样样本本单单位位的的一一种抽样方式。种抽样方式。(1)(1)等数分配类型抽样法。等数分配类型抽样法。(2)(2)等比例类型抽样法。等比例类型抽样法。公式公式6 611(3)(3)不等比例类型抽样法。不等比例类型抽样法。公式公式6 622(三三)等距抽样等距抽样 等等距距抽抽样样也也称称机机械械抽抽样样或或系系统统抽抽样样,它它是是将将总总体体各各单单位位按按某某一一标标志志顺顺序序排排列列,然然后后按按固固定定顺顺序序和和相相等等距距离离或或间间隔隔抽抽取取样样本本单单位位的抽样组织方式。的抽样组织方式。抽样距离计算公式为:抽样距离计算公式为:公式公式6 633图图6 61 1 等距抽样示意图等距抽样示意图 (四四)整群抽样整群抽样 整整群群抽抽样样也也称称集集团团抽抽样样、区区域域抽抽样样或或分分群群随随机机抽抽样样,它它是是将将总总体体各各单单位位按按时时间间或或空空间间形形式式划划分分成成许许多多群群,然然后后按按纯纯随随机机抽抽样样或或机机械械抽抽样样方方式式从从中中抽抽取取部部分分群群,对对中中选选群群的的所有单位进行全面调查的抽样组织方式。所有单位进行全面调查的抽样组织方式。公式公式6 644公式公式6 655整群抽样的优点:易于组织,节省调查费用缺点:调查的总体单位过于集中且在少数样本群中。因此,在条件相同的情况下,整群抽样的代表性低,通常需要扩大样本群的数目来弥补这个缺点。阶段抽样阶段抽样也就是多级抽样,在抽样时先抽总体中某种更大范围的单位,逐次类推,最后从更小范围总体中抽选样本的基本单位,分阶段来完成抽样的组织工作。农产量抽样调查,第一阶段是从省抽县,第二阶段从中选县抽乡,第三阶段从中选乡抽村,再从村抽地块,最后再从地块抽具体的样本点,以样本点的实际资料来推算平均亩产和总产量。抽样误差抽样误差第二节第二节一、抽样误差调查误差是调查所获得的统计数据域调查总体未知真实数据之间的差别,包括登记性误差和代表性误差。登记性误差是在调查过程中由于主观客观原因引起的登记差错造成的误差。代表性误差是用样本指标数值去推算总体指标数值时,由于样本各单位的结构情况不足以代表总体特征所产生的误差。一、抽样误差的概念一、抽样误差的概念 调调查查误误差差又又可可分分为为:一一是是:没没有有遵遵循循随随机机原原则则,二二是是:即即使使遵遵守守了了随随机机原原则则,也也会会由由于于被被抽抽取取的的样样本本各各种种各各样样,导导致致样样本本内内部部各各单单位位的的分分布布比比例例结结构构与与总总体体实实际际分分布布状状况况有有偶偶然然性性的的差差异异,从从而而使使不不同同的的随随机机样样本本得得出出不不同同的的估估计计量量,造造成成样样本本指指标标数数值值与与总总体体指指标标数数值值之之间间产产生生差差距距,如如抽抽样样平平均均数数与与总总体体平平均均数数的的离离差差,抽抽样样成成数数与与总总体体成成数数的离差等。这类误差通常称为抽样误差或随机误差。的离差等。这类误差通常称为抽样误差或随机误差。二、影响抽样误差的主要因素二、影响抽样误差的主要因素 (一一)样本单位数样本单位数(样本容量样本容量n)n)的多少的多少 (二二)总总体体被被研研究究标标志志变变异异程程度度(总总体体方方差差)的大小的大小 (三三)抽样组织方式抽样组织方式 (四四)抽样方法抽样方法三、抽样平均误差三、抽样平均误差 (一一)抽样平均误差的概念抽样平均误差的概念 抽抽样样平平均均误误差差是是指指以以全全部部可可能能样样本本指指标标为为变变量量,以以总总体体指指标标为为平平均均数数计计算算得得到到的的标标准准差差,以以符符号号 表表示示,通通常常以以 代代表表平平均均数数的的抽抽样样平平均均误误差差,以以 代代表表成成数数的的抽抽样样平平均均误误差差,以以K K代代表表可能组成的样本总数。可能组成的样本总数。(二二)计算抽样平均误差的理论公式计算抽样平均误差的理论公式 根据抽样平均误差的概念可得其一般计算公式:根据抽样平均误差的概念可得其一般计算公式:公式公式8686公式公式8787 (三三)抽样平均误差的计算方法抽样平均误差的计算方法 1.1.平均数的抽样平均误差平均数的抽样平均误差 (1)(1)重复抽样条件下:重复抽样条件下:公式公式6 688 (2)(2)不重复抽样条件下:不重复抽样条件下:公式公式6 699 当当N N很大时,很大时,公式公式6 61010例例6-6-为为叙叙述述简简便便起起见见,假假设设有有10,20,3010,20,30和和4040四四个个数数字字组组成成一一个个总总体体,从从中中随随机机抽抽取取两两个个数数字字作作为样本,求抽样平均误差。为样本,求抽样平均误差。2.2.成数的抽样平均误差成数的抽样平均误差 (1)(1)重复抽样条件下:重复抽样条件下:公式公式6 61111 (2)(2)不重复抽样条件下:不重复抽样条件下:公式公式6 61212 当当N N很大时,很大时,公式公式6 61313 例例6-26-2 某仪表厂生产某种型号的精密仪表,按正常生产某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为经验,产品合格率为85%85%。今按简单随机抽样方式从。今按简单随机抽样方式从800800只仪表只仪表中抽取中抽取10%10%进行检验,求合格品比率的抽样平均误差。进行检验,求合格品比率的抽样平均误差。在重复条件下,采用公式在重复条件下,采用公式6 61111:在不重复条件下,采用公式在不重复条件下,采用公式6 61313:例例6-36-3某大学有某大学有45004500名学生,采用不重复简单名学生,采用不重复简单随机抽样方式从中抽取随机抽样方式从中抽取10%10%的学生,调查其每月生的学生,调查其每月生活费用支出情况。抽样结果显示,学生平均每人每活费用支出情况。抽样结果显示,学生平均每人每月生活费支出月生活费支出350350元,标准差元,标准差8080元,生活费用支出元,生活费用支出在在500500元以上的学生占全部学生的元以上的学生占全部学生的20%20%。试求抽样平。试求抽样平均误差。均误差。(四四)其他抽样组织方式抽样平均误差的计算其他抽样组织方式抽样平均误差的计算方法方法 1.1.类型比例抽样平均误差的计算。类型比例抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差 重复抽样条件下:重复抽样条件下:公式公式6 61414 不重复抽样条件下:不重复抽样条件下:公式公式6 61515 (2)(2)成数的抽样平均误差成数的抽样平均误差 重复抽样条件下:重复抽样条件下:公式公式6 61616 不重复抽样条件下:不重复抽样条件下:公式公式6 61717 其中:其中:公式公式6 61818 公式公式6 61919 例例6-46-4 某某县县对对本本县县的的某某种种农农作作物物的的产产量量作作了了一一次次类类型型比比例例抽抽样样调调查查。调调查查资资料料整整理的结果见理的结果见表表6 6-4-4,试求抽样平均误差。,试求抽样平均误差。表6-4返回33 2.2.等距抽样平均误差的计算。等距抽样平均误差的计算。3.3.整群抽样平均误差的计算。整群抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差 公式公式6 62020 (2)(2)成数的抽样平均误差成数的抽样平均误差公式公式6 62121 其中:其中:公式公式6 62222 公式公式6 62323例例6-5 某某商商店店购购进进300箱箱(50只只/箱箱)苹苹果果,入入库库前前随随机机抽抽取取1%检检查查其其质质量量。检检验验结结果果的整理资料见表的整理资料见表6-5,试求抽样平均误差,试求抽样平均误差。例例6 655 首首先先,分分别别计计算算样样本本平平均均数数和和样样本本成数:成数:然然后后,分分别别求求出出样样本本平平均均数数群群间间方方差差和和成成数数群群间方差:间方差:最最后后,根根据据公公式式6 62020和和公公式式6 62121求求出出xx和和pp为:为:总体指标的推断总体指标的推断第三节第三节一、统计比较的概念和作用一、统计比较的概念和作用 总总体体指指标标的的推推断断是是指指对对总总体体平平均均数数 总总体体成成数数P P推推断断估估计计的的问问题题。抽抽样样调调查查的的直直接接目目的的,就就是是为为了了推推断断 ,P P,然然后后,再再结结合合总总体体单单位位数数N N去去推推算算总总体体的的有有关关标标志志总总量量。总体指标的推断有点估计和区估计两种方法。总体指标的推断有点估计和区估计两种方法。一、点估计一、点估计 点点估估计计也也称称定定值值估估计计,它它是是以以抽抽样样得得到到的的样样本本指指标标作作为为总总体体指指标标的的估估计计量量,并并以以样样本本指指标标的的实实际际值值 、p p 直直接接作作为为总总体体未未知知参参数数 、P P的估计值的一种推断方法。的估计值的一种推断方法。比如:某电子元件厂,某天共生产电子元件20000件,耐用时间和合格率没进行全面检测,而是随机抽查5%检测,经计算,样本的平均耐用时间 小时,合格率p=98.56%。因此,推算这天生产的全部电子元件平均耐用时间 小时,合格率p=98.56%。估计量评判标准:估计量评判标准:1.1.一致性。一致性。设设 为未知参数为未知参数的估计量,的估计量,当当nn时,要求时,要求 按概率收敛于按概率收敛于,即,即公式公式6 6224 4一致性(consistency)n一致性:一致性:随着样本量的增大,估计量的n 值越来越接近被估计的总体参数AB较小的样本量较小的样本量较小的样本量较小的样本量较大的样本量较大的样本量较大的样本量较大的样本量P P()2.2.无偏性。无偏性。若要求估计量若要求估计量 的数学期的数学期望等于未知参数的真值望等于未知参数的真值,即,即 公式公式6 6225 5P P()B BA A无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏 3.3.有效性。有效性。无偏性只考虑估计量的平均结果是否无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。待估参数真值之间的偏差尽可能地小。设设 ,为为的两个无偏估计量,若的两个无偏估计量,若 的方差小的方差小于于 的方差,即的方差,即公式公式6 62828有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()二、区间估计二、区间估计 区间估计就是以一定的概率保证估计包含总体参区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。总体指标的可能范围。它包括两方面内容:一、这一它包括两方面内容:一、这一可能范围的大小,二、总体指标落在这个可能范围内可能范围的大小,二、总体指标落在这个可能范围内的概率。的概率。考虑表考虑表6-6样本平均数的概率分布样本平均数的概率分布由表由表6-6知知:将表将表6-6所示的变量数列绘成图形,所示的变量数列绘成图形,即可得到一个钟形的平滑曲线,这条即可得到一个钟形的平滑曲线,这条曲线叫正态分布曲线。如曲线叫正态分布曲线。如图图6-2图图82 82 正态分布曲线图正态分布曲线图 根据数理统计证明,总体单位的标志值如果根据数理统计证明,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布是正态分布,其全部可能样本也一定是正态分布的;如果总体单位的标志值不是正态分布的,只的;如果总体单位的标志值不是正态分布的,只要是大样本要是大样本(即即n30)n30),全部可能样本指标也会接,全部可能样本指标也会接近正态分布。从正态分布图中,可以总结两个特近正态分布。从正态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样本指标接近于总体指标布完全是对称的;二是样本指标接近于总体指标的概率越大的概率越大(小小),出现的可能性也越大,出现的可能性也越大(小小)。中心极限定理(central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的过程的过程的过程的过程样本指标置信度样本指标置信度n根据数学证明,n在 到 的区间中,这一部分曲线下的面积,占曲线下全部面积的68.27%;n在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的95.45%;n在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的99.73%。n如图6-3 图图83 83 样本指标置信度图样本指标置信度图 误差范围误差范围 与概率度与概率度(t)(t)和抽样平均误差和抽样平均误差 三者之间的关系为:三者之间的关系为:公式公式6 6227 7 由此得到平均数和成数的误差范围公式:由此得到平均数和成数的误差范围公式:公式公式6 62828公式公式6 62929 进而得到总体平均指标和总体成数指标的区进而得到总体平均指标和总体成数指标的区间估计公式为:间估计公式为:公式公式6 6330 0公式公式6 6331 1(95%的置信区间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值总体均值的区间估计(大样本)n1.假定条件n总体服从正态分布,且方差()已知n如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为例例6-6n某自行车厂从生产的一批某自行车厂从生产的一批10000个自行车轮胎个自行车轮胎中随机抽取中随机抽取1%进行质量检验。调查结果显示,进行质量检验。调查结果显示,轮胎的平均寿命为轮胎的平均寿命为5000英里。试以英里。试以95%的把的把握对该批自行车的平均寿命作出估计。(注:根握对该批自行车的平均寿命作出估计。(注:根据长期生产这种类型的轮胎数据可知,总体标准据长期生产这种类型的轮胎数据可知,总体标准差为差为400公里)公里)例例6 6 有了区间估计的结果,就可以对这批轮胎的使有了区间估计的结果,就可以对这批轮胎的使用寿命得出结论,因为区间估计最低公里数为用寿命得出结论,因为区间估计最低公里数为4921.994921.99公里,可将公里,可将49004900公里规定为最低可行驶公公里规定为最低可行驶公里数。这样做虽不能保证百分之百的可靠,但可里数。这样做虽不能保证百分之百的可靠,但可以有以有95%95%的把握,还是令人可信的。的把握,还是令人可信的。例例6 67 7利用例利用例6 6-3-3的资料,在的资料,在95.45%95.45%的概率保证下估计全体学生月平均的概率保证下估计全体学生月平均生活费用的可能范围,以及月生活费用在生活费用的可能范围,以及月生活费用在500500元以上学生所占比重的可能范元以上学生所占比重的可能范围。围。例例6 6-8 -8 从某县农民家庭中随机抽取从某县农民家庭中随机抽取100100户调户调查其年收入情况。农民家庭按年人均纯收入查其年收入情况。农民家庭按年人均纯收入额分组的资料如下表额分组的资料如下表6 6-7-7所示所示根据表根据表6-7的资料计算得表的资料计算得表6-8例例6 688例例6 688第四节第四节必要抽样数目的确定必要抽样数目的确定返回2 一、影响抽样数目的主要因素一、影响抽样数目的主要因素 (一一)总体被研究标志的变异程度总体被研究标志的变异程度 (二二)对推断精确度的要求对推断精确度的要求 (三三)对推断可靠性的要求对推断可靠性的要求 (四四)抽样调查的组织方式和方法抽样调查的组织方式和方法 (五五)人力、物力和财力的允许条件人力、物力和财力的允许条件二、确定抽样数目的方法二、确定抽样数目的方法 (一一)在重复抽样条件下在重复抽样条件下 推断总体平均数所需要的抽样数目:推断总体平均数所需要的抽样数目:公式公式6 6332 2 推断总体成数所需要的抽样数目:推断总体成数所需要的抽样数目:公式公式6 6333 3 (二二)在不重复抽样条件下在不重复抽样条件下 推断总体平均数所需要的抽样数目:推断总体平均数所需要的抽样数目:公式公式6 6334 4 推断总体成数所需要的抽样数目:推断总体成数所需要的抽样数目:公式公式6 6335 5例例6-9n假定某乡有农户18000户,在某次调查中采用重复的纯随机方式进行抽样,要求人均收入的极限误差控制在150元内,把握程度为95.45%,该抽多少多少农户?如果极限抽样误差要求控制在75元内,应抽多少户?(注:全乡人均收入标准差为1500元)例例6 6 (1)(1)采用重复抽样公式计算采用重复抽样公式计算:可见,在重复抽样中,可见,在重复抽样中,极限误差缩小一极限误差缩小一半半(即为原来的即为原来的1/2)时,必须把样本容量增时,必须把样本容量增到到4倍。倍。(2)(2)采用不重复抽样公式计算采用不重复抽样公式计算:当当极极限限抽抽样样误误差差缩缩小小为为一一半半时时,根根据据【公公式式6 6-34-34】得:得:如如果果是是采采用用其其他他抽抽样样组组织织方方式式,则则公公式式略略有有不同。例如,采用重复的分层抽样,则所需的不同。例如,采用重复的分层抽样,则所需的抽样数目计算公式为:抽样数目计算公式为:公式公式6 6336 6公式公式6 6337 7第 5节 统计量及其抽样分布 6.5.1 统计量统计量6.5.2 关于分布的几个概念关于分布的几个概念 6.5.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.5.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5.5 样本比例的抽样分布样本比例的抽样分布6.5.6 两个样本平均值之差的分布两个样本平均值之差的分布6.5.7 关于样本方差的分布关于样本方差的分布 统计量(statistic)1.设X1,X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量n样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数3.统计量是统计推断的基础n例:设 是从某总体X中抽取的一个样本,则:n 是统计量n 不是统计量常用统计量次序统计量1.一组样本观测值X1,X2,Xn由小到大的排序 X(1)X(2)X(i)X(n)后,称X(1),X(2),X(n)为次序统计量 称为样本极差2.中位数、分位数、四分位数等都是次序统计量 2分布分布(2 distribution)1.由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来2.设随机变量 相互独立,且 服从标准正态分布 则它们的平方和 服从自 由 度为n的2分布。3.设 ,则 ,若令 则 Y 服从自由度为1的2分布,即 1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:E(2)=n,方差为:D(2)=2n(n为自由度)4.可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 2分布(性质和特点)卡方(c2)分布 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体 t 分布1.高塞特(W.S.Gosset)于1908年在一篇以“Student”(学生)为笔名的论文中首次提出2.t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散3.一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 t 分布图示x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z 由上图可以看出:t分布的密度函数与标准正态分布N(0,1)的密度函数曲线非常相似单峰偶函数。t(n)的密度函数在两侧的尾部都要比N(0,1)的两侧尾部粗一些,t(n)的方差比N(0,1)的方差大一点。当n30时,t分布与标准正态分布就非常接近 t分布理论适用于小样本分布1.由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名2.设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为 F分布(F distribution)F分布(图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)1.样本统计量的概率分布,是一种理论分布n在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.随机变量是 样本统计量样本统计量n样本均值,样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布(sampling distribution)1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(一个例子)【例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4=4。4 4 个个个个体体分分别别为为X X1 1=1=1、X X2 2=2=2、X X3 3=3=3、X X4 4=4=4。总体的均值、方差及分布如下总体的均值、方差及分布如下均值和方差均值和方差均值和方差均值和方差总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3样本均值的抽样分布(一个例子)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件件下下,共共有有4 42 2=16=16个个样样本本。所所有有样样本本的的结结果果如下表如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)样本均值的抽样分布(一个例子)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(x x)1.51.53.03.04.04.03.53.52.02.02.52.5x x所有样本均值的均值和方差式中:式中:MM为样本数目为样本数目比较及结论:比较及结论:1.1.样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n样本均值的分布与总体分布的比较抽样分布抽样分布抽样分布抽样分布 =2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x样本均值的抽样分布与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布,x x 的的数数学学期望为期望为,方差为方差为 2 2/n n。即即 x xN N(,2 2/n n)中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近近似似服服从从均均值为值为、方差为方差为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x中心极限定理(central limit theorem)x x 的的的的分分分分布布布布趋趋趋趋于于于于正正正正态态态态分分分分布布布布的过程的过程的过程的过程例:设从一个均值为10,标准差为0.6的总体中随机选取容量为36的样本。假定该总体不是很偏,求:(1)计算样本均值小于9.9的近似概率(2)计算样本均值超过9.9的近似概率(3)计算样本均值在总体均值附近0.1范围内的近似概率例2:某汽车电瓶商声称生产的电瓶具有均值为60个月,标准差为6个月的寿命分布。先假设质检部门决定检验该厂的说法是否准确,为此随机抽取50个该厂生产的电瓶进行寿命试验。(1)假定厂商声称正确,描述50个电瓶的平均寿命的抽样分布。(2)50个样品组成的样本的平均寿命不超过57个月的概率为多少?结论:50个电瓶平均寿命不超过57个月的概率为0.0002,根据小概率原理,这是一个不可能事件。1.总体(或样本)中具有某种属性的单位与全部单位总数之比n不同性别的人与全部人数之比n合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为比例(proportion)样本比例的抽样分布1.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似,则4.如果X是随机变量,C为常数,则CX和X有相同的分布形状。1.样本比例的数学期望2.样本比例的方差n重复抽样n不重复抽样样本比例的抽样分布(数学期望与方差)例:例2:假定某统计人员在填写的报表中有2%至少会有一处错误,如果我们检查了一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025-0.070之间的概率有多大?即该统计人员所填写的报表中至少有一处错误的报表所占的比例在0.0250.070之间的概率为0.1902样本方差的分布1.在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为(n-1)的 2分布,即两个样本方差比的分布1.两两个个总总体体都都为为正正态态分分布布,即即X X1 1 N N(1 1,1 12 2),X X2 2 N N(2 2,2 22 2)2.从两从两个总体中分别抽取容量为个总体中分别抽取容量为n n1 1和和n n2 2的独立样本的独立样本3.两两个个样样本本方方差差比比的的抽抽样样分分布布,服服从从分分子子自自由由度度为为(n n1 1-1)-1),分母自由度为分母自由度为(n n2 2-1)-1)的的F F分布,即分布,即 结结 束束123.某次语文考试成绩服从正态分布,2=81,从中抽取n=25的样本,计算得其平均分为58,试估计总体平均数的0.95的置信区间。4.某高校有3000名走读学生,该校后勤部门想估计这些学生每天来回的平均时间,以置信度为95的置信区间估计,并使估计值处在真值附近1分钟的误差范围之内,一个先前抽样的小样本给出的标准差为4.8分钟,试问应抽取多大的样本?5.为了解某生活小区住户的月书报费支出情况,随机抽取36户居民家庭进行调查,得平均每户居民家庭每月的书报费支出为46元,样本标准差为24元。试分析整个生活小区居民家庭平均每月的书报费支出在3854元之间的可能性有多大?6.对某地区居民进行经济收入调查,设已知居民的平均年收入的标准差为3000元,要求按置信水平95%,准许抽样误差为500元,至少要对多少居民进行调查。7.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:1)是男生的体重差异大还是女生的体重差异大?为什么?2)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?3)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?

    注意事项

    本文(统计学原理第六章 抽样推断及参数估计.ppt)为本站会员(qwe****56)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开