统计学原理第六章 抽样推断及参数估计.ppt
《统计学原理第六章 抽样推断及参数估计.ppt》由会员分享,可在线阅读,更多相关《统计学原理第六章 抽样推断及参数估计.ppt(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 抽抽样推断及参数估计样推断及参数估计 内容内容提要提要第一节第一节 抽样调查的一般抽样调查的一般问题问题第二节第二节 抽样抽样误差误差第三节第三节 总体指标的总体指标的推断推断第四节第四节 必要抽样数目的必要抽样数目的确定确定第五节第五节 统计量及抽样分布统计量及抽样分布内容提要内容提要 本章主要阐述了抽样调查的概念、本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响抽样特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样估织方式的抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽
2、样计推断;点估计和区间估计;必要抽样数目的确定。数目的确定。抽样调查的一般问题抽样调查的一般问题第一节第一节返回2一、抽样调查的概念、特点与作用一、抽样调查的概念、特点与作用 (一一)抽样调查的概念与特点抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的并根据这部分单位的资料推断总体数量特征的一种方法。一种方法。抽样调查具有下列三个主要特点:抽样调查具有下列三个主要特点:(1)(1)按随机原则抽取调查单位。按随机原则抽取调查单位
3、。(2)(2)由部分推断全体。由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。(二二)抽样调查的作用抽样调查的作用 (1)(1)用于不可能进行全面调查的无限总体。用于不可能进行全面调查的无限总体。(2)(2)用于不可能进行全面调查而又需要了解全用于不可能进行全面调查而又需要了解全面情况的现象。面情况的现象。(3)(3)用于不必要进行全面调查的现象。用于不必要进行全面调查的现象。(4)(4)用于对全面调查的资料进行评价与修正。用于对全面调查的资料进行评价与修正。(5)(5)用于工业生产过程的质量控制。用于工业生产过程的质量控制。二、抽样调查中的几个基本
4、概念二、抽样调查中的几个基本概念 (一一)全及总体和抽样总体全及总体和抽样总体 1.1.全及总体。全及总体简称总体或母体,全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。它是指所要调查研究对象的全体。2.2.抽样总体。抽样总体简称样本或子样,抽样总体。抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那部分它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。单位所构成的集合体。(二二)总体指标和样本指标总体指标和样本指标 1.1.总体指标。总体指标。总体指标也称为母体参数或全及指标,它总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计是
5、根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。及指标也是唯一确定的。2.2.样本指标。样本指标。样本指标也称样本统计量或抽样指标,它样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指
6、标的数值也就不同,所以也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。抽样指标的数值不是唯一确定的。三、抽样调查的组织方式三、抽样调查的组织方式 (一一)简单随机抽样简单随机抽样 简简单单随随机机抽抽样样也也叫叫纯纯随随机机抽抽样样,它它对对总总体体单单位位不不作作任任何何分分类类排排队队,而而是是直直接接从从总总体体中中随随机机抽抽取取一一部部分分单单位位来来组组成成样样本本的的抽抽样样组组织方式。织方式。(1)(1)抽签法。抽签法。(2)(2)随机数字法。随机数字法。(二二)类型抽样类型抽样 类类型型抽抽样样又又称称分分类类抽抽样样或或分分层层抽抽样样,它它是是先先将
7、将总总体体按按某某个个主主要要标标志志进进行行分分组组(或或分分类类),再再按按随随机机原原则则从从各各组组中中抽抽取取样样本本单单位位的的一一种抽样方式。种抽样方式。(1)(1)等数分配类型抽样法。等数分配类型抽样法。(2)(2)等比例类型抽样法。等比例类型抽样法。公式公式6 611(3)(3)不等比例类型抽样法。不等比例类型抽样法。公式公式6 622(三三)等距抽样等距抽样 等等距距抽抽样样也也称称机机械械抽抽样样或或系系统统抽抽样样,它它是是将将总总体体各各单单位位按按某某一一标标志志顺顺序序排排列列,然然后后按按固固定定顺顺序序和和相相等等距距离离或或间间隔隔抽抽取取样样本本单单位位的
8、抽样组织方式。的抽样组织方式。抽样距离计算公式为:抽样距离计算公式为:公式公式6 633图图6 61 1 等距抽样示意图等距抽样示意图 (四四)整群抽样整群抽样 整整群群抽抽样样也也称称集集团团抽抽样样、区区域域抽抽样样或或分分群群随随机机抽抽样样,它它是是将将总总体体各各单单位位按按时时间间或或空空间间形形式式划划分分成成许许多多群群,然然后后按按纯纯随随机机抽抽样样或或机机械械抽抽样样方方式式从从中中抽抽取取部部分分群群,对对中中选选群群的的所有单位进行全面调查的抽样组织方式。所有单位进行全面调查的抽样组织方式。公式公式6 644公式公式6 655整群抽样的优点:易于组织,节省调查费用缺点
9、:调查的总体单位过于集中且在少数样本群中。因此,在条件相同的情况下,整群抽样的代表性低,通常需要扩大样本群的数目来弥补这个缺点。阶段抽样阶段抽样也就是多级抽样,在抽样时先抽总体中某种更大范围的单位,逐次类推,最后从更小范围总体中抽选样本的基本单位,分阶段来完成抽样的组织工作。农产量抽样调查,第一阶段是从省抽县,第二阶段从中选县抽乡,第三阶段从中选乡抽村,再从村抽地块,最后再从地块抽具体的样本点,以样本点的实际资料来推算平均亩产和总产量。抽样误差抽样误差第二节第二节一、抽样误差调查误差是调查所获得的统计数据域调查总体未知真实数据之间的差别,包括登记性误差和代表性误差。登记性误差是在调查过程中由于
10、主观客观原因引起的登记差错造成的误差。代表性误差是用样本指标数值去推算总体指标数值时,由于样本各单位的结构情况不足以代表总体特征所产生的误差。一、抽样误差的概念一、抽样误差的概念 调调查查误误差差又又可可分分为为:一一是是:没没有有遵遵循循随随机机原原则则,二二是是:即即使使遵遵守守了了随随机机原原则则,也也会会由由于于被被抽抽取取的的样样本本各各种种各各样样,导导致致样样本本内内部部各各单单位位的的分分布布比比例例结结构构与与总总体体实实际际分分布布状状况况有有偶偶然然性性的的差差异异,从从而而使使不不同同的的随随机机样样本本得得出出不不同同的的估估计计量量,造造成成样样本本指指标标数数值值
11、与与总总体体指指标标数数值值之之间间产产生生差差距距,如如抽抽样样平平均均数数与与总总体体平平均均数数的的离离差差,抽抽样样成成数数与与总总体体成成数数的离差等。这类误差通常称为抽样误差或随机误差。的离差等。这类误差通常称为抽样误差或随机误差。二、影响抽样误差的主要因素二、影响抽样误差的主要因素 (一一)样本单位数样本单位数(样本容量样本容量n)n)的多少的多少 (二二)总总体体被被研研究究标标志志变变异异程程度度(总总体体方方差差)的大小的大小 (三三)抽样组织方式抽样组织方式 (四四)抽样方法抽样方法三、抽样平均误差三、抽样平均误差 (一一)抽样平均误差的概念抽样平均误差的概念 抽抽样样平
12、平均均误误差差是是指指以以全全部部可可能能样样本本指指标标为为变变量量,以以总总体体指指标标为为平平均均数数计计算算得得到到的的标标准准差差,以以符符号号 表表示示,通通常常以以 代代表表平平均均数数的的抽抽样样平平均均误误差差,以以 代代表表成成数数的的抽抽样样平平均均误误差差,以以K K代代表表可能组成的样本总数。可能组成的样本总数。(二二)计算抽样平均误差的理论公式计算抽样平均误差的理论公式 根据抽样平均误差的概念可得其一般计算公式:根据抽样平均误差的概念可得其一般计算公式:公式公式8686公式公式8787 (三三)抽样平均误差的计算方法抽样平均误差的计算方法 1.1.平均数的抽样平均误
13、差平均数的抽样平均误差 (1)(1)重复抽样条件下:重复抽样条件下:公式公式6 688 (2)(2)不重复抽样条件下:不重复抽样条件下:公式公式6 699 当当N N很大时,很大时,公式公式6 61010例例6-6-为为叙叙述述简简便便起起见见,假假设设有有10,20,3010,20,30和和4040四四个个数数字字组组成成一一个个总总体体,从从中中随随机机抽抽取取两两个个数数字字作作为样本,求抽样平均误差。为样本,求抽样平均误差。2.2.成数的抽样平均误差成数的抽样平均误差 (1)(1)重复抽样条件下:重复抽样条件下:公式公式6 61111 (2)(2)不重复抽样条件下:不重复抽样条件下:公
14、式公式6 61212 当当N N很大时,很大时,公式公式6 61313 例例6-26-2 某仪表厂生产某种型号的精密仪表,按正常生产某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为经验,产品合格率为85%85%。今按简单随机抽样方式从。今按简单随机抽样方式从800800只仪表只仪表中抽取中抽取10%10%进行检验,求合格品比率的抽样平均误差。进行检验,求合格品比率的抽样平均误差。在重复条件下,采用公式在重复条件下,采用公式6 61111:在不重复条件下,采用公式在不重复条件下,采用公式6 61313:例例6-36-3某大学有某大学有45004500名学生,采用不重复简单名学生,采用
15、不重复简单随机抽样方式从中抽取随机抽样方式从中抽取10%10%的学生,调查其每月生的学生,调查其每月生活费用支出情况。抽样结果显示,学生平均每人每活费用支出情况。抽样结果显示,学生平均每人每月生活费支出月生活费支出350350元,标准差元,标准差8080元,生活费用支出元,生活费用支出在在500500元以上的学生占全部学生的元以上的学生占全部学生的20%20%。试求抽样平。试求抽样平均误差。均误差。(四四)其他抽样组织方式抽样平均误差的计算其他抽样组织方式抽样平均误差的计算方法方法 1.1.类型比例抽样平均误差的计算。类型比例抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均
16、误差 重复抽样条件下:重复抽样条件下:公式公式6 61414 不重复抽样条件下:不重复抽样条件下:公式公式6 61515 (2)(2)成数的抽样平均误差成数的抽样平均误差 重复抽样条件下:重复抽样条件下:公式公式6 61616 不重复抽样条件下:不重复抽样条件下:公式公式6 61717 其中:其中:公式公式6 61818 公式公式6 61919 例例6-46-4 某某县县对对本本县县的的某某种种农农作作物物的的产产量量作作了了一一次次类类型型比比例例抽抽样样调调查查。调调查查资资料料整整理的结果见理的结果见表表6 6-4-4,试求抽样平均误差。,试求抽样平均误差。表6-4返回33 2.2.等距
17、抽样平均误差的计算。等距抽样平均误差的计算。3.3.整群抽样平均误差的计算。整群抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差 公式公式6 62020 (2)(2)成数的抽样平均误差成数的抽样平均误差公式公式6 62121 其中:其中:公式公式6 62222 公式公式6 62323例例6-5 某某商商店店购购进进300箱箱(50只只/箱箱)苹苹果果,入入库库前前随随机机抽抽取取1%检检查查其其质质量量。检检验验结结果果的整理资料见表的整理资料见表6-5,试求抽样平均误差,试求抽样平均误差。例例6 655 首首先先,分分别别计计算算样样本本平平均均数数和和样样本本成数:
18、成数:然然后后,分分别别求求出出样样本本平平均均数数群群间间方方差差和和成成数数群群间方差:间方差:最最后后,根根据据公公式式6 62020和和公公式式6 62121求求出出xx和和pp为:为:总体指标的推断总体指标的推断第三节第三节一、统计比较的概念和作用一、统计比较的概念和作用 总总体体指指标标的的推推断断是是指指对对总总体体平平均均数数 总总体体成成数数P P推推断断估估计计的的问问题题。抽抽样样调调查查的的直直接接目目的的,就就是是为为了了推推断断 ,P P,然然后后,再再结结合合总总体体单单位位数数N N去去推推算算总总体体的的有有关关标标志志总总量量。总体指标的推断有点估计和区估计
19、两种方法。总体指标的推断有点估计和区估计两种方法。一、点估计一、点估计 点点估估计计也也称称定定值值估估计计,它它是是以以抽抽样样得得到到的的样样本本指指标标作作为为总总体体指指标标的的估估计计量量,并并以以样样本本指指标标的的实实际际值值 、p p 直直接接作作为为总总体体未未知知参参数数 、P P的估计值的一种推断方法。的估计值的一种推断方法。比如:某电子元件厂,某天共生产电子元件20000件,耐用时间和合格率没进行全面检测,而是随机抽查5%检测,经计算,样本的平均耐用时间 小时,合格率p=98.56%。因此,推算这天生产的全部电子元件平均耐用时间 小时,合格率p=98.56%。估计量评判
20、标准:估计量评判标准:1.1.一致性。一致性。设设 为未知参数为未知参数的估计量,的估计量,当当nn时,要求时,要求 按概率收敛于按概率收敛于,即,即公式公式6 6224 4一致性(consistency)n一致性:一致性:随着样本量的增大,估计量的n 值越来越接近被估计的总体参数AB较小的样本量较小的样本量较小的样本量较小的样本量较大的样本量较大的样本量较大的样本量较大的样本量P P()2.2.无偏性。无偏性。若要求估计量若要求估计量 的数学期的数学期望等于未知参数的真值望等于未知参数的真值,即,即 公式公式6 6225 5P P()B BA A无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏 3.
21、3.有效性。有效性。无偏性只考虑估计量的平均结果是否无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。待估参数真值之间的偏差尽可能地小。设设 ,为为的两个无偏估计量,若的两个无偏估计量,若 的方差小的方差小于于 的方差,即的方差,即公式公式6 62828有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()二、区间估计二、区间估计 区间
22、估计就是以一定的概率保证估计包含总体参区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。总体指标的可能范围。它包括两方面内容:一、这一它包括两方面内容:一、这一可能范围的大小,二、总体指标落在这个可能范围内可能范围的大小,二、总体指标落在这个可能范围内的概率。的概率。考虑表考虑表6-6样本平均数的概率分布样本平均数的概率分布由表由表6-6知知:将表将表6-6所示的变量数列绘成图形,所示的变量数列绘成图形,即可得到一个钟形的平滑曲线,这条即可得到一个钟形的平滑曲线,这条曲线叫正态分布曲线。如曲
23、线叫正态分布曲线。如图图6-2图图82 82 正态分布曲线图正态分布曲线图 根据数理统计证明,总体单位的标志值如果根据数理统计证明,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布是正态分布,其全部可能样本也一定是正态分布的;如果总体单位的标志值不是正态分布的,只的;如果总体单位的标志值不是正态分布的,只要是大样本要是大样本(即即n30)n30),全部可能样本指标也会接,全部可能样本指标也会接近正态分布。从正态分布图中,可以总结两个特近正态分布。从正态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学原理第六章 抽样推断及参数估计 统计学 原理 第六 抽样 推断 参数估计
限制150内