抽样与抽样估计 (2)精选课件.ppt
《抽样与抽样估计 (2)精选课件.ppt》由会员分享,可在线阅读,更多相关《抽样与抽样估计 (2)精选课件.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于抽样与抽样估计(2)第一页,本课件共有78页一、抽样调查一、抽样调查的概念和特点的概念和特点1 1、概念、概念:抽样调查抽样调查是按是按随机原则随机原则从全部研究对从全部研究对象中抽取部分单位进行观察,并根据象中抽取部分单位进行观察,并根据样本的实际数据对总体的样本的实际数据对总体的数量特征数量特征作作出具有一定出具有一定可靠程度可靠程度的估计和判断的估计和判断。只抽取部分单位进行调查只抽取部分单位进行调查。1 1 抽样调查抽样调查的一般问题的一般问题第二页,本课件共有78页2 2、特点、特点(1)抽样调查抽样调查建立在随机取样的基础上建立在随机取样的基础上。(2)(2)它是由部分推断整体
2、的一种认识方法它是由部分推断整体的一种认识方法。(3)抽样调查抽样调查的误差可以事先计算并加以的误差可以事先计算并加以控制。控制。第三页,本课件共有78页3 3、抽样调查的适用范围、抽样调查的适用范围抽抽样调查方法是市场经济国家在样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、它具有准确度高、成本低、速度快、应用面广等优点。应用面广等优点。第四页,本课件共有78页1.1.实实际工作不可能进行全面调查观察,而又需要际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;了解其全面资料的事物;2.2.虽虽可进行全面调
3、查观察,但比较困难或并不可进行全面调查观察,但比较困难或并不必要;必要;3.3.对对普查或全面调查统计资料的质量进行检查和普查或全面调查统计资料的质量进行检查和修正;修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;物总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决假设进行检验,判断这种假设的真伪,以决定取舍。定取舍。一般适用于以下范围:一般适用于以下范围:第五页,本课件共有78页三、有关抽样的基本概念三、有关抽样的基本概念
4、(一)总体和样本(一)总体和样本总体:总体:也称全及总体。指所要认识的研究对也称全及总体。指所要认识的研究对象全体。总体单位总数用象全体。总体单位总数用“N N”表示。表示。样本:样本:也称抽样总体,是抽出的单位组成的整也称抽样总体,是抽出的单位组成的整体。样本单位总数用体。样本单位总数用“n n”表示。表示。二、抽样推断的内容二、抽样推断的内容参数估计参数估计假设检验假设检验第六页,本课件共有78页(二)参数和统计量(二)参数和统计量1 1、针对总体计算的指标叫总体参数,也叫全及指、针对总体计算的指标叫总体参数,也叫全及指标。标。2 2、针针对对样样本本计计算算的的指指标标为为统统计计量量,
5、也也叫叫估估计计量量,也叫抽样指标。也叫抽样指标。参数的值是定值参数的值是定值常用的参数有:总体平均数、总体成数常用的参数有:总体平均数、总体成数P P、总体标准、总体标准差差其值随样本的不同而不同,是个随机变量。其值随样本的不同而不同,是个随机变量。抽样估计就是通过统计量的值去估计参数的值。抽样估计就是通过统计量的值去估计参数的值。常用的统计量有:样本平均数、样本成数常用的统计量有:样本平均数、样本成数p p、样本、样本标准差标准差S S第七页,本课件共有78页 若总体单位的某种标志只有两种表若总体单位的某种标志只有两种表现(称为是非标志),总体成数是指具现(称为是非标志),总体成数是指具有
6、某种特征和属性的单位在全部总体单有某种特征和属性的单位在全部总体单位中所占比重,记为位中所占比重,记为p p。以以 代表代表N N个总体单位中具有个总体单位中具有某种特征的单位数,某种特征的单位数,代表代表N N 个总体个总体单位中不具有某种特征的单位数,单位中不具有某种特征的单位数,N=NN=N1 1+N+N0 0。有。有第八页,本课件共有78页 从从总总体体中中随随机机抽抽出出容容量量为为 的的样样本本,具具有有某某种种特特征征的的单单位位数数为为 ,则则样样本本的的成成数数为为 。例例如如,某某工工厂厂生生产产某某种种电电子子元元件件,某某批批产产品品共共1000010000件件,其其中
7、中不不合合格格品品100100件件,则则不不合合格格品品所所占占的的成成数数 。若若从从中中按按随随机机的的原原则则抽抽100100件件,其其中中有有3 3件件不不合合格格品品,则则样样本本的的成成数为数为 。NEXT第九页,本课件共有78页总体参数总体参数样本统计量样本统计量样本统计量样本统计量公式公式总体平均数总体平均数样本平均数样本平均数总体成数总体成数样本成数样本成数总体方差总体方差样本方差样本方差总体标准差总体标准差样本标准差样本标准差第十页,本课件共有78页第十一页,本课件共有78页未分组数据未分组数据:分组数据:分组数据:未分组数据:未分组数据:分组数据:分组数据:总体方差公式总
8、体方差公式总体标准差公式总体标准差公式第十二页,本课件共有78页第十三页,本课件共有78页推断统计:推断统计:利用样本统计量对总体某些利用样本统计量对总体某些性质或数量特征进行推断。性质或数量特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布第十四页,本课件共有78页(三)样本容量和样本个数(三)样本容量和样本个数1 1、样本容量:、样本容量:一个样本包含的单位数。一个样本包含的单位数。用用 “n n”表示。一般要求表示。一般要求 n 30n 302 2、样本个数:、样本个数:从一个全及总体中可能抽取从一个全及总体
9、中可能抽取的样本数目。的样本数目。第十五页,本课件共有78页(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样1 1、重复抽样:也叫放回抽样。、重复抽样:也叫放回抽样。2 2、不重复抽样:也叫无放回抽样。、不重复抽样:也叫无放回抽样。一个单位可能中选多次一个单位可能中选多次每次抽单位,概率固定,都为每次抽单位,概率固定,都为1/N1/N。一个单位最多中选一次一个单位最多中选一次每次抽单位,概率不同,逐渐增加每次抽单位,概率不同,逐渐增加第十六页,本课件共有78页(五五)、概率抽样与非概率抽样、概率抽样与非概率抽样1、概率抽样:也叫随机抽样,是指按照随、概率抽样:也叫随机抽样,是指按照随机原则
10、抽取样本。概率抽样最基本的组织机原则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。抽样和整群抽样。2、非概率抽样:也叫非随机抽样,是指从、非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。从总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额调查等属于非重点调查、典型调查、配额调查等属于非随机抽样。随机抽样。第十七页,本课件共有78页(六)、抽样框(六)、抽样框 1 1、抽抽样样框框是是包包括括全全部部抽抽样样单单位位
11、的的名名单单框框架架。编编制制抽抽样样框框是是实实施施抽抽样样的的基基础础。抽抽样样框框的的好好坏坏通通常常会会直直接接影响到抽样调查的随机性和调查的效果。影响到抽样调查的随机性和调查的效果。2 2、抽样框主要有三种形式:、抽样框主要有三种形式:名单抽样框,即列出全部总体单位的名录一览名单抽样框,即列出全部总体单位的名录一览表,如职工名单、企业名单等。表,如职工名单、企业名单等。区域抽样框,即按地理位置将总体范围划分为若区域抽样框,即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如对某市居民住房干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将全市居民户划分为若干街道或
12、片区。情况进行调查,将全市居民户划分为若干街道或片区。第十八页,本课件共有78页3 3、一一个个理理想想的的抽抽样样框框应应该该与与目目标标总总体体一一致致,即即应应包包括括全全部部总总体体单单位位,既既不不重重复复,也也不不遗遗漏漏(穷穷尽尽与与互互斥斥)。若有遗漏,易造成系统性误差。若有遗漏,易造成系统性误差。在实践中,要取得与目标总体完全一致的抽样框在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能,常常只能采用与目标往往很困难,甚至不可能,常常只能采用与目标总体近似的抽样框。总体近似的抽样框。时间表抽样框,即将总体全部单位按时间顺序时间表抽样框,即将总体全部单位按时间顺序
13、排列,把总体的时间过程分为若干个小的时间单位,排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如对流水线上以此时间单位为抽样单位。如对流水线上2424小时内小时内生产的产品进行质量抽查时,以生产的产品进行质量抽查时,以5 5分钟为一个抽样分钟为一个抽样单位,可将全部产品分为单位,可将全部产品分为288288个抽样单位并按时间个抽样单位并按时间顺序排列。顺序排列。第十九页,本课件共有78页(七)、抽样误差(七)、抽样误差统计调查的误差,是指调查所得结果与总体统计调查的误差,是指调查所得结果与总体真实值之间的差异。在抽样调查中,误差的真实值之间的差异。在抽样调查中,误差的来源
14、有登记性误差和代表性误差两大类。来源有登记性误差和代表性误差两大类。第二十页,本课件共有78页(1 1)登记性误差,指在调查和汇总过程中)登记性误差,指在调查和汇总过程中由于测量、登记、计算等方面的差错或被调由于测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。它在任何查者提供虚假资料而造成的误差。它在任何调查中均存在。而且调查范围越大,调查单调查中均存在。而且调查范围越大,调查单位越多,产生登记性误差的可能性也越大。位越多,产生登记性误差的可能性也越大。(2 2)代表性误差,指样本推断总体时,)代表性误差,指样本推断总体时,由于样本结构与总体结构不一致而产生由于样本结构与总体结
15、构不一致而产生的误差。又分系统误差与随机误差两种。的误差。又分系统误差与随机误差两种。第二十一页,本课件共有78页随机误差也叫偶然误差。它是由偶随机误差也叫偶然误差。它是由偶然性因素引起的代表性误差。它不可避然性因素引起的代表性误差。它不可避免,但可计算与控制。抽样估计中的抽免,但可计算与控制。抽样估计中的抽样误差,就是指这种随机误差。样误差,就是指这种随机误差。在计算抽样误差时,常常假设不存在登记性在计算抽样误差时,常常假设不存在登记性误差和系统误差误差和系统误差系统误差是非随机因素引起的误差,它系统误差是非随机因素引起的误差,它系统性偏高或偏低,也称偏差。系统性偏高或偏低,也称偏差。第二十
16、二页,本课件共有78页2 2 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念1 1、抽样误差是指由于抽样的随机性而产生的、抽样误差是指由于抽样的随机性而产生的那一部分代表性误差(随机性误差),不包括那一部分代表性误差(随机性误差),不包括 登记性误差,也不包括可能发生的偏差。登记性误差,也不包括可能发生的偏差。主要有两主要有两种种:实际抽样误差实际抽样误差,抽样平均误差。抽样平均误差。(1 1)实际抽样误差:指某一样本指标与总体)实际抽样误差:指某一样本指标与总体参数之间的离差参数之间的离差例例8 8-2-1-2-1:从从1 1、2 2、3 3中抽中抽2 2个(重复),参数个(重
17、复),参数取总体平均数取总体平均数 (等于(等于2 2),则实际抽样误),则实际抽样误差如下:差如下:第二十三页,本课件共有78页样本样本 样本统计量样本统计量实际抽样误差实际抽样误差(-)(1 1、1 1)1 1-1-1(1(1、2 2)1.51.5-0.5-0.5(1 1、3 3)2 20 0(2 2、1 1)1.51.5-0.5-0.5(2 2、2 2)2 20 0(2 2、3 3)2.52.50.50.5(3 3、1 1)2 20 0(3 3、2 2)2.52.50.50.5(3 3、3 3)3 31 1第二十四页,本课件共有78页(2)(2)抽样平均误差:指样本指标的标准差。抽样平均
18、误差:指样本指标的标准差。抽样实际误差是无法知道的,而抽样平均误差抽样实际误差是无法知道的,而抽样平均误差可以计算。可以计算。在讨论抽样误差时,通常指抽样平均误差在讨论抽样误差时,通常指抽样平均误差要计算抽样平均误差,得从抽样分布谈起要计算抽样平均误差,得从抽样分布谈起二、抽样分布及抽样平均误差的计算二、抽样分布及抽样平均误差的计算 抽样分布是指样本指标的概率分布,抽样分布是指样本指标的概率分布,由样本指标的可能取值与之相应的频数或由样本指标的可能取值与之相应的频数或频率组成频率组成。第二十五页,本课件共有78页 对于抽样分布,可计算其均值和方差等来反对于抽样分布,可计算其均值和方差等来反映该
19、分布的中心和离散趋势。映该分布的中心和离散趋势。(一)抽样分布的集中趋势与离中趋势的测定(一)抽样分布的集中趋势与离中趋势的测定 A A、样本平均数的抽样分布的集中趋势与离中、样本平均数的抽样分布的集中趋势与离中趋势的测定趋势的测定 1 1、把把所所有有可可能能样样本本的的平平均均数数及及其其相相应应的的频频数数或频率排列起来,就是样本平均数的抽样分布。或频率排列起来,就是样本平均数的抽样分布。通常计算这一分布的均值和标准差,分别反通常计算这一分布的均值和标准差,分别反映样本平均数分布的集中趋势与离中趋势。映样本平均数分布的集中趋势与离中趋势。第二十六页,本课件共有78页2 2、例例8 8-2
20、-2-2-2:从从4 4、6 6、8 8三三个个数数中中按按重重复复抽抽样样抽抽2 2个,调查其平均数,形成的抽样分布如下:个,调查其平均数,形成的抽样分布如下:样本样本样本平均数样本平均数频数频数(4、4)41(4、6)(6、4)52(4、8)(6、6)(8、4)63(6、8)(8、6)72(8、8)81第二十七页,本课件共有78页平均数:平均数:计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:而总体平均数和标准差分别为:而总体平均数和标准差分别为:第二十八页,本课件共有78页所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本平均数的平均数等于
21、总体平均数。样本平均数的平均数等于总体平均数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的3 3、样本平均数的标准差即是平均数的抽样本平均数的标准差即是平均数的抽样平均误差样平均误差第二十九页,本课件共有78页在实际中,不可能一一列举所有可能的样本,从在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第而不能按上述方法计算。可利用上述第个结论个结论计算,即:计算,即:重复抽样重复抽样时:时:不重复抽不重复抽样时:样时:第三十页,本课件共有78页不知道总体方差时如何计算不知道总体方差时如何计算 有若干个方差可选择时,选方差最大者有若干个方差可选择时
22、,选方差最大者 (注意:对成数而言什么是方差最大(注意:对成数而言什么是方差最大?)用同类现象(当前或过去、总体或样本)用同类现象(当前或过去、总体或样本)的方差代替计算的方差代替计算用过去(总体或样本)的方差代替计算用过去(总体或样本)的方差代替计算用样本方差代替计算(用样本方差代替计算()第三十一页,本课件共有78页4 4、例、例8 8-2-3-2-3:用简单重复抽样的方法,从用简单重复抽样的方法,从660660个工个工厂中抽取厂中抽取3333个工厂调查月产值情况,得资料如下,个工厂调查月产值情况,得资料如下,试求月产值的抽样平均误差。试求月产值的抽样平均误差。月产值(万元)月产值(万元)
23、工厂数工厂数 0-10 0-10 20 20 10-20 10-20 9 9 20-30 20-30 2 2 30-40 30-40 2 2第三十二页,本课件共有78页解解=10.76(万元)(万元)第三十三页,本课件共有78页B B、样本成数的抽样分布的集中趋势与离中、样本成数的抽样分布的集中趋势与离中趋势的测定趋势的测定1 1、把所有可能样本的成数及其相应的频、把所有可能样本的成数及其相应的频数或频率排列起来,就是样本成数的抽样数或频率排列起来,就是样本成数的抽样分布。分布。通常计算这一分布的均值和标准差,分别反通常计算这一分布的均值和标准差,分别反映样本成数分布的集中趋势与离中趋势。映样
24、本成数分布的集中趋势与离中趋势。第三十四页,本课件共有78页2 2、例、例8 8-2-4-2-4:从张(男)、王(男)、田(女):从张(男)、王(男)、田(女)三个人中按重复抽样抽三个人中按重复抽样抽2 2个,调查其男性比重,形个,调查其男性比重,形成的抽样分布如下成的抽样分布如下 样本样本样本成数样本成数(p p)频数频数(张、张)(张、王)(张、张)(张、王)(王、张)(王、王)(王、张)(王、王)1 14 4(张、田)(张、田)(王、田)(王、田)(田、张)(田、王)(田、张)(田、王)1/21/24 4(田、田)(田、田)0 01 1第三十五页,本课件共有78页平均数:平均数:计算该分
25、布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:而总体成数和标准差分别为:而总体成数和标准差分别为:第三十六页,本课件共有78页所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本成数的平均数等于总体成数。样本成数的平均数等于总体成数。抽样成数的标准差仅为总体成数标准差的抽样成数的标准差仅为总体成数标准差的3 3、样本成数的标准差即是成数的抽样平样本成数的标准差即是成数的抽样平均误差均误差在实际中,不可能一一列举所有可能的样在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上本,从而不能按上述方法计算。可利用上述第述第个结论计算,即:个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样与抽样估计 2精选课件 抽样 估计 精选 课件
限制150内