抽样与抽样估计 (2)课件.ppt
《抽样与抽样估计 (2)课件.ppt》由会员分享,可在线阅读,更多相关《抽样与抽样估计 (2)课件.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于抽样与抽样估计(2)第1页,此课件共78页哦一、抽样调查一、抽样调查的概念和特点的概念和特点1 1、概念、概念:抽样调查抽样调查是按是按随机原则随机原则从全部研究对象从全部研究对象中抽取部分单位进行观察,并根据样本的中抽取部分单位进行观察,并根据样本的实际数据对总体的实际数据对总体的数量特征数量特征作出具有一作出具有一定定可靠程度可靠程度的估计和判断的估计和判断。只抽取部分单位进行调查只抽取部分单位进行调查。1 1 抽样调查抽样调查的一般问题的一般问题第2页,此课件共78页哦2 2、特点、特点(1)抽样调查抽样调查建立在随机取样的基础上建立在随机取样的基础上。(2)(2)它是由部分推断整体
2、的一种认识方法它是由部分推断整体的一种认识方法。(3)抽样调查抽样调查的误差可以事先计算并加以控的误差可以事先计算并加以控制。制。第3页,此课件共78页哦3 3、抽样调查的适用范围、抽样调查的适用范围抽抽样调查方法是市场经济国家在调样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用具有准确度高、成本低、速度快、应用面广等优点。面广等优点。第4页,此课件共78页哦1.1.实实际工作不可能进行全面调查观察,而又需际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;要了解其全面资料的事物;2.2.虽虽可进行全面调
3、查观察,但比较困难或并不必可进行全面调查观察,但比较困难或并不必要;要;3.3.对对普查或全面调查统计资料的质量进行检查和普查或全面调查统计资料的质量进行检查和修正;修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;物总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取设进行检验,判断这种假设的真伪,以决定取舍。舍。一般适用于以下范围:一般适用于以下范围:第5页,此课件共78页哦三、有关抽样的基本概念三、有关抽样的基本概念
4、(一)总体和样本(一)总体和样本总体:总体:也称全及总体。指所要认识的研究对也称全及总体。指所要认识的研究对象全体。总体单位总数用象全体。总体单位总数用“N N”表示。表示。样本:样本:也称抽样总体,是抽出的单位组成的整也称抽样总体,是抽出的单位组成的整体。样本单位总数用体。样本单位总数用“n n”表示。表示。二、抽样推断的内容二、抽样推断的内容参数估计参数估计假设检验假设检验第6页,此课件共78页哦(二)参数和统计量(二)参数和统计量1 1、针对总体计算的指标叫总体参数,也叫全及指标。、针对总体计算的指标叫总体参数,也叫全及指标。2 2、针针对对样样本本计计算算的的指指标标为为统统计计量量,
5、也也叫叫估估计计量量,也也叫叫抽样指标。抽样指标。参数的值是定值参数的值是定值常用的参数有:总体平均数、总体成数常用的参数有:总体平均数、总体成数P P、总体标、总体标准差准差其值随样本的不同而不同,是个随机变量。其值随样本的不同而不同,是个随机变量。抽样估计就是通过统计量的值去估计参数的值。抽样估计就是通过统计量的值去估计参数的值。常用的统计量有:样本平均数、样本成数常用的统计量有:样本平均数、样本成数p p、样本标、样本标准差准差S S第7页,此课件共78页哦 若总体单位的某种标志只有两种表若总体单位的某种标志只有两种表现(称为是非标志),总体成数是指具有现(称为是非标志),总体成数是指具
6、有某种特征和属性的单位在全部总体单位中某种特征和属性的单位在全部总体单位中所占比重,记为所占比重,记为p p。以以 代表代表N N个总体单位中具有个总体单位中具有某种特征的单位数,某种特征的单位数,代表代表N N 个总个总体单位中不具有某种特征的单位数,体单位中不具有某种特征的单位数,N=NN=N1 1+N+N0 0。有。有第8页,此课件共78页哦 从从总总体体中中随随机机抽抽出出容容量量为为 的的样样本本,具具有有某某种种特特征征的的单单位位数数为为 ,则则样样本本的的成成数数为为 。例例如如,某某工工厂厂生生产产某某种种电电子子元元件件,某某批批产产品品共共1000010000件件,其其中
7、中不不合合格格品品100100件件,则则不不合合格格品品所所占占的的成成数数 。若若从从中中按按随随机机的的原原则则抽抽100100件件,其其中中有有3 3件件不不合合格格品品,则则样样本本的的成成数为数为 。NEXT第9页,此课件共78页哦总体参数总体参数样本统计量样本统计量样本统计量样本统计量公式公式总体平均数总体平均数样本平均数样本平均数总体成数总体成数样本成数样本成数总体方差总体方差样本方差样本方差总体标准差总体标准差样本标准差样本标准差第10页,此课件共78页哦第11页,此课件共78页哦未分组数据未分组数据:分组数据:分组数据:未分组数据:未分组数据:未分组数据:未分组数据:分组数据
8、:分组数据:总体方差公式总体方差公式总体标准差公式总体标准差公式第12页,此课件共78页哦第13页,此课件共78页哦推断统计:推断统计:利用样本统计量对总体某些性质利用样本统计量对总体某些性质或数量特征进行推断。或数量特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布第14页,此课件共78页哦(三)样本容量和样本个数(三)样本容量和样本个数1 1、样本容量:、样本容量:一个样本包含的单位数。用一个样本包含的单位数。用 “n n”表示。一般要求表示。一般要求 n n 30302 2、样本个数:、样本个数:从一个全及总
9、体中可能抽取的从一个全及总体中可能抽取的样本数目。样本数目。第15页,此课件共78页哦(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样1 1、重复抽样:也叫放回抽样。、重复抽样:也叫放回抽样。2 2、不重复抽样:也叫无放回抽样。、不重复抽样:也叫无放回抽样。一个单位可能中选多次一个单位可能中选多次每次抽单位,概率固定,都为每次抽单位,概率固定,都为1/N1/N。一个单位最多中选一次一个单位最多中选一次每次抽单位,概率不同,逐渐增加每次抽单位,概率不同,逐渐增加第16页,此课件共78页哦(五五)、概率抽样与非概率抽样、概率抽样与非概率抽样1、概率抽样:也叫随机抽样,是指按照随机、概率抽样:也
10、叫随机抽样,是指按照随机原则抽取样本。概率抽样最基本的组织方式原则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和有:简单随机抽样、分层抽样、等距抽样和整群抽样。整群抽样。2、非概率抽样:也叫非随机抽样,是指从研、非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额调查等属于非随机点调查、典型调查、配额调查等属于非随机抽样。抽样。第17页,此课件共78页哦(六)、抽样框(六)、抽样框 1 1、抽抽样样框框是是包包括
11、括全全部部抽抽样样单单位位的的名名单单框框架架。编编制制抽抽样样框框是是实实施施抽抽样样的的基基础础。抽抽样样框框的的好好坏坏通通常常会会直直接影响到抽样调查的随机性和调查的效果。接影响到抽样调查的随机性和调查的效果。2 2、抽样框主要有三种形式:、抽样框主要有三种形式:名单抽样框,即列出全部总体单位的名录一览名单抽样框,即列出全部总体单位的名录一览表,如职工名单、企业名单等。表,如职工名单、企业名单等。区域抽样框,即按地理位置将总体范围划分为若区域抽样框,即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如对某市居民住房干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将
12、全市居民户划分为若干街道或片区。情况进行调查,将全市居民户划分为若干街道或片区。第18页,此课件共78页哦3 3、一一个个理理想想的的抽抽样样框框应应该该与与目目标标总总体体一一致致,即即应应包包括括全全部部总总体体单单位位,既既不不重重复复,也也不不遗遗漏漏(穷穷尽尽与与互互斥)。若有遗漏,易造成系统性误差。斥)。若有遗漏,易造成系统性误差。在实践中,要取得与目标总体完全一致的抽样框在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能,常常只能采用与目标往往很困难,甚至不可能,常常只能采用与目标总体近似的抽样框。总体近似的抽样框。时间表抽样框,即将总体全部单位按时间顺序时间表抽样
13、框,即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如对流水线上位,以此时间单位为抽样单位。如对流水线上2424小时内生产的产品进行质量抽查时,以小时内生产的产品进行质量抽查时,以5 5分钟为一分钟为一个抽样单位,可将全部产品分为个抽样单位,可将全部产品分为288288个抽样单位并个抽样单位并按时间顺序排列。按时间顺序排列。第19页,此课件共78页哦(七)、抽样误差(七)、抽样误差统计调查的误差,是指调查所得结果与总体真实统计调查的误差,是指调查所得结果与总体真实值之间的差异。在抽样调查中,误差的来源有登
14、值之间的差异。在抽样调查中,误差的来源有登记性误差和代表性误差两大类。记性误差和代表性误差两大类。第20页,此课件共78页哦(1 1)登记性误差,指在调查和汇总过程)登记性误差,指在调查和汇总过程中由于测量、登记、计算等方面的差错或中由于测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。它被调查者提供虚假资料而造成的误差。它在任何调查中均存在。而且调查范围越大,在任何调查中均存在。而且调查范围越大,调查单位越多,产生登记性误差的可能性调查单位越多,产生登记性误差的可能性也越大。也越大。(2 2)代表性误差,指样本推断总体时,由)代表性误差,指样本推断总体时,由于样本结构与总体结构
15、不一致而产生的误于样本结构与总体结构不一致而产生的误差。又分系统误差与随机误差两种。差。又分系统误差与随机误差两种。第21页,此课件共78页哦随机误差也叫偶然误差。它是由偶随机误差也叫偶然误差。它是由偶然性因素引起的代表性误差。它不可避然性因素引起的代表性误差。它不可避免,但可计算与控制。抽样估计中的抽免,但可计算与控制。抽样估计中的抽样误差,就是指这种随机误差。样误差,就是指这种随机误差。在计算抽样误差时,常常假设不存在登记性在计算抽样误差时,常常假设不存在登记性误差和系统误差误差和系统误差系统误差是非随机因素引起的误差,它系系统误差是非随机因素引起的误差,它系统性偏高或偏低,也称偏差。统性
16、偏高或偏低,也称偏差。第22页,此课件共78页哦2 2 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念1 1、抽样误差是指由于抽样的随机性而产生的、抽样误差是指由于抽样的随机性而产生的那一部分代表性误差(随机性误差),不包括那一部分代表性误差(随机性误差),不包括 登记性误差,也不包括可能发生的偏差。登记性误差,也不包括可能发生的偏差。主要有两主要有两种种:实际抽样误差实际抽样误差,抽样平均误差。抽样平均误差。(1 1)实际抽样误差:指某一样本指标与总体参数)实际抽样误差:指某一样本指标与总体参数之间的离差之间的离差例例8 8-2-1-2-1:从从1 1、2 2、3 3中抽中抽2
17、 2个(重复),参数个(重复),参数取总体平均数取总体平均数 (等于(等于2 2),则实际抽样误),则实际抽样误差如下:差如下:第23页,此课件共78页哦样本样本 样本统计量样本统计量实际抽样误差实际抽样误差(-)(1 1、1 1)1 1-1-1(1(1、2 2)1.51.5-0.5-0.5(1 1、3 3)2 20 0(2 2、1 1)1.51.5-0.5-0.5(2 2、2 2)2 20 0(2 2、3 3)2.52.50.50.5(3 3、1 1)2 20 0(3 3、2 2)2.52.50.50.5(3 3、3 3)3 31 1第24页,此课件共78页哦(2)(2)抽样平均误差:指样本
18、指标的标准差。抽样平均误差:指样本指标的标准差。抽样实际误差是无法知道的,而抽样平均误差抽样实际误差是无法知道的,而抽样平均误差可以计算。可以计算。在讨论抽样误差时,通常指抽样平均误差在讨论抽样误差时,通常指抽样平均误差要计算抽样平均误差,得从抽样分布谈起要计算抽样平均误差,得从抽样分布谈起二、抽样分布及抽样平均误差的计算二、抽样分布及抽样平均误差的计算 抽样分布是指样本指标的概率分布,由抽样分布是指样本指标的概率分布,由样本指标的可能取值与之相应的频数或频率样本指标的可能取值与之相应的频数或频率组成组成。第25页,此课件共78页哦 对于抽样分布,可计算其均值和方差等来对于抽样分布,可计算其均
19、值和方差等来反映该分布的中心和离散趋势。反映该分布的中心和离散趋势。(一)抽样分布的集中趋势与离中趋势的测定(一)抽样分布的集中趋势与离中趋势的测定 A A、样本平均数的抽样分布的集中趋势与离、样本平均数的抽样分布的集中趋势与离中趋势的测定中趋势的测定 1 1、把把所所有有可可能能样样本本的的平平均均数数及及其其相相应应的的频频数数或或频频率率排排列列起起来来,就就是是样样本本平平均均数数的的抽抽样样分布。分布。通常计算这一分布的均值和标准差,分别反映通常计算这一分布的均值和标准差,分别反映样本平均数分布的集中趋势与离中趋势。样本平均数分布的集中趋势与离中趋势。第26页,此课件共78页哦2 2
20、、例例8 8-2-2-2-2:从从4 4、6 6、8 8三三个个数数中中按按重重复复抽抽样样抽抽2 2个个,调调查其平均数,形成的抽样分布如下:查其平均数,形成的抽样分布如下:样本样本样本平均数样本平均数频数频数(4、4)41(4、6)(6、4)52(4、8)(6、6)(8、4)63(6、8)(8、6)72(8、8)81第27页,此课件共78页哦平均数:平均数:计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:而总体平均数和标准差分别为:而总体平均数和标准差分别为:第28页,此课件共78页哦所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本平均数的
21、平均数等于总体平均数。样本平均数的平均数等于总体平均数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的3 3、样本平均数的标准差即是平均数的样本平均数的标准差即是平均数的抽样平均误差抽样平均误差第29页,此课件共78页哦在实际中,不可能一一列举所有可能的样本,从而不在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第能按上述方法计算。可利用上述第个结论计算,即:个结论计算,即:重复抽样重复抽样时:时:不重复抽不重复抽样时:样时:第30页,此课件共78页哦不知道总体方差时如何计算不知道总体方差时如何计算 有若干个方差可选择时,选方差最大者有若干个方差
22、可选择时,选方差最大者 (注意:对成数而言什么是方差最大(注意:对成数而言什么是方差最大?)用同类现象(当前或过去、总体或样本)的方用同类现象(当前或过去、总体或样本)的方差代替计算差代替计算用过去(总体或样本)的方差代替计算用过去(总体或样本)的方差代替计算用样本方差代替计算(用样本方差代替计算()第31页,此课件共78页哦4 4、例、例8 8-2-3-2-3:用简单重复抽样的方法,从用简单重复抽样的方法,从660660个工厂中个工厂中抽取抽取3333个工厂调查月产值情况,得资料如下,试求月产个工厂调查月产值情况,得资料如下,试求月产值的抽样平均误差。值的抽样平均误差。月产值(万元)月产值(
23、万元)工厂数工厂数 0-10 0-10 20 20 10-20 10-20 9 9 20-30 20-30 2 2 30-40 30-40 2 2第32页,此课件共78页哦解解=10.76(万元)(万元)第33页,此课件共78页哦B B、样本成数的抽样分布的集中趋势与离中趋、样本成数的抽样分布的集中趋势与离中趋势的测定势的测定1 1、把所有可能样本的成数及其相应的频数、把所有可能样本的成数及其相应的频数或频率排列起来,就是样本成数的抽样分或频率排列起来,就是样本成数的抽样分布。布。通常计算这一分布的均值和标准差,分别反映通常计算这一分布的均值和标准差,分别反映样本成数分布的集中趋势与离中趋势。
24、样本成数分布的集中趋势与离中趋势。第34页,此课件共78页哦2 2、例、例8 8-2-4-2-4:从张(男)、王(男)、田(女)三个:从张(男)、王(男)、田(女)三个人中按重复抽样抽人中按重复抽样抽2 2个,调查其男性比重,形成的抽个,调查其男性比重,形成的抽样分布如下样分布如下 样本样本样本成数样本成数(p p)频数频数(张、张)(张、王)(张、张)(张、王)(王、张)(王、王)(王、张)(王、王)1 14 4(张、田)(张、田)(王、田)(王、田)(田、张)(田、王)(田、张)(田、王)1/21/24 4(田、田)(田、田)0 01 1第35页,此课件共78页哦平均数:平均数:计算该分布
25、的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:而总体成数和标准差分别为:而总体成数和标准差分别为:第36页,此课件共78页哦所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本成数的平均数等于总体成数。样本成数的平均数等于总体成数。抽样成数的标准差仅为总体成数标准差的抽样成数的标准差仅为总体成数标准差的3 3、样本成数的标准差即是成数的抽样平均样本成数的标准差即是成数的抽样平均误差误差在实际中,不可能一一列举所有可能的样在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上本,从而不能按上述方法计算。可利用上述第述第个结论计算,即:个结论
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样与抽样估计 2课件 抽样 估计 课件
限制150内