统计学抽样与抽样分布 (2)精选PPT.ppt
《统计学抽样与抽样分布 (2)精选PPT.ppt》由会员分享,可在线阅读,更多相关《统计学抽样与抽样分布 (2)精选PPT.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于统计学抽样与抽样分布(2)1第1页,讲稿共70张,创作于星期二24.1 抽样的基础知识一、几个概念二、抽样误差三、常用的抽样方法第2页,讲稿共70张,创作于星期二3一、几个概念(一)全及总体与总体指标(一)全及总体与总体指标全全及及总总体体。简简称称总总体体(Population)(Population),是是指指所所要要研研究究的的对对象象的的全全体体,它它是是由由所所研研究究范范围围内内具具有有某某种种共共同同性性质质的的全全部部单单位位所所组组成成的集合体。总体单位总数用的集合体。总体单位总数用N N表示。(举例)表示。(举例)总总体体指指标标(参参数数)。在在抽抽样样估估计计中中,
2、用用来来反反映映总总体体数数量量特征的指标称为总体指标,也叫总体参数。特征的指标称为总体指标,也叫总体参数。研研究究目目的的一一经经确确定定,总总体体也也唯唯一一地地确确定定了了,所所以以总总体体指指标标的的数数值值是客观存在的、确定的,但又是未知的,需要用样本资料去估计是客观存在的、确定的,但又是未知的,需要用样本资料去估计。第3页,讲稿共70张,创作于星期二4通常所要估计的总体指标有通常所要估计的总体指标有:变量总体变量总体总体平均数总体平均数 (或记为或记为)总体标准差总体标准差或方差或方差总体标志总量总体标志总量 (N )(N )属性总体属性总体总体比率(成数)总体比率(成数)P(P(
3、或或 )总体比率标准差总体比率标准差P P或或 方差方差P P 总总体体中中具具有有某某一一属属性性的的单单位位总数总数(NP)(NP)等。等。第4页,讲稿共70张,创作于星期二5一、几个概念(二)样本总体与样本指标(二)样本总体与样本指标样样本本总总体体。简简称称样样本本(SampleSample),它它是是按按照照随随机机原原则则,从从总总体中抽取的部分总体单位的集合体体中抽取的部分总体单位的集合体 。样样本本容容量量:样样本本中中所所包包含含的的个个体体的的数数量量,一一般般用用n n表表示示。在在实实际际工工作作中中,人人们们通通常常把把n30n30的的样样本本称称为为大大样样本本,而
4、而把把n30n30的样本称为小样本的样本称为小样本。对对于于某某一一既既定定的的总总体体,由由于于抽抽样样的的方方式式方方法法不不同同,样样本本容容量也可大可小,因而,量也可大可小,因而,样本是不确定的、而是可变的样本是不确定的、而是可变的。第5页,讲稿共70张,创作于星期二6一、几个概念(二)样本总体与样本指标(二)样本总体与样本指标样本指标(统计量)样本指标(统计量)。在抽样估计中,用来反映。在抽样估计中,用来反映样本总体样本总体数量特征的指标数量特征的指标称为样本指标,也称为样称为样本指标,也称为样本统计量或估计量,是根据样本资料计算的、用本统计量或估计量,是根据样本资料计算的、用以估计
5、或推断相应总体指标的综合指标。以估计或推断相应总体指标的综合指标。第6页,讲稿共70张,创作于星期二7常见的样本统计量有:常见的样本统计量有:变量总体变量总体:样本平均数样本平均数样本标准差样本标准差S S或或 样本方差样本方差SS样本统计量样本统计量不含未知参数不含未知参数,它是随样本不同而不同的它是随样本不同而不同的随机变量随机变量。属性总体:属性总体:样本比样本比率率(也称样本(也称样本 成数)成数)p p样本比样本比率率标准差标准差p p或或 方差方差p p 第7页,讲稿共70张,创作于星期二8二、抽样误差(一)抽样误差的概念(一)抽样误差的概念抽样误差是统计调查误差的一种形式。统计调
6、查误差,是指调查所得结果与总体真实数统计调查误差,是指调查所得结果与总体真实数值之间的差异。在抽样调查中,误差的来源有两值之间的差异。在抽样调查中,误差的来源有两大类:大类:登记性误差登记性误差。是任何一种统计调查都可能产生。是任何一种统计调查都可能产生.代表性误差代表性误差 系统性误差系统性误差 随机误差随机误差第8页,讲稿共70张,创作于星期二9二、抽样误差系系统统性性误误差差,是是由由于于非非随随机机因因素素引引起起的的样样本本代代表表性性不不足足而而产产生生的的误误差差,表表现现为为样样本本估估计计量量的的值值系系统统性性偏偏高高或偏低,故也称偏差;或偏低,故也称偏差;随机误差随机误差
7、:又称偶然性误差,是指:又称偶然性误差,是指遵循随机原则遵循随机原则抽样,但由于样本各单位的结构不足以代表总体各抽样,但由于样本各单位的结构不足以代表总体各单位的结构而引起的样本估计量与总体参数之间的单位的结构而引起的样本估计量与总体参数之间的误差误差。这就是抽样估计中所谓的抽样误差。这就是抽样估计中所谓的抽样误差 。第9页,讲稿共70张,创作于星期二10二、抽样误差实实际际应应用用中中,有有三三个个密密切切联联系系而而又又相相互互区区别别的的抽抽样样误差的概念误差的概念 实际抽样误差实际抽样误差 抽样平均误差抽样平均误差 抽样极限误差抽样极限误差第10页,讲稿共70张,创作于星期二11二、抽
8、样误差(二)抽样平均误差(抽样标准误(二)抽样平均误差(抽样标准误)抽抽样样平平均均误误差差是是反反映映抽抽样样误误差差一一般般水水平平的的指指标标(因因为为抽抽样样误误差差是是一一个个随随机机变变量量,它它的的数数值值随随着着可可能能抽抽取取的的样样本本不不同同而而或或大大或或小小,为为了了总总的的衡衡量量样样本本代代表表性性的的高高低低,就就需需要要计计算算抽抽样样误误差差的的一一般般水水平平)。通通常常用用样样本本估估计计量量的的标标准准差差来来反反映映所所有有可可能能样样本本估估计计值值与其中心值的平均离散程度。与其中心值的平均离散程度。第11页,讲稿共70张,创作于星期二12二、抽样
9、误差(二)抽样平均误差(二)抽样平均误差n抽样平均误差可衡量样本对总体的代表性大小抽样平均误差可衡量样本对总体的代表性大小。即。即:抽抽样平均误越小,则样本估计量的分布就越集中在总体样平均误越小,则样本估计量的分布就越集中在总体参数的附近,平均来说,样本估计值与总体参数之间参数的附近,平均来说,样本估计值与总体参数之间的抽样误差越小,样本对总体的代表性越大。的抽样误差越小,样本对总体的代表性越大。第12页,讲稿共70张,创作于星期二13抽样平均误的计算公式抽样平均误的计算公式在在总总体体方方差差 已已知知,总总体体单单位位总总数数为为N N,样样本本容容量量为为n n,简简单单随随机机抽抽样样
10、条条件件下下,抽抽样样平平均均误误的的计计算算公公式为式为:重复抽样重复抽样 不重复抽样不重复抽样估计均值估计均值估计成数估计成数第13页,讲稿共70张,创作于星期二14二、抽样误差(三)抽样极限误差(三)抽样极限误差抽抽样样极极限限误误差差是是指指一一定定概概率率下下抽抽样样误误差差的的可可能能范范围围,也也称称为为允允许误差许误差。用。用表示,由定义知其表达式:表示,由定义知其表达式:在一定概率下,在一定概率下,上上式式表表示示,在在一一定定概概率率下下可可认认为为样样本本估估计计量量与与相相应应的的总总体体参参数数的的误差的绝对值不超过误差的绝对值不超过 。第14页,讲稿共70张,创作于
11、星期二15抽样极限误差抽样极限误差用用 、分分别别表表示示平平均均数数和和比比率率(成成数数)的的抽抽样样极极限限误误差差,则在一定概率下有:则在一定概率下有:估计均值的置信区间:估计均值的置信区间:估计成数(比例)的置信区间:估计成数(比例)的置信区间:第15页,讲稿共70张,创作于星期二16对抽样极限误差的解释:抽样极限误差抽样极限误差是抽样误差的是抽样误差的可能范围可能范围,而不是完全肯定的范,而不是完全肯定的范围。所以,这一可能范围的大小是与其估计的可靠程度的大小围。所以,这一可能范围的大小是与其估计的可靠程度的大小(即概率)紧密联系的。在抽样估计中,这个概率叫置信度,习(即概率)紧密
12、联系的。在抽样估计中,这个概率叫置信度,习惯上也称为可靠程度、把握程度或概率保证程度等,用惯上也称为可靠程度、把握程度或概率保证程度等,用1-1-表示。表示。显然在其他条件不变的情况下,抽样极限误差越大,相应显然在其他条件不变的情况下,抽样极限误差越大,相应的置信度也就越大。的置信度也就越大。第16页,讲稿共70张,创作于星期二17抽样抽样误差率:误差率:与抽样极限误差相关的两个概念是与抽样极限误差相关的两个概念是:抽样误差率和抽样估计精度抽样误差率和抽样估计精度抽样误差率抽样误差率=(抽样极限误差(抽样极限误差/估计量)估计量)100%100%抽样估计精度抽样估计精度=100%-=100%-
13、抽样误差率抽样误差率第17页,讲稿共70张,创作于星期二18估计精度(准确性)与可靠程度的关系:估估计计精精度度与与估估计计的的可可靠靠程程度度是是矛矛盾盾的的。也也就就是是说说,如如果果精精度度很很高高,则则会会由由于于估估计计区区间间太太窄窄而而使使错错误误估估计计的的可可能能性性大大增增,从从而而大大大大降降低低估估计计的的可可靠靠程程度度,使使估估计计结结果果没没有有多多大大的的作作用用;如如果果置置信信度度很很高高,则则意意味味着着允允许许误误差差范范围围较较大大,而而使使估估计计精精度度太太低低 ,这这时时尽尽管管估估计计的的可可靠靠程程度度接接近近或或等等于于100%100%,但
14、抽样估计本身也会失去意义。但抽样估计本身也会失去意义。实际中,只能依据具体情况,先满足一方面,然后确定另一方面。实际中,只能依据具体情况,先满足一方面,然后确定另一方面。第18页,讲稿共70张,创作于星期二19三、抽样方法在实际应用中,抽样方法主要有两种在实际应用中,抽样方法主要有两种 概率抽样概率抽样 非概率抽样非概率抽样1 1、概概率率抽抽样样也也叫叫随随机机抽抽样样,是是指指按按随随机机原原则则抽抽取取样样本本。所所谓谓随随机机原原则则,就就是是排排除除主主观观意意识识的的干干扰扰,使使总总体体的的每每一一个个单单位位都都有有一一定定的的概率被抽选为样本单位,每个单位能否入选是随机的。概
15、率被抽选为样本单位,每个单位能否入选是随机的。概率抽样最基本的组织形式有概率抽样最基本的组织形式有:简单随机抽样、分层抽样、等距抽样和整群抽样。简单随机抽样、分层抽样、等距抽样和整群抽样。第19页,讲稿共70张,创作于星期二20三、抽样方法1 1、概率抽样概率抽样特特点点:概概率率抽抽样样能能有有效效地地避避免免主主观观选选样样带带来来的的倾倾向向性性误误差差(系系统统偏偏差差),使使得得抽抽样样估估计计和和推推断断得得以以建建立立在在概概率率论论和和数数理理统统计计的的科科学学理理论论之之上上。从从而而使使样样本本资资料料一一方方面面能能够用于估计和推断总体的数量特征;够用于估计和推断总体的
16、数量特征;另另一一方方面面可可以以计计算算和和控控制制抽抽样样误误差差,说说明明估估计计的的可可靠靠程程度。度。2 2、非非概概率率抽抽样样也也叫叫非非随随机机抽抽样样,是是指指从从研研究究目目的的出出发发,根根据据调调查者的经验或判断,从总体中查者的经验或判断,从总体中有意识地有意识地抽取若干单位构成样本。抽取若干单位构成样本。第20页,讲稿共70张,创作于星期二21三、抽样方法由于一般的抽样推断都是建立在概率抽样的基础上,由于一般的抽样推断都是建立在概率抽样的基础上,因此,主要介绍四种常见的抽样组织形式。因此,主要介绍四种常见的抽样组织形式。简单随机抽样类型抽样等距抽样整群抽样第21页,讲
17、稿共70张,创作于星期二22(一)简单随机抽样(一)简单随机抽样简简单单随随机机抽抽样样又又称称纯纯随随机机抽抽样样,它它是是对对总总体体单单位位不不进进行行任任何何划划分分或或排排队队,完完全全随随机机地地直直接接从从总总体体中中抽抽取取样样本本单单位位,使使每每个总体单位都有完全均等的机会被抽中。个总体单位都有完全均等的机会被抽中。纯纯随随机机抽抽样样常常采采用用的的抽抽选选方方法法有有抽抽签签法法、利利用用随随机机数数表表取取数数法法和和电电子子计计算算机机取取数数法法。它它只只需需对对总总体体单单位位进进行行编编号号,而而不不需需要事先掌握更多的总体信息。要事先掌握更多的总体信息。第2
18、2页,讲稿共70张,创作于星期二23(一)简单随机抽样(一)简单随机抽样纯随机抽样有两种纯随机抽样有两种抽取单位抽取单位的具体方法,即:的具体方法,即:重重复复抽抽样样,又又称称回回置置抽抽样样,是是指指从从总总体体的的N N个个单单位位中中,每每次次抽抽取取一一个个单单位位后后,再将其放回总体中参加下一次抽选,这样连续抽再将其放回总体中参加下一次抽选,这样连续抽n n次,即得到一个样本。次,即得到一个样本。其其特特点点是是:样样本本是是由由n n次次相相互互独独立立的的连连续续试试验验构构成成的的,每每次次试试验验是是在在完完全全相相同同的条件下进行,每个单位中选的机会在各次都完全相等。的条
19、件下进行,每个单位中选的机会在各次都完全相等。“重重抽抽”(考考虑虑顺顺序序)可可能能的的样样本本数数目目(从从总总体体中中可可能能抽抽取取的的样样本本个数,用个数,用M M表示)为:表示)为:N Nn n个。个。不重复抽样不重复抽样,也叫不回置抽样,是指抽中的单位不再放回总体中,下,也叫不回置抽样,是指抽中的单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。一个样本单位只能从余下的总体单位中抽取。其特点是其特点是:样本由:样本由n n次连续抽取次连续抽取的结果构成,实际上等于一次同时从总体的结果构成,实际上等于一次同时从总体中抽取中抽取n n个样本单位。个样本单位。可能的可能的样
20、样本数目(考本数目(考虑顺虑顺序):序):N(N-1)(N-2)N(N-1)(N-2)(N-n+1)(N-n+1)个。个。第23页,讲稿共70张,创作于星期二24(一)简单随机抽样(一)简单随机抽样优缺点:纯随机抽样比较适用于总体单位数不多,总体单位纯随机抽样比较适用于总体单位数不多,总体单位标志值的差异不很大,或对抽样推断的要求不十分高的情况下标志值的差异不很大,或对抽样推断的要求不十分高的情况下使用。但由于纯随机抽样的估计效率比较低,进行大规模的抽使用。但由于纯随机抽样的估计效率比较低,进行大规模的抽样调查时,其组织工作也不宜开展,故大规模抽调常采用其他样调查时,其组织工作也不宜开展,故大
21、规模抽调常采用其他三种组织形式。三种组织形式。第24页,讲稿共70张,创作于星期二25(二)分层抽样(二)分层抽样分分层层抽抽样样又又称称类类型型抽抽样样或或分分类类抽抽样样。这这种种抽抽样样方方式式是是先先对对总总体体各各单单位位按按主主要要标标志志加加以以分分组组,然然后后再再从从各各组组中中按按随随机机原原则则抽抽选选一一定定单单位位构构成成样样本本。如如城城市市职职工工收收入入调调查查,可可按按行行业业将将全全部部职职工工分类,再从各行业中分别抽取若干职工进行调查。分类,再从各行业中分别抽取若干职工进行调查。类型抽样总的抽样误差与组间差异无关,仅取决于各类型抽样总的抽样误差与组间差异无
22、关,仅取决于各组内组内的的抽样误差,而组内的抽样误差又取决于各组内的方差水抽样误差,而组内的抽样误差又取决于各组内的方差水平。平。所以,类型抽样所以,类型抽样应该尽可能扩大组间方差,缩小组内应该尽可能扩大组间方差,缩小组内方差,这样就可以减少抽样误差,以提高抽样效果。方差,这样就可以减少抽样误差,以提高抽样效果。第25页,讲稿共70张,创作于星期二26(二)分层抽样(二)分层抽样分层抽样的优点:1、不仅能对总体进行估计,而且也可对各层子总体进行估计。2、能使抽样的组织和实施都比较方便。因为分层时可按自然区域或行政区域进行。3、能使样本在总体中的分布比较均匀。因为类型抽样是对所有的层进行全面抽样
23、。4、估计精度高。因为分层抽样的误差只与组内方差有关,因此,若分类效果好,则可减少抽样误差。第26页,讲稿共70张,创作于星期二27(三)等距抽样(三)等距抽样等等距距抽抽样样也也称称机机械械抽抽样样。它它是是先先将将总总体体所所有有单单位位按按某某一一标标志志顺顺序序排排列列,然然后后按按相等相等的距离抽取样本单位。的距离抽取样本单位。排列的标志可以是排列的标志可以是无关标志无关标志也可以是也可以是有关标志有关标志。(1 1)无关标志无关标志,指和单位标志值的大小无关或不起主要的影响作用。指和单位标志值的大小无关或不起主要的影响作用。(2 2)有关标志有关标志,指作为排队顺序的标志和单位标志
24、值的大小有密切的关系。指作为排队顺序的标志和单位标志值的大小有密切的关系。其其中中,按按有有关关标标志志顺顺序序排排队队,并并将将样样本本单单位位加加以以n n等等份份后后,对对每每一一部部分分抽抽取取一一个样本单位有两种方法个样本单位有两种方法 半距中点取样半距中点取样 对称等距取样对称等距取样 应应该该指指出出的的是是,等等距距取取样样间间隔隔的的确确定定,要要避避免免与与想想象象中中的的周周期期性性节节奏奏重合重合,引起系统误差的影响。,引起系统误差的影响。第27页,讲稿共70张,创作于星期二28(三)等距抽样(三)等距抽样等距抽样的优点:等距抽样的优点:1 1、简便易行。相对于简单随机
25、抽样而言。简便易行。相对于简单随机抽样而言。2 2、误差相对而言,比简单随机抽样的要小。因为等距抽样的、误差相对而言,比简单随机抽样的要小。因为等距抽样的样本在总体中的分布一般比较均匀(针对有关标志排队而言)样本在总体中的分布一般比较均匀(针对有关标志排队而言)。第28页,讲稿共70张,创作于星期二29(四)整群抽样(四)整群抽样整整群群抽抽样样又又称称群群体体抽抽样样。它它是是将将总总体体各各单单位位划划分分成成许许多多群群,然然后后从从中中随随机机抽抽取取部部分分群群,并并对对中中选选群群的的所所有有单单位位进进行行全全面面调查调查。整群抽样整群抽样实质上实质上是是以以“群群”代替单位代替
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学抽样与抽样分布 2精选PPT 统计学 抽样 分布 精选 PPT
限制150内