统计学 抽样推断幻灯片.ppt
《统计学 抽样推断幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学 抽样推断幻灯片.ppt(150页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学 抽样推断第1页,共150页,编辑于2022年,星期二内容提要内容提要第一节第一节第一节第一节 抽样调查的一般问题抽样调查的一般问题第二节第二节 抽样误差抽样误差第三节第三节第三节第三节 总体指标的推断总体指标的推断第四节第四节第四节第四节 必要抽样数目的确定必要抽样数目的确定必要抽样数目的确定必要抽样数目的确定 第2页,共150页,编辑于2022年,星期二第一节第一节 抽样调查的一般问题抽样调查的一般问题一、抽样调查的概念一、抽样调查的概念二、抽样调查的作用二、抽样调查的作用三、抽样调查中的几个基本概念三、抽样调查中的几个基本概念四、抽样调查的组织方式四、抽样调查的组织方式返回提要第3
2、页,共150页,编辑于2022年,星期二(一一)抽样调查的概念抽样调查的概念 抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。征的一种方法。(二二)抽样调查的主要特点:抽样调查的主要特点:(1)(1)按随机原则抽取调查单位。按随机原则抽取调查单位。(2)(2)由部分推断全体。由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。随机原则随机原则统计量统计量总体参数总
3、体参数推断推断抽取抽取一、抽样调查的概念一、抽样调查的概念第一节第4页,共150页,编辑于2022年,星期二(1)(1)用于不可能进行全面调查的无限总体。用于不可能进行全面调查的无限总体。例如:连续大量生产的某种小件产品例如:连续大量生产的某种小件产品(2)(2)用于不可能进行全面调查而又需要了解全面情况用于不可能进行全面调查而又需要了解全面情况的现象。的现象。例如:带有破坏性或消耗性的产品质量检验,灯泡的使例如:带有破坏性或消耗性的产品质量检验,灯泡的使用寿命,烟、酒的检验等。用寿命,烟、酒的检验等。(3)(3)用于不必要进行全面调查的现象。用于不必要进行全面调查的现象。例如:水库中的鱼苗数
4、、森林的木材面积等例如:水库中的鱼苗数、森林的木材面积等(4)(4)用于对全面调查的资料进行评价与修正。用于对全面调查的资料进行评价与修正。例如:人口普查需采用抽查进行复查,计算普查差错率。例如:人口普查需采用抽查进行复查,计算普查差错率。(5)(5)用于工业生产过程的质量控制。用于工业生产过程的质量控制。例如:对于成批或大量连续生产的产品生产过程,可及时提供例如:对于成批或大量连续生产的产品生产过程,可及时提供有关产品的质量信息,分析原因,采取措施,排除故障,保证有关产品的质量信息,分析原因,采取措施,排除故障,保证生产过程正常进行。生产过程正常进行。二、抽样调查的作用二、抽样调查的作用第一
5、节第5页,共150页,编辑于2022年,星期二三、抽样调查中的几个基本概念三、抽样调查中的几个基本概念(一一)全及总体和抽样总体全及总体和抽样总体(二二)总体指标总体指标(三三)样本指标样本指标第一节第6页,共150页,编辑于2022年,星期二1.1.全及总体。全及总体简称总体或母体,它是指所要调全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。查研究对象的全体。总体单位总数用总体单位总数用“N N”表示。对于一次抽样调查,全及总表示。对于一次抽样调查,全及总体是唯一确定的。体是唯一确定的。2.2.抽样总体。抽样总体简称样本或子样,它是指在全及总体抽样总体。抽样总体简称样本或子样
6、,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。中按随机原则抽取的那部分单位所构成的集合体。样本单位样本单位总数用总数用“n n”表示,亦称表示,亦称样本容量样本容量。一个全及总体可能抽出很多个样本总体,从一个全及总体中一个全及总体可能抽出很多个样本总体,从一个全及总体中可能抽取的样本数目称为样本个数。样本的个数和样本的容可能抽取的样本数目称为样本个数。样本的个数和样本的容量有关,也和抽样的方法有关。每次抽到哪个样本是不确定量有关,也和抽样的方法有关。每次抽到哪个样本是不确定的。一般地说,的。一般地说,n30n30为为大样本大样本,n n3030为为小样本小样本。在对社会。在对社
7、会经济现象进行抽样调查时,多数采用大样本。经济现象进行抽样调查时,多数采用大样本。(一一)全及总体和抽样总体全及总体和抽样总体返回三第7页,共150页,编辑于2022年,星期二(二二)总体指标总体指标总体指标也称为母体参数或全及指标,它是根据全及总体各单位总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。一确定的。平 均 指 标平 均 指 标标志变异指标标志
8、变异指标成数成数成数方差成数方差返回三第8页,共150页,编辑于2022年,星期二(二二)样本指标样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。标的数值也就不同,所以抽样指标的数值不是唯一确定的。平 均 指 标平 均 指 标标志变异指标标
9、志变异指标成数成数成数方差成数方差返回三第9页,共150页,编辑于2022年,星期二四、抽样调查的组织方式四、抽样调查的组织方式要保证抽样估计的准确性和可靠性,遵守要保证抽样估计的准确性和可靠性,遵守随机性原则和实随机性原则和实现最大的抽样效果原则现最大的抽样效果原则,事先必须结合具体研究对象的,事先必须结合具体研究对象的性质和调查工作的目的、条件,选择一定的抽样调查性质和调查工作的目的、条件,选择一定的抽样调查组织方式,做好抽样设计工作。组织方式,做好抽样设计工作。统计实践中主要采用以下抽样调查组织方式:统计实践中主要采用以下抽样调查组织方式:(一)(一)简单随机抽样简单随机抽样:直接抽取:
10、直接抽取(二)(二)类型抽样类型抽样:分类随机抽取样本:分类随机抽取样本(三)(三)等距抽样等距抽样:排列划分间隔抽取样本:排列划分间隔抽取样本(四)(四)整群抽样整群抽样:分群随机抽取样本群:分群随机抽取样本群第一节第10页,共150页,编辑于2022年,星期二 简简单单随随机机抽抽样样也也叫叫纯纯随随机机抽抽样样,它它对对总总体体单单位位不不作作任任何何分分类类排排队队,而而是是直直接接从从总总体体中中随随机机抽抽取取一一部部分分单单位来组成样本的抽样组织方式。位来组成样本的抽样组织方式。简简单单随随机机抽抽样样是是抽抽样样调调查查中中最最基基本本的的,也也是是最最单单纯纯的的方方式式,适
11、适合合于于总总体体各各部部分分都都具具有有相相同同的的分分布布且且单单位位数数较较少少的情况。的情况。简简单单随随机机抽抽样样的的具具体体方方法法有有:直直接接抽抽选选项项法法、抽抽签签法法、随机数字法、随机数字法、使用计算机模拟抽取。使用计算机模拟抽取。抽取调查单位的方法:抽取调查单位的方法:重复抽样重复抽样 不重复抽样不重复抽样(一一)简单随机抽样简单随机抽样返回四第11页,共150页,编辑于2022年,星期二重复(置)抽样重复(置)抽样重复抽样是从重复抽样是从N N个总体单位中抽取一个单位进行观察、纪录后,再放回总体个总体单位中抽取一个单位进行观察、纪录后,再放回总体中,然后再抽取下一个
12、单位,这样连续抽取中,然后再抽取下一个单位,这样连续抽取n n个单位组成样本的方法。个单位组成样本的方法。特点:每一次抽样时,总体都保持相同的单位数目特点:每一次抽样时,总体都保持相同的单位数目(N)(N)。每个总体单位被抽中的概率都相等每个总体单位被抽中的概率都相等(1/N 1/N)。每一个总体单位有可能被再次抽中,样本中的总每一个总体单位有可能被再次抽中,样本中的总 体单位会出现重复。体单位会出现重复。可能抽取的样本数目(样本个数):可能抽取的样本数目(样本个数):考虑顺序的抽样,是从总体考虑顺序的抽样,是从总体N N个单位中抽取个单位中抽取n n个单位构成样本,不个单位构成样本,不但要考
13、虑各单位的不同性质,而且还要考虑不同性质各单位的但要考虑各单位的不同性质,而且还要考虑不同性质各单位的中选顺序。相同构成成分的单位,由于顺序不同,也作为不同中选顺序。相同构成成分的单位,由于顺序不同,也作为不同的样本。样本数为:的样本。样本数为:不考虑顺序的抽样,是从总体不考虑顺序的抽样,是从总体N N个单位中抽取个单位中抽取n n个单位构成样本,只考虑样个单位构成样本,只考虑样本各单位的组成成分如何,而不问各单位的抽选顺序。如果样本的成分本各单位的组成成分如何,而不问各单位的抽选顺序。如果样本的成分相同,不论顺序有多大不同,也作为一种样本。样本数为:相同,不论顺序有多大不同,也作为一种样本。
14、样本数为:返回第12页,共150页,编辑于2022年,星期二不重复(置)抽样不重复(置)抽样不重复抽样是从不重复抽样是从N N个总体单位中抽取一个单位进行观察、纪录后,个总体单位中抽取一个单位进行观察、纪录后,不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取n n个单位组成样本的方法。个单位组成样本的方法。特点:每一次抽样时,总体的单位数比上一次少一个。特点:每一次抽样时,总体的单位数比上一次少一个。每一个总体单位被抽中的概率都不相同。每一个总体单位被抽中的概率都不相同。每一个可能样本中的总体单位不会出现重复。每一个可能样本中的总
15、体单位不会出现重复。考虑顺序的抽样样本数为:考虑顺序的抽样样本数为:不考虑顺序的抽样样本数为:不考虑顺序的抽样样本数为:实际工作中一般采用:实际工作中一般采用:考虑顺序的重复抽样考虑顺序的重复抽样 不考虑顺序的不重复抽样不考虑顺序的不重复抽样返回第13页,共150页,编辑于2022年,星期二类类型型抽抽样样又又称称分分类类抽抽样样或或分分层层抽抽样样,它它是是先先将将总总体体按按某某个个主主要要标标志志进进行行分分组组(或或分分类类),再再按按随随机机原原则则从从各各组组中中抽取样本单位的一种抽样方式。抽取样本单位的一种抽样方式。特特点点:分分层层抽抽样样在在层层内内是是抽抽样样调调查查,层层
16、间间是是全全面面调调查查。所所以以分分层层时时应应该该尽尽量量让让每每层层内内的的变变异异程程度度小小,而而层层间间的的变变异异程程度度大大。分分层层抽抽样样的的抽抽样误差较简单随机抽样小,样本具有很好的代表性。样误差较简单随机抽样小,样本具有很好的代表性。样本单位数在各组(层)之间的分配方法:样本单位数在各组(层)之间的分配方法:1 1、等等数数分分配配类类型型抽抽样样法法,适适用用各各组组单单位位数数相相同同或或差差异异不不大的情况。大的情况。2 2、等比例类型抽样法,各组抽样比例为:、等比例类型抽样法,各组抽样比例为:n/N n/N。3 3、不不等等比比例例类类型型抽抽样样法法(最最优优
17、分分配配法法),在在样样本本容容量量一一定定的的条条件件下下,变变异异大大的的或或单单位位数数多多的的组组样样本本容容量量也也大大,变变异异小的或单位数少的组样本容量也小。小的或单位数少的组样本容量也小。返回四(二二)类型抽样类型抽样第14页,共150页,编辑于2022年,星期二3、不等比例类型抽样法、不等比例类型抽样法各组抽样比例的计算:各组抽样比例的计算:i 为第为第i层(组)内的标准差;层(组)内的标准差;i 为第为第i层(组)内的单位数占总体单位数的层(组)内的单位数占总体单位数的比重。比重。i=返回第15页,共150页,编辑于2022年,星期二等等距距抽抽样样也也称称机机械械抽抽样样
18、或或系系统统抽抽样样,它它是是将将总总体体各各单单位位按按某某一一标标志志顺顺序序排排列列,然然后后按按固固定定顺顺序序和和相相等等距距离离或或间间隔隔抽抽取取样样本本单单位位的的抽样组织方式。抽样组织方式。顺序排列的标志:无关标志、有关标志。顺序排列的标志:无关标志、有关标志。无无关关标标志志:指指作作为为排排列列顺顺序序的的标标志志与与单单位位标标志志值值的的大大小小无无关关或或不不起起主主要要影影响响作作用用。如如:时时间间、地地理理位位置置、门门牌牌号号、姓姓氏氏笔画等。笔画等。有有关关标标志志:指指作作为为排排列列顺顺序序的的标标志志与与单单位位标标志志值值的的大大小小有有密密切切关
19、关系系。如如:农农业业产产量量调调查查按按平平均均亩亩产产量量高高低低排排序序,职职工工生生活水平调查按职工平均工资排队。活水平调查按职工平均工资排队。一一般般来来讲讲,有有关关标标志志排排序序要要比比无无关关标标志志排排序序的的机机械械抽抽样样更更为为优优越。越。第一个样本单位的抽取方法和抽样距离的计算如下:第一个样本单位的抽取方法和抽样距离的计算如下:(三三)等距抽样等距抽样返回四第16页,共150页,编辑于2022年,星期二第一个样本单位的抽取方法和抽样距离的计算第一个样本单位的抽取方法和抽样距离的计算第一个样本单位的抽取方法:第一个样本单位的抽取方法:若按无关标志排队,可以从第一个间隔
20、内的任意一若按无关标志排队,可以从第一个间隔内的任意一个单位开始抽取个单位开始抽取;若按有关标志排队若按有关标志排队,一般是从第一个间隔内居中的单一般是从第一个间隔内居中的单位开始抽取,亦可采用对称等距抽样的办法。位开始抽取,亦可采用对称等距抽样的办法。抽样距离(间隔):抽样距离(间隔):等距抽样示意图如下:等距抽样示意图如下:在排队时,要注意避免抽样间隔与现象本身的周期在排队时,要注意避免抽样间隔与现象本身的周期性节奏相重合。以减少系统偏差的影响,提高样性节奏相重合。以减少系统偏差的影响,提高样本的代表性。本的代表性。返回第17页,共150页,编辑于2022年,星期二等距抽样示意图等距抽样示
21、意图等距抽样的最大特点是:组织简单、易于实施。当按等距抽样的最大特点是:组织简单、易于实施。当按有关标志排队时,能保证样本单位在总体中均匀地分有关标志排队时,能保证样本单位在总体中均匀地分布,所抽样本对总体的代表性好,有利于降低抽样误布,所抽样本对总体的代表性好,有利于降低抽样误差。差。返回第18页,共150页,编辑于2022年,星期二整整群群抽抽样样也也称称集集团团抽抽样样、区区域域抽抽样样或或分分群群随随机机抽抽样样,它它是是将将总总体体各各单单位位按按时时间间或或空空间间形形式式划划分分成成许许多多群群,然然后后按按纯纯随随机机抽抽样样或或机机械械抽抽样样方方式式从从中中抽抽取取部部分分
22、群群,对对被被选选中群的所有单位进行全面调查的抽样组织方式。中群的所有单位进行全面调查的抽样组织方式。例例如如:某某水水泥泥厂厂大大量量连连续续生生产产100100公公斤斤装装水水泥泥,一一昼昼夜夜产产量量为为1440014400袋袋,平平均均每每分分钟钟产产量量1010袋袋。现现每每隔隔144144分分钟钟抽抽取取一一分分钟钟的的产产量量(10(10袋袋为为一一群群),一一昼昼夜夜共共抽抽取取100100袋袋水泥。水泥。如:如:500500箱某种药品,抽取箱某种药品,抽取1010箱进行检验,箱进行检验,1 1箱即为一群。箱即为一群。整群抽样时群的划分条件整群抽样时群的划分条件:(四四)整群抽
23、样整群抽样返回四第19页,共150页,编辑于2022年,星期二整群抽样时群的划分条件整群抽样时群的划分条件1 1、群与群之间没有单位重叠。、群与群之间没有单位重叠。2 2、总体中每一个单位都必须属于某一个群。、总体中每一个单位都必须属于某一个群。整群抽样在群内是全面调查,在群间是抽样调查。整群抽样在群内是全面调查,在群间是抽样调查。优点:易于组织且较节省调查费用。优点:易于组织且较节省调查费用。缺点:调查的总体单位过于集中在少数样本群中。缺点:调查的总体单位过于集中在少数样本群中。在相同条件下,样本代表性较低。在相同条件下,样本代表性较低。返回第20页,共150页,编辑于2022年,星期二第二
24、节第二节 抽样误差抽样误差一、一、抽样误差的概念抽样误差的概念二、二、影响抽样误差的主要因素影响抽样误差的主要因素三、三、抽样平均误差抽样平均误差返回提要第21页,共150页,编辑于2022年,星期二1 1、统计误差的种类、统计误差的种类统计误差是指统计数据与客观实际数量之间的差距。统计误差是指统计数据与客观实际数量之间的差距。(1 1)登登记记性性误误差差。指指在在调调查查、整整理理过过程程中中,由由于于各各种种主主客客观原因引起的登记性差错所造成的误差。观原因引起的登记性差错所造成的误差。(2 2)代代表表性性误误差差。指指由由于于样样本本单单位位的的结结构构情情况况不不足足以以代代表表总
25、体特征所产生的误差。总体特征所产生的误差。一、抽样误差的概念一、抽样误差的概念调调查查误误差差登记性误差:全面调查、非全面调查登记性误差:全面调查、非全面调查代表性误差代表性误差系统性误差:重点调查、典型调查系统性误差:重点调查、典型调查抽样(随机)误差:抽样调查抽样(随机)误差:抽样调查第二节第22页,共150页,编辑于2022年,星期二代表性误差代表性误差分两种:分两种:系统性误差:系统性误差:由于没有遵守随机原则而产生的误差。由于没有遵守随机原则而产生的误差。抽抽样样(随随机机性性)误误差差:即即使使遵遵守守了了随随机机原原则则,也也会会由由于于被被抽抽取取的的样样本本各各种种各各样样,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样推断幻灯片 抽样 推断 幻灯片
限制150内