统计学 抽样推断.ppt
抽样调查抽样调查第六章第六章内容提要内容提要第一节第一节 抽样调查的一般问题抽样调查的一般问题第二节第二节 抽样误差抽样误差第三节第三节 总体指标的推断总体指标的推断第四节第四节 必要抽样数目的确定必要抽样数目的确定第一节第一节 抽样调查的一般问题抽样调查的一般问题一一、抽样调查的概念抽样调查的概念二、二、抽样调查的作用抽样调查的作用三、三、抽样调查中的几个基本概念抽样调查中的几个基本概念四、四、抽样调查的组织方式抽样调查的组织方式返回提要返回提要(一一)抽样调查的概念抽样调查的概念 抽样调查又称抽样推断或抽样估计,它是从总体中按随机抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。总体数量特征的一种方法。(二二)抽样调查的主要特点:抽样调查的主要特点:(1)(1)按随机原则抽取调查单位。按随机原则抽取调查单位。(2)(2)由部分推断全体。由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。随机原则随机原则统计量统计量总体参数总体参数推断推断抽取抽取一、抽样调查的概念一、抽样调查的概念第一节第一节(1)(1)用于不可能进行全面调查的无限总体。用于不可能进行全面调查的无限总体。例如:连续大量生产的某种小件产品例如:连续大量生产的某种小件产品(2)(2)用于不可能进行全面调查而又需要了解全面情用于不可能进行全面调查而又需要了解全面情况的现象。况的现象。例如:带有破坏性或消耗性的产品质量检验,例如:带有破坏性或消耗性的产品质量检验,灯泡的使用寿命,烟、酒的检验等。灯泡的使用寿命,烟、酒的检验等。(3)(3)用于不必要进行全面调查的现象。用于不必要进行全面调查的现象。例如:水库中的鱼苗数、森林的木材面积等例如:水库中的鱼苗数、森林的木材面积等(4)(4)用于对全面调查的资料进行评价与修正。用于对全面调查的资料进行评价与修正。例如:人口普查需采用抽查进行复查,计算普查差错率。例如:人口普查需采用抽查进行复查,计算普查差错率。(5)(5)用于工业生产过程的质量控制。用于工业生产过程的质量控制。例如:对于成批或大量连续生产的产品生产过程,可及时例如:对于成批或大量连续生产的产品生产过程,可及时提供有关产品的质量信息,分析原因,采取措施,排除故提供有关产品的质量信息,分析原因,采取措施,排除故障,保证生产过程正常进行。障,保证生产过程正常进行。二、抽样调查的作用二、抽样调查的作用第一节第一节三、抽样调查中的几个基本概念三、抽样调查中的几个基本概念(一一)全及总体和抽样总体全及总体和抽样总体(二二)总体指标总体指标(三三)样本指标样本指标第一节第一节1.1.全及总体。全及总体简称总体或母体,它是指所要全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。调查研究对象的全体。总体单位总数用总体单位总数用“N”N”表示。对于一次抽样调查,全及表示。对于一次抽样调查,全及总体是唯一确定的。总体是唯一确定的。2.2.抽样总体。抽样总体简称样本或子样,它是指在全抽样总体。抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合及总体中按随机原则抽取的那部分单位所构成的集合体。体。样本单位总数用样本单位总数用“n”n”表示,亦称表示,亦称样本容量样本容量。一个全及总体可能抽出很多个样本总体,从一个全及一个全及总体可能抽出很多个样本总体,从一个全及总体中可能抽取的样本数目称为样本个数。样本的个总体中可能抽取的样本数目称为样本个数。样本的个数和样本的容量有关,也和抽样的方法有关。每次抽数和样本的容量有关,也和抽样的方法有关。每次抽到哪个样本是不确定的。一般地说,到哪个样本是不确定的。一般地说,n30n30为为大样本大样本,n n3030为为小样本小样本。在对社会经济现象进行抽样调查时,。在对社会经济现象进行抽样调查时,多数采用大样本。多数采用大样本。(一一)全及总体和抽样总体全及总体和抽样总体返回三返回三(二二)总体指标总体指标总体指标也称为母体参数或全及指标,它是根据全及总体总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。算的全及指标也是唯一确定的。平平 均均 指指 标标平平 均均 指指 标标标标志志变变异异指指标标标标志志变变异异指指标标成成数数成成数数成成数数方方差差成成数数方方差差返回三返回三(二二)样本指标样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。值不是唯一确定的。平平 均均 指指 标标平平 均均 指指 标标标标志志变变异异指指标标标标志志变变异异指指标标成成数数成成数数成成数数方方差差成成数数方方差差返回三返回三四、抽样调查的组织方式四、抽样调查的组织方式要保证抽样估计的准确性和可靠性,遵守要保证抽样估计的准确性和可靠性,遵守随机性原随机性原则和实现最大的抽样效果原则则和实现最大的抽样效果原则,事先必须结合具体,事先必须结合具体研究对象的性质和调查工作的目的、条件,选择一研究对象的性质和调查工作的目的、条件,选择一定的抽样调查组织方式,做好抽样设计工作。定的抽样调查组织方式,做好抽样设计工作。统计实践中主要采用以下抽样调查组织方式:统计实践中主要采用以下抽样调查组织方式:(一)(一)简单随机抽样简单随机抽样:直接抽取:直接抽取(二)(二)类型抽样类型抽样:分类随机抽取样本:分类随机抽取样本(三)(三)等距抽样等距抽样:排列划分间隔抽取样本:排列划分间隔抽取样本(四)(四)整群抽样整群抽样:分群随机抽取样本群:分群随机抽取样本群第一节第一节 简简单单随随机机抽抽样样也也叫叫纯纯随随机机抽抽样样,它它对对总总体体单单位位不不作作任任何何分分类类排排队队,而而是是直直接接从从总总体体中中随随机机抽抽取取一一部分单位来组成样本的抽样组织方式。部分单位来组成样本的抽样组织方式。简简单单随随机机抽抽样样是是抽抽样样调调查查中中最最基基本本的的,也也是是最最单单纯纯的的方方式式,适适合合于于总总体体各各部部分分都都具具有有相相同同的的分分布布且单位数较少的情况。且单位数较少的情况。简简单单随随机机抽抽样样的的具具体体方方法法有有:直直接接抽抽选选项项法法、抽签法、随机数抽签法、随机数字法、字法、使用计算机模拟抽取。使用计算机模拟抽取。抽取调查单位的方法:抽取调查单位的方法:重复抽样重复抽样 不重复抽样不重复抽样(一一)简单随机抽样简单随机抽样返回四返回四重复(置)抽样重复(置)抽样重复抽样是从重复抽样是从N N个总体单位中抽取一个单位进行观察、纪录后,个总体单位中抽取一个单位进行观察、纪录后,再放回总体中,然后再抽取下一个单位,这样连续抽取再放回总体中,然后再抽取下一个单位,这样连续抽取n n个个单位组成样本的方法。单位组成样本的方法。特点:每一次抽样时,总体都保持相同的单位数目特点:每一次抽样时,总体都保持相同的单位数目(N)(N)。每个总体单位被抽中的概率都相等每个总体单位被抽中的概率都相等(1/N 1/N)。每一个总体单位有可能被再次抽中,样本中的总每一个总体单位有可能被再次抽中,样本中的总 体单位会出现重复。体单位会出现重复。可能抽取的样本数目(样本个数):可能抽取的样本数目(样本个数):考虑顺序的抽样,是从总体考虑顺序的抽样,是从总体N N个单位中抽取个单位中抽取n n个单位构成样本,个单位构成样本,不但要考虑各单位的不同性质,而且还要考虑不同性质各单不但要考虑各单位的不同性质,而且还要考虑不同性质各单位的中选顺序。相同构成成分的单位,由于顺序不同,也作位的中选顺序。相同构成成分的单位,由于顺序不同,也作为不同的样本。样本数为:为不同的样本。样本数为:不考虑顺序的抽样,是从总体不考虑顺序的抽样,是从总体N N个单位中抽取个单位中抽取n n个单位构成样本,个单位构成样本,只考虑样本各单位的组成成分如何,而不问各单位的抽选顺只考虑样本各单位的组成成分如何,而不问各单位的抽选顺序。如果样本的成分相同,不论顺序有多大不同,也作为一序。如果样本的成分相同,不论顺序有多大不同,也作为一种样本。样本数为:种样本。样本数为:返回返回不重复(置)抽样不重复(置)抽样不重复抽样是从不重复抽样是从N N个总体单位中抽取一个单位进行观察、纪录个总体单位中抽取一个单位进行观察、纪录后,不放回总体中,在余下的总体中抽取下一个单位,这后,不放回总体中,在余下的总体中抽取下一个单位,这样连续抽取样连续抽取n n个单位组成样本的方法。个单位组成样本的方法。特点:每一次抽样时,总体的单位数比上一次少一个。特点:每一次抽样时,总体的单位数比上一次少一个。每一个总体单位被抽中的概率都不相同。每一个总体单位被抽中的概率都不相同。每一个可能样本中的总体单位不会出现重复。每一个可能样本中的总体单位不会出现重复。考虑顺序的抽样样本数为:考虑顺序的抽样样本数为:不考虑顺序的抽样样本数为:不考虑顺序的抽样样本数为:实际工作中一般采用:实际工作中一般采用:考虑顺序的重复抽样考虑顺序的重复抽样 不考虑顺序的不重复抽样不考虑顺序的不重复抽样返回返回类类型型抽抽样样又又称称分分类类抽抽样样或或分分层层抽抽样样,它它是是先先将将总总体体按按某某个个主主要要标标志志进进行行分分组组(或或分分类类),再再按按随随机机原原则则从各组中抽取样本单位的一种抽样方式。从各组中抽取样本单位的一种抽样方式。特特点点:分分层层抽抽样样在在层层内内是是抽抽样样调调查查,层层间间是是全全面面调调查查。所所以以分分层层时时应应该该尽尽量量让让每每层层内内的的变变异异程程度度小小,而而层层间间的的变变异异程程度度大。分层抽样的抽样误差较简单随机抽样小,样本具有很好的代表性。大。分层抽样的抽样误差较简单随机抽样小,样本具有很好的代表性。样本单位数在各组(层)之间的分配方法:样本单位数在各组(层)之间的分配方法:1 1、等等数数分分配配类类型型抽抽样样法法,适适用用各各组组单单位位数数相相同同或或差异不大的情况。差异不大的情况。2 2、等比例类型抽样法,各组抽样比例为:、等比例类型抽样法,各组抽样比例为:n/N n/N。3 3、不不等等比比例例类类型型抽抽样样法法(最最优优分分配配法法),在在样样本本容容量量一一定定的的条条件件下下,变变异异大大的的或或单单位位数数多多的的组组样样本本容量也大,变异小的或单位数少的组样本容量也小。容量也大,变异小的或单位数少的组样本容量也小。返回四返回四(二二)类型抽样类型抽样3、不等比例类型抽样法、不等比例类型抽样法各组抽样比例的计算:各组抽样比例的计算:i 为第为第i层(组)内的标准差;层(组)内的标准差;i 为第为第i层(组)内的单位数占总体单位数层(组)内的单位数占总体单位数的比重。的比重。i=返回返回等等距距抽抽样样也也称称机机械械抽抽样样或或系系统统抽抽样样,它它是是将将总总体体各各单单位位按按某某一一标标志志顺顺序序排排列列,然然后后按按固固定定顺顺序序和和相相等等距距离离或或间间隔隔抽抽取样本单位的抽样组织方式。取样本单位的抽样组织方式。顺序排列的标志:无关标志、有关标志。顺序排列的标志:无关标志、有关标志。无无关关标标志志:指指作作为为排排列列顺顺序序的的标标志志与与单单位位标标志志值值的的大大小小无无关关或或不不起起主主要要影影响响作作用用。如如:时时间间、地地理理位位置置、门门牌牌号号、姓氏笔画等。姓氏笔画等。有有关关标标志志:指指作作为为排排列列顺顺序序的的标标志志与与单单位位标标志志值值的的大大小小有有密密切切关关系系。如如:农农业业产产量量调调查查按按平平均均亩亩产产量量高高低低排排序序,职职工生活水平调查按职工平均工资排队。工生活水平调查按职工平均工资排队。一一般般来来讲讲,有有关关标标志志排排序序要要比比无无关关标标志志排排序序的的机机械械抽抽样样更更为优越。为优越。第一个样本单位的抽取方法和抽样距离的计算如下:第一个样本单位的抽取方法和抽样距离的计算如下:(三三)等距抽样等距抽样返回四返回四第一个样本单位的抽取方法和抽样距离的计算第一个样本单位的抽取方法和抽样距离的计算第一个样本单位的抽取方法:第一个样本单位的抽取方法:若按无关标志排队,可以从第一个间隔内的任意一若按无关标志排队,可以从第一个间隔内的任意一个单位开始抽取个单位开始抽取;若按有关标志排队若按有关标志排队,一般是从第一个间隔内居中的一般是从第一个间隔内居中的单位开始抽取,亦可采用对称等距抽样的办法。单位开始抽取,亦可采用对称等距抽样的办法。抽样距离(间隔):抽样距离(间隔):等距抽样示意图等距抽样示意图如下:如下:在排队时,要注意避免抽样间隔与现象本身的周期在排队时,要注意避免抽样间隔与现象本身的周期性节奏相重合。以减少系统偏差的影响,提高样性节奏相重合。以减少系统偏差的影响,提高样本的代表性。本的代表性。返回返回等距抽样示意图等距抽样示意图等距抽样的最大特点是:组织简单、易于实施。等距抽样的最大特点是:组织简单、易于实施。当按有关标志排队时,能保证样本单位在总体中当按有关标志排队时,能保证样本单位在总体中均匀地分布,所抽样本对总体的代表性好,有利均匀地分布,所抽样本对总体的代表性好,有利于降低抽样误差。于降低抽样误差。返回返回整整群群抽抽样样也也称称集集团团抽抽样样、区区域域抽抽样样或或分分群群随随机机抽抽样样,它它是是将将总总体体各各单单位位按按时时间间或或空空间间形形式式划划分分成成许许多多群群,然然后后按按纯纯随随机机抽抽样样或或机机械械抽抽样样方方式式从从中中抽抽取取部部分分群群,对对被被选选中中群群的的所所有有单单位位进进行行全全面面调调查查的的抽抽样样组组织织方方式。式。例例如如:某某水水泥泥厂厂大大量量连连续续生生产产100100公公斤斤装装水水泥泥,一一昼昼夜夜产产量量为为1440014400袋袋,平平均均每每分分钟钟产产量量1010袋袋。现现每每隔隔144144分分钟钟抽抽取取一一分分钟钟的的产产量量(10(10袋袋为为一一群群),一一昼昼夜共抽取夜共抽取100100袋水泥。袋水泥。如如:500500箱箱某某种种药药品品,抽抽取取1010箱箱进进行行检检验验,1 1箱箱即即为为一群。一群。整群抽样时群的划分条件整群抽样时群的划分条件:(四四)整群抽样整群抽样返回四返回四整群抽样时群的划分条件整群抽样时群的划分条件1 1、群与群之间没有单位重叠。、群与群之间没有单位重叠。2 2、总体中每一个单位都必须属于某一个群。、总体中每一个单位都必须属于某一个群。整群抽样在群内是全面调查,在群间是抽样调查。整群抽样在群内是全面调查,在群间是抽样调查。优点:易于组织且较节省调查费用。优点:易于组织且较节省调查费用。缺点:调查的总体单位过于集中在少数样本群中。缺点:调查的总体单位过于集中在少数样本群中。在相同条件下,样本代表性较低。在相同条件下,样本代表性较低。返回返回第二节第二节 抽样误差抽样误差一、一、抽样误差的概念抽样误差的概念二、二、影响抽样误差的主要因素影响抽样误差的主要因素三、三、抽样平均误差抽样平均误差返回提要返回提要1 1、统计误差的种类、统计误差的种类统计误差是指统计数据与客观实际数量之间的差距。统计误差是指统计数据与客观实际数量之间的差距。(1 1)登登记记性性误误差差。指指在在调调查查、整整理理过过程程中中,由由于于各各种种主客观原因引起的登记性差错所造成的误差。主客观原因引起的登记性差错所造成的误差。(2 2)代代表表性性误误差差。指指由由于于样样本本单单位位的的结结构构情情况况不不足足以以代表总体特征所产生的误差。代表总体特征所产生的误差。一、抽样误差的概念一、抽样误差的概念调调查查误误差差登记性误差:全面调查、非全面调查登记性误差:全面调查、非全面调查代表性误差代表性误差系统性误差:重点调查、典型调查系统性误差:重点调查、典型调查抽样(随机)误差:抽样调查抽样(随机)误差:抽样调查第二节第二节代表性误差代表性误差分两种:分两种:系统性误差:系统性误差:由于没有遵守随机原则而产生的误差。由于没有遵守随机原则而产生的误差。抽抽样样(随随机机性性)误误差差:即即使使遵遵守守了了随随机机原原则则,也也会会由由于于被被抽抽取取的的样样本本各各种种各各样样,导导致致样样本本内内部部各各单单位位的的分分布布比比例例结结构构与与总总体体实实际际分分布布状状况况有有偶偶然然性性的的差差异异,从从而而使使不不同同的的随随机机样样本本得得出出不不同同的的估估计计量量,造造成成样样本本指指标标数数值值与与总总体体指指标数值之间产生差距标数值之间产生差距。又分。又分实际误差和平均误差两种:实际误差和平均误差两种:实际误差:某一样本指标与总体指标之间的差异;实际误差:某一样本指标与总体指标之间的差异;如:样本平均数与总体平均数之间的离差如:样本平均数与总体平均数之间的离差 样本成数与总体成数之间的离差样本成数与总体成数之间的离差平均误差:所有可能出现的样本指标与总体指标的平均误差:所有可能出现的样本指标与总体指标的 平均离差。平均离差。返回一返回一(一一)样本单位数样本单位数(样本容量样本容量n)n)的多少的多少 样本容量越大,误差就越小;样本容量越大,误差就越小;样本容量越小,误差就越大。样本容量越小,误差就越大。(二二)总体被研究标志变异程度总体被研究标志变异程度(总体方差总体方差)的大小的大小 标志变异程度越大,误差就越大;标志变异程度越大,误差就越大;标志变异程度越小,误差就越小。标志变异程度越小,误差就越小。(三三)抽样调查的组织形式抽样调查的组织形式 类型抽样的平均误差较小。类型抽样的平均误差较小。(四四)抽样方法抽样方法重复抽样的平均误差大于不重复抽样的平均误差。重复抽样的平均误差大于不重复抽样的平均误差。二、影响抽样误差的主要因素二、影响抽样误差的主要因素第二节第二节(一一)抽样平均误差的概念抽样平均误差的概念(二二)计算抽样平均误差的理论公式计算抽样平均误差的理论公式(三三)抽样平均误差的计算方法抽样平均误差的计算方法(四四)其他抽样组织方式抽样平均误差的计算方法其他抽样组织方式抽样平均误差的计算方法第二节第二节三、抽样平均误差三、抽样平均误差由由于于样样本本是是按按随随机机原原则则抽抽取取的的,在在同同一一总总体体中中,按按相相同同的的抽抽样样数数目目,可可以以抽抽取取许许多多相相同同和和不不同同的的样样本本,每每次次抽抽取取的的样样本本都都可可以以计计算算出出相相应应的的抽抽样样平平均均数数、抽抽样样成成数数和和抽抽样样误误差差,即即从从理理论论上上可可以以计计算算出出很很多多个个抽抽样样误误差差,它它们们带带有有偶偶然然性性,有有的的可可能能是是正正误误差差,有有的的可可能能是是负负误误差差,为为了了用用样样本本指指标标推推算算总总体体指指标标,需需计计算算这些抽样误差的平均数。这些抽样误差的平均数。抽抽样样平平均均误误差差是是指指以以全全部部可可能能样样本本指指标标为为变变量量,以以总总体体指指标标为为平平均均数数计计算算得得到到的的标标准准差差,以以符符号号 表表示示,通通常常以以 代代表表平平均均数数的的抽抽样样平平均均误误差差,以以 代代表表成成数的抽样平均误差,以数的抽样平均误差,以K K 代表可能组成的样本总数。代表可能组成的样本总数。(一一)抽样平均误差的概念抽样平均误差的概念返回三返回三根据抽样平均误差的概念可得其一般计算公式:根据抽样平均误差的概念可得其一般计算公式:见例题:见例题:重复抽样重复抽样和和不重复抽样不重复抽样(二二)计算抽样平均误差的理论公式计算抽样平均误差的理论公式返回三返回三重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布某班组某班组5 5个工人的日工个工人的日工资为资为3434、3838、4242、4646、5050元。元。现用重置抽样的方法现用重置抽样的方法从从5 5人中随机抽人中随机抽2 2个构个构成样本。共有成样本。共有5 52 2=25=25个个样本。如样本。如右图右图。重置抽样平均数的平均误差重置抽样平均数的平均误差返回返回不重置抽样平均数的平均误差不重置抽样平均数的平均误差返回返回例例假假设设有有10,20,3010,20,30和和4040四四个个数数字字组组成成一一个个总总体体,从中随机抽取两个数字作为样本,求抽样平均误差。从中随机抽取两个数字作为样本,求抽样平均误差。返回返回(三三)抽样平均误差的计算方法抽样平均误差的计算方法1.1.平均数的抽样平均误差。平均数的抽样平均误差。2.2.成数的抽样平均误差成数的抽样平均误差(1)(1)重复抽样条件下:重复抽样条件下:(2)(2)不重复抽样条件下:不重复抽样条件下:当当N N很大时,很大时,例例1 1,例例2 2 返回三返回三例例1 1 某仪表厂生产某种型号的精密仪表,按正常生产经某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为验,产品合格率为85%85%。今按简单随机抽样方式从。今按简单随机抽样方式从800800只仪表中只仪表中抽取抽取10%10%进行检验,求合格品比率的抽样平均误差。进行检验,求合格品比率的抽样平均误差。在重复条件下:在重复条件下:在不重复条件下:在不重复条件下:返回返回例例2 2某大学有某大学有45004500名学生,采用不重复简单随机名学生,采用不重复简单随机抽样方式从中抽取抽样方式从中抽取10%10%的学生,调查其每月生活费用的学生,调查其每月生活费用支出情况。抽样结果显示,学生平均每人每月生活费支出情况。抽样结果显示,学生平均每人每月生活费支出支出350350元,标准差元,标准差8080元,生活费用支出在元,生活费用支出在500500元以上元以上的学生占全部学生的的学生占全部学生的20%20%。试求抽样平均误差。试求抽样平均误差。返回返回(四四)其他抽样组织方式抽样平均误差的计算方法其他抽样组织方式抽样平均误差的计算方法1.1.类型(分层)抽样平均误差的计算。类型(分层)抽样平均误差的计算。2.2.等距抽样平均误差的计算。等距抽样平均误差的计算。3.3.整群抽样平均误差的计算。整群抽样平均误差的计算。返回三返回三1.1.类型类型(分层)抽样平均误差的计算(分层)抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差,(2)(2)成数的抽样平均误差成数的抽样平均误差 重复抽样条件下:重复抽样条件下:不重复抽样条件下:不重复抽样条件下:其中:其中:和和 的的计算计算 例题例题 返回返回其中:其中:和和 第第i组的总体方差组的总体方差第第i组的总体成数组的总体成数第第i组的总体单位数组的总体单位数返回返回类型(分层)抽样平均误差的计算类型(分层)抽样平均误差的计算 例题例题 某县某种农作物产量的调查见下表:某县某种农作物产量的调查见下表:返回返回2.等距抽样平均误差的计算等距抽样平均误差的计算若总体单位按无关标志排队,其抽样误差十分接若总体单位按无关标志排队,其抽样误差十分接近简单随机抽样的误差,可以用近简单随机抽样的误差,可以用简单随机抽样简单随机抽样的的平均抽样误差公式近似计算。平均抽样误差公式近似计算。若总体单位按有关标志排队,其抽样平均误差可若总体单位按有关标志排队,其抽样平均误差可以用以用类型抽样类型抽样的平均抽样误差公式计算其近似值。的平均抽样误差公式计算其近似值。返回返回3.3.整群抽样平均误差的计算。整群抽样平均误差的计算。(1)(1)平均数的抽样平均误差平均数的抽样平均误差 (2)(2)成数的抽样平均误差成数的抽样平均误差 例题例题 返回返回其中:其中:为平均数的群间方差为平均数的群间方差 为成数的群间方差为成数的群间方差r r 为样本群数为样本群数R R 为总体群数为总体群数例题某商店购进例题某商店购进300300箱(箱(5050只只/箱)苹果随机抽取箱)苹果随机抽取1%1%检查其质量。见下表:检查其质量。见下表:返回返回计算样本平均数群间方差、成数群间方差:计算样本平均数群间方差、成数群间方差:计算抽样平均误差:计算抽样平均误差:返回返回第三节第三节 总体指标的推断总体指标的推断总体指标的推断是指对总体平均数总体指标的推断是指对总体平均数 和总体成数和总体成数P P 的推断估计的问题。抽样调查的直接目的,就是的推断估计的问题。抽样调查的直接目的,就是为了推断为了推断 和和 P P,然后,再结合总体单位数,然后,再结合总体单位数N N去推算总体的有关标志总量。去推算总体的有关标志总量。总体指标的推断方法:总体指标的推断方法:一、一、点估计点估计 二、二、区间估计区间估计 三、三、总体参数区间估计的方法总体参数区间估计的方法返回提要返回提要一、点估计一、点估计点点估估计计也也称称定定值值估估计计,它它是是以以抽抽样样得得到到的的样样本本指指标标作作为为总总体体指指标标的的估估计计量量,并并以以样样本本指指标标的的实实际际值值(,p p)直直接接作作为为总总体体未未知知参参数数 ()的的估估计计值值的的一种推断方法。一种推断方法。即:即:例例:点估计的评判标准点估计的评判标准第三节第三节例如,对一批某种型号的电子元件例如,对一批某种型号的电子元件2000020000只进只进行耐用时间检查,随机抽取行耐用时间检查,随机抽取100100只,测试的平只,测试的平均耐用时间为均耐用时间为10551055小时小时()(),合格率,合格率为为91%()91%(),我们推断说,我们推断说2000020000只电子元只电子元件总体的平均耐用时间为件总体的平均耐用时间为10551055小时小时(),全部电子元件的合格率也是),全部电子元件的合格率也是91%91%()。点估计方法简单,但不很实用。因为,抽样点估计方法简单,但不很实用。因为,抽样估计中抽样指标完全等于全及指标的可能性估计中抽样指标完全等于全及指标的可能性极小,不能提供估计误差的信息。极小,不能提供估计误差的信息。返回返回估计量的评判标准:估计量的评判标准:根据不同样本数据或用不同的方法来估计同一总根据不同样本数据或用不同的方法来估计同一总体参数,可能会得到不同的估计量。但哪一个估体参数,可能会得到不同的估计量。但哪一个估计量更好一些,其评判通常采用以下标准:计量更好一些,其评判通常采用以下标准:1.1.一致性一致性2.2.无偏性无偏性3.3.有效性。有效性。返回返回1.1.一致性一致性设设 为未知参数为未知参数的估计量,当的估计量,当nn时,要时,要求求 按概率收敛于按概率收敛于,即,即则称则称 是是的满足一致性标准要求的估计量。样的满足一致性标准要求的估计量。样本平均数本平均数 和样本成数和样本成数 p 作为总体平均数作为总体平均数 和和总体成数总体成数 的估计量就满足一致性的准则要求,的估计量就满足一致性的准则要求,即随着即随着n越来越大,越来越大,接近接近 的概率越来的概率越来越大。越大。返回返回2.2.无偏性无偏性若要求估计量若要求估计量 的数学期望等于未的数学期望等于未知参数的真值知参数的真值,即,即则称则称 是是的无偏估计量的无偏估计量返回返回3.3.有效性有效性无偏性只考虑估计量的平均结果是否等于待无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。与待估参数真值之间的偏差尽可能地小。设设 ,为为的两个无偏估计量,若的两个无偏估计量,若 的方差小于的方差小于 的方差,即的方差,即则称则称 是较是较 有效的估计量。有效的估计量。返回返回区间估计就是以一定的概率保证估计包含总体参数的区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体一个值域,即根据样本指标和抽样平均误差推断总体指标的指标的可能范围可能范围。根据数理统计证明,总体单位的标志值如果是正态分根据数理统计证明,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布的;如果总体布,其全部可能样本也一定是正态分布的;如果总体单位的标志值不是正态分布的,只要是大样本单位的标志值不是正态分布的,只要是大样本(即即n30)n30),全部可能样本指标也会接近正态分布。,全部可能样本指标也会接近正态分布。从正从正态分布图中,可以总结两个特点:一是样本指标高于态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样本或低于总体指标的概率分布完全是对称的;二是样本指标接近于总体指标的概率越大指标接近于总体指标的概率越大(小小),出现的可能性,出现的可能性也越大也越大(小小)。第三节第三节二、区间估计二、区间估计图图82 82 正态分布曲线图正态分布曲线图图图83 83 样本指标置信度图样本指标置信度图 误差范围误差范围 与概率度与概率度(t)(t)和抽样平均误差和抽样平均误差 三者之间的关系为:三者之间的关系为:又称为:极限抽样误差或允许误差又称为:极限抽样误差或允许误差 由此得到平均数和成数的误差范围公式:由此得到平均数和成数的误差范围公式:抽样估计的概率保证程度(可靠程度、置信度)抽样估计的概率保证程度(可靠程度、置信度)与概率度与概率度(t)(t)是函数关系,编有是函数关系,编有“正态分布概率表正态分布概率表”进而得到总体平均指标和总体成数指标的区间进而得到总体平均指标和总体成数指标的区间估计公式为:估计公式为:三、总体参数区间估计的方法三、总体参数区间估计的方法(一)根据给定的抽样误差范围,求概率保证程度(一)根据给定的抽样误差范围,求概率保证程度分析步骤:分析步骤:1 1、抽取样本,计算抽样指标。、抽取样本,计算抽样指标。2 2、根据给定的极限误差范围估计总体、根据给定的极限误差范围估计总体 参数的上限和下限。参数的上限和下限。3 3、计算概率度、计算概率度(t)(t)。4 4、查表求出概率、查表求出概率F F(t t),并对总体),并对总体 参数作出区间估计。参数作出区间估计。【例例3 3】第三节第三节分析步骤分析步骤:1 1、抽取样本,计算样本指标。、抽取样本,计算样本指标。2 2、根据给定的、根据给定的F F(t t)查表求得概率度查表求得概率度 t t。3 3、根据概率度和抽样平均误差计算极限误差。、根据概率度和抽样平均误差计算极限误差。4 4、计算被估计值的上、下限,对总体参、计算被估计值的上、下限,对总体参数作出区间估计。数作出区间估计。例一例一例二例二 返回三返回三(二)根据给定的概率(二)根据给定的概率F F(t t),推算抽样极限),推算抽样极限误差的可能范围误差的可能范围例例 题题 一一某农场进行小麦产量抽样调查,小麦播种总面某农场进行小麦产量抽样调查,小麦播种总面积为积为1 1万亩,采用不重复简单随机抽样,从中抽万亩,采用不重复简单随机抽样,从中抽选了选了100100亩作为样本进行实割实测,测得样本平亩作为样本进行实割实测,测得样本平均亩产均亩产400400斤,方差斤,方差144144斤。斤。以以95.45%95.45%的可靠性推断该农场小麦平均亩产可的可靠性推断该农场小麦平均亩产可能在多少斤之间?能在多少斤之间?已知:已知:N=10000 n=100 t=2例题一解:1、计算抽样平均误差、计算抽样平均误差2 2、计算抽样极限误差、计算抽样极限误差3 3、计算总体平均数的置信区间、计算总体平均数的置信区间上限:上限:下限:下限:即:以即:以95.45%的可靠性估计该农场小麦平均亩的可靠性估计该农场小麦平均亩产量在产量在397.62斤至斤至402.38斤之间斤之间.返回返回 某纱厂某时期内生产了某纱厂某时期内生产了1010万个单位的纱,按纯随万个单位的纱,按纯随机抽样方式抽取机抽样方式抽取20002000个单位检验,检验结果合格率为个单位检验,检验结果合格率为95%95%,废品率为,废品率为5%5%,试以,试以95%95%的把握程度,估计全部纱的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?合格品率的区间范围及合格品数量的区间范围?已知:已知:区间下限:区间下限:区间上限:区间上限:例例 题题 二:二:返回返回返回返回例三、对某型号的电子元件进行耐用性能检查,抽查的例三、对某型号的电子元件进行耐用性能检查,抽查的资料分组列表如下,要求耐用时数的允许误差范围资料分组列表如下,要求耐用时数的允许误差范围 小时,试估计该批电子元件的平均耐用时数。小时,试估计该批电子元件的平均耐用时数。解:解:1 1、计算样本平均数、计算样本平均数2 2、计算标准差、计算标准差3 3、抽样平均误差、抽样平均误差4 4、根据给定的误差范围、根据给定的误差范围 小时,计算置信小时,计算置信区间,区间,返回返回例三解例三解1:例三解例三解1:5、计算、计算“t”值。求得置信度值。求得置信度F(t)6 6、做出区间估计。以概率为、做出区间估计。以概率为95.45%95.45%的保证的保证程度,该批电子元件的耐用时数在程度,该批电子元件的耐用时数在1045104510661066小时之间小时之间返回返回第四节第四节 必要抽样数目的确定必要抽样数目的确定一、一、影响抽样数目的主要因素影响抽样数目的主要因素二、二、确定抽样数目的方法确定抽样数目的方法返回提要返回提要一、影响抽样数目的主要因素一、影响抽样数目的主要因素(一一)总体被研究标志的变异程度(总体被研究标志的变异程度()方差大,抽样数目应多一些,反之则应少一些。方差大,抽样数目应多一些,反之则应少一些。(二二)对推断精确度的要求对推断精确度的要求 精确度的要求高,允许误差精确度的要求高,允许误差小,小,抽样数目多。抽样数目多。精确度的要求低,允许误差精确度的要求低,允许误差大,大,抽样数目少。抽样数目少。(三三)对推断可靠性的要求对推断可靠性的要求 要求可靠程度高,概率度要求可靠程度高,概率度t t大,抽样数目多。大,抽样数目多。要求可靠程度低,概率度要求可靠程度低,概率度t t小,抽样数目少。小,抽样数目少。(四四)抽样调查的组织方式和方法抽样调查的组织方式和方法机机械械、类类型型抽抽样样的的抽抽样样数数目目可可少少一一些些,纯纯随随机机、整整群群抽抽样样的的抽抽样样数数目目可可多多一一些些,不不重重复复抽抽样样的的抽抽样样数数目目可可少一些。少一些。(五五)人力、物力和财力的允许条件人力、物力和财力的允许条件第四节第四节重重 复复 抽抽 样样重重 复复 抽抽 样样不不重重复复抽抽样样不不重重复复抽抽样样推推断断总总体体平平均均推推断断总总体体平平均均数数所所需需的的样样本本数数所所需需的的样样本本单单位位数数单单位位数数推推断断总总体体成成数数推推断断总总体体成成数数所所需需的的样样本本单单所所需需的的样样本本单单位位数数位位数数二、确定抽样数目的方法二、确定抽样数目的方法参数说明:例1 例2第四节第四节参数说明参数说明:(1)(1)在实际工作中,由于抽样比例一般较小(即在实际工作中,由于抽样比例一般较小(即n/N的值很小的值很小),虽然采用的是不重复抽样,但仍,虽然采用的是不重复抽样,但仍按重复抽样的公式计算必要的抽样数目;按重复抽样的公式计算必要的抽样数目;(2)(2)公式中的公式中的2和和P一般都未知,也没有样本数据一般都未知,也没有