第七章 统计 抽样推断.ppt
《第七章 统计 抽样推断.ppt》由会员分享,可在线阅读,更多相关《第七章 统计 抽样推断.ppt(102页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二节第二节 总体和样本总体和样本第五节第五节 抽样设计抽样设计第七章第七章 抽样推断抽样推断第一节第一节 抽样推断概述抽样推断概述 第三节:点估计和抽样平均误差第三节:点估计和抽样平均误差 第四节:抽样分布和区间估计第四节:抽样分布和区间估计第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主指样本单位的抽取不受主观因素及其他系统性因素观因素及其他系统性因素的影响,每个总体单位都的影响,每个总体单位都有均等的被抽中机会有均等的被抽中机会一一、抽样推断抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一从全部研究对象中抽取一部分单位进行调查,并以调查结果对总部分单位进行调查,并以
2、调查结果对总体数量特征作出具有一定可靠程度的估体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方计与推断,从而认识总体的一种统计方法。法。统计推断统计推断总体指标:总体指标:参数参数(未知量)(未知量)样本总体指标:样本总体指标:统统计量(已知量计量(已知量)抽样推断抽样推断欲了解某湖中鱼的总产量,如果湖中有欲了解某湖中鱼的总产量,如果湖中有N条鱼,条鱼,平均每条鱼的重量为平均每条鱼的重量为 kg,湖中鱼的总产量,湖中鱼的总产量就为就为N kg.但由于不方便在湖中进行全面调查,因此,总但由于不方便在湖中进行全面调查,因此,总产量也是未知的,这可以通过抽样来估计。产量也是未知的
3、,这可以通过抽样来估计。例例1 对湖中鱼产量的估计。对湖中鱼产量的估计。首先,为了便于抽样,需要对总体做一下处首先,为了便于抽样,需要对总体做一下处理。在湖面上均匀地打捞出若干网鱼,假设共理。在湖面上均匀地打捞出若干网鱼,假设共有有N1条,将它们做上记号后重新扔回湖中。这条,将它们做上记号后重新扔回湖中。这样就可以从湖中进行抽样了,重复刚才的做法,样就可以从湖中进行抽样了,重复刚才的做法,再次从湖中均匀地打捞出若干网鱼,假设共有再次从湖中均匀地打捞出若干网鱼,假设共有n条,这条,这n条就构成了一个样本。条就构成了一个样本。一般而言,这一般而言,这n条鱼会有一部分有记号,设其条鱼会有一部分有记号
4、,设其为为n1条,另外一部分则没有记号,它必然为条,另外一部分则没有记号,它必然为n-n1条,样本中有记号的鱼所占的比重条,样本中有记号的鱼所占的比重(记作记作p)为为n1/n.可以这样去推理:鱼在湖中的游动具有一定可以这样去推理:鱼在湖中的游动具有一定的随机性质,如果网是均匀撒出的,则打捞出的的随机性质,如果网是均匀撒出的,则打捞出的鱼应当对湖中整个的鱼具有较好的代表性。整个鱼应当对湖中整个的鱼具有较好的代表性。整个湖中有记号的鱼所占的比重湖中有记号的鱼所占的比重(记为记为P)N1/N虽然未知,虽然未知,但可以通过有记号的鱼所占的比重但可以通过有记号的鱼所占的比重n1/n去估计,去估计,即即
5、于是,整个湖中鱼的总数目于是,整个湖中鱼的总数目N的点估计就是的点估计就是同上,如果将样本中同上,如果将样本中n条鱼的平均重量计算出条鱼的平均重量计算出来,记为来,记为 ,它就可以作为湖中全部鱼的平,它就可以作为湖中全部鱼的平均重量均重量 的估计量,则湖中鱼产量的点估计的估计量,则湖中鱼产量的点估计量为量为例例2 某工厂生产了一批产品,共某工厂生产了一批产品,共10000件,须经件,须经检验后方可出厂,按规定次品率不得超过检验后方可出厂,按规定次品率不得超过3。现从中抽取现从中抽取100件产品,结果发现有件产品,结果发现有5件次品,问件次品,问这批产品能否投入市场?这批产品能否投入市场?统计假
6、设统计假设 H0:很明显样本很明显样本100件产品的实际次品率高于规定的件产品的实际次品率高于规定的要求,高出要求,高出2。高出的。高出的2是由于什么原因造是由于什么原因造成的呢?成的呢?深入考察就会发现有两种可能性:一种情况是该深入考察就会发现有两种可能性:一种情况是该批批10000件产品的次品率超过件产品的次品率超过3,高出的,高出的2是是由于选取由于选取100件产品的随机性而造成的;另一种件产品的随机性而造成的;另一种情况是情况是10000件产品的次品率不符合要求,样本件产品的次品率不符合要求,样本的次品率高出原来的假设不是偶然的或随机的,的次品率高出原来的假设不是偶然的或随机的,而是有
7、其内在的、必然的系统性原因。而是有其内在的、必然的系统性原因。随机原则的实现随机原则的实现抽签法抽签法是将总体中每个单位的是将总体中每个单位的是将总体中每个单位的是将总体中每个单位的编号编号编号编号写在外形完全写在外形完全写在外形完全写在外形完全一致的签上,将其搅拌均匀,从中任意抽一致的签上,将其搅拌均匀,从中任意抽一致的签上,将其搅拌均匀,从中任意抽一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单选,签上的号码所对应的单位就是样本单选,签上的号码所对应的单位就是样本单选,签上的号码所对应的单位就是样本单位。位。位。位。随机数表法随机数表法将总体中每个单位将总体中每个单
8、位将总体中每个单位将总体中每个单位编上号码编上号码编上号码编上号码,然后使,然后使,然后使,然后使用随机数表,查出所要抽取的调查单用随机数表,查出所要抽取的调查单用随机数表,查出所要抽取的调查单用随机数表,查出所要抽取的调查单位。位。位。位。计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算计算计算计算机机机机中,需要时将总体中各单位编上号中,需要时将总体中各单位编上号中,需要时将总体中各单位编上号中,需要时将总体中各单位编上号码,启用码,启用码,启用码,启用随机数字发生器随机数字发生器随机数字发生器随机
9、数字发生器输出随机数输出随机数输出随机数输出随机数字,然后从总体中找到相应总体单位字,然后从总体中找到相应总体单位字,然后从总体中找到相应总体单位字,然后从总体中找到相应总体单位形成样本。形成样本。形成样本。形成样本。二、特点:二、特点:1、样本单位是按随机原则抽取的、样本单位是按随机原则抽取的2、抽样推断是一种从数量上由部分推断总体、抽样推断是一种从数量上由部分推断总体 的研究方法的研究方法3、抽样推断是采用概率估计的方法、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制、抽样推断的误差可以事先计算并加以控制 与全面调查相比,抽样调查既节省了人力、与全面调查相比,抽样调
10、查既节省了人力、物力、财力和时间,又达到了认识总体数量特物力、财力和时间,又达到了认识总体数量特征的目的。征的目的。我国在我国在19941994年确立了以周期性普查年确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之为基础,以经常性抽样调查为主体,同时辅之以以重点调查、科学核算等综合运用的统计调查重点调查、科学核算等综合运用的统计调查方法体系。方法体系。三、优点:三、优点:1、更科学、更科学2、更经济、更经济3、时效性强、时效性强 4、应用广、应用广四、抽样推断的应用四、抽样推断的应用(1)调查具有破坏性的场合)调查具有破坏性的场合(2)对无限总体或总体规模非常大的场合)对无限总体或总
11、体规模非常大的场合 进行调查进行调查(3)不必要进行全面调查但又需要知道)不必要进行全面调查但又需要知道 总体的全面情况时总体的全面情况时(4)对全面调查的结果进行核查和修正)对全面调查的结果进行核查和修正(5)对资料时效性要求很强的场合)对资料时效性要求很强的场合 q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用抽样推断的理论基础抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均
12、结果具有具有稳定性稳定性的性的性质。质。大数定律论证了如果独立随机变量总体大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的存在有限的平均数和方差,则对于充分大的样本可以近乎样本可以近乎100%100%的概率,期望样本平均的概率,期望样本平均数与总体平均数的绝对离差数与总体平均数的绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方如果变量总体存在有限的平均数和方差,那么不论这差,那么不论这个总体的分布如何,个总体的分布如何,随着样本容量的增加,样本平均数的随着样本容量的增加,样本平均数的分布,便趋近于分布,便趋近于正态分布正态分布。按照总体所包含总体单位个数的多
13、少,可按照总体所包含总体单位个数的多少,可以分为有限总体和无限总体。以分为有限总体和无限总体。第二节第二节 总体和样本总体和样本 按照按照样样本本单单位的来源不同,可将位的来源不同,可将总总体分体分为为目目标总标总体和抽体和抽样总样总体体。(一一)总体总体一、总体和总体指标一、总体和总体指标目标总体目标总体抽样总体抽样总体是所要认识研究对象的全体,它由具是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。有某种共同性质或特征的单位所组成。常用常用N表示全及总体的单位数目。表示全及总体的单位数目。是指从中抽取样本的总体,亦即样本是指从中抽取样本的总体,亦即样本单位实际来源的总体。单
14、位实际来源的总体。根据总体各个单位的标志值或标志根据总体各个单位的标志值或标志特征所计算的反映总特征所计算的反映总体某种属性的体某种属性的综合指标综合指标,又称,又称总体参数总体参数。总体指标总体指标设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则(二二)主要的总体指标主要的总体指标 总体平均数(又叫总体均值):总体平均数(又叫总体均值):或记作:或记作:总体单位标志值的标准差:总体单位标志值的标准差:总体单位标志值的方差总体单位标志值的方
15、差:总体成数:总体成数:6.总体是非标志的标准差:总体是非标志的标准差:7.总体是非标志的方差:总体是非标志的方差:5.总体是非标志的平均数:总体是非标志的平均数:(一一)样本样本二、样本和样本指标二、样本和样本指标又称子样,是指从总体中按照随机原则抽取的又称子样,是指从总体中按照随机原则抽取的那部分个体的集合。那部分个体的集合。样本的单位数称为样本的单位数称为样本容样本容量量,通常用,通常用n表示。表示。1nN。n30称为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比称为抽样比.例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行户
16、居民进行家庭收支情况调查,其中的家庭收支情况调查,其中的100100万户居万户居民就是总体,民就是总体,而被抽中的而被抽中的1000户居民则构成样本。户居民则构成样本。(二二)主要的样本指标主要的样本指标指根据抽样总体各个单位的标志值指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被或标志特征计算的综合指标,又被称为称为统计量,统计量,它是它是随机变量。随机变量。样本指标样本指标设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则 样本平均数
17、(又叫样本均值):样本平均数(又叫样本均值):样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:为自由度为自由度为 的无偏估计 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:为为 的的无偏估计无偏估计5.样本单位是非标志的平均数:样本单位是非标志的平均数:三、抽样方法的分类三、抽样方法的分类重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容个单位中随机抽取一个样本容量为量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重
18、新并把结果登记下来,又放回总体中重新参加下一次的抽选。又称参加下一次的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又再将其放回参加下一次的抽选。又称称不放回抽样不放回抽样.总体单位数总体单位数N N不变,同一单位可能不变,同一单位可能多次被抽中。多次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能,同一单位只可能被抽中一次。被抽中一次。根据取样方式不同,可分为:根据取样方式不同,可分为:抽样方法的分类抽样方法的分类根据对样本的要求不同,可分为:根据对样本的要求不同,可分为:考虑顺序抽样考虑顺序抽
19、样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有综合起来共有四种抽样方法四种抽样方法样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样 第三节:点估计和抽样平均误差第三节:点估计和抽样平均误差
20、 人们每时每刻都在做估计。根据婴儿的哭声人们每时每刻都在做估计。根据婴儿的哭声估计其冷热和什么时候吃奶、根据望闻问切来估计其冷热和什么时候吃奶、根据望闻问切来估计病人的病情、根据外表估计一个人的身高估计病人的病情、根据外表估计一个人的身高体重、根据前几天的数据估计今天的股市行情,体重、根据前几天的数据估计今天的股市行情,根据营业数据等估计一个公司的业绩等等。估根据营业数据等估计一个公司的业绩等等。估计就是根据你拥有的信息来对现实世界进行某计就是根据你拥有的信息来对现实世界进行某种判断。统计中的估计也不例外,它是完全根种判断。统计中的估计也不例外,它是完全根据数据做出的。据数据做出的。点估计点估
21、计从总体中抽取一个随机样本,计算与总从总体中抽取一个随机样本,计算与总体参数相应的样本统计体参数相应的样本统计量,然后把该统量,然后把该统计量视为总体参数的估计值,称为参数计量视为总体参数的估计值,称为参数的点估计。的点估计。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况 的抽样分布的抽样分布点估计的最大好处:给出确定的值点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差点估计的最大问题:无法控制误差抽样估计量的优良标准抽样估计量的优良标准设为待估计的总体参数,设
22、为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性若,则称为比更有效的估计量若,则称为比更有效的估计量若越大越小,则称为的一致估计量若越大越小,则称为的一致估计量作为优良的估计量,除了满足无偏作为优良的估计量,除了满足无偏性的要求外,其方差应比较小性的要求外,其方差应比较小有效性有效性指随着样本单位数指随着样本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致
23、性抽样估计量的优良标准抽样估计量的优良标准问题:问题:第一,我们为什么以这一个而第一,我们为什么以这一个而不是那一个统计量来估计某个总体不是那一个统计量来估计某个总体参数?参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计第二,如果有两个以上的统计量可以用来估计某个总体参数,其量可以用来估计某个总体参数,其估计结果是否一致?是否一个统计估计结果是否一致?是否一个统计量要优于另一个?量要优于另一个?估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效
24、、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:抽样估计量的优良标准抽样估计量的优良标准一、抽样误差一、抽样误差统计误差统计误差指统计调查结果所获得的统计数字指统计调查结果所获得的统计数字与与客观事物实际数值的差别。客观事物实际数值的差别。(一)登记性误差(一)登记性误差偶然性登记误差偶然性登记误差系统性登记误差系统性登记误差 (二)代表性误差(二)代表性误差 指采用非全面调查的方式,利用部分单位资料推断总指采用非全面调查的方式,利用部分单位资料推断总体资料时所产生的误差。体资料时所产生的误差。1、系统性误差、系统性误差 抽取样本单位时,未
25、用、破坏随机原则产生的误差。抽取样本单位时,未用、破坏随机原则产生的误差。2、随机误差、随机误差 遵循随机原则下产生的误差,遵循随机原则下产生的误差,即抽样误差。即抽样误差。抽样误差的定义:抽样误差的定义:在随机抽样的条件下,在克服了或消灭了登记性在随机抽样的条件下,在克服了或消灭了登记性误差的条件下,样本指标与总体指标之间的误差。误差的条件下,样本指标与总体指标之间的误差。如:如:1、抽样误差是个概念,只能理解无法计算;、抽样误差是个概念,只能理解无法计算;2、抽样误差是个变量,随着样本不同而不同。、抽样误差是个变量,随着样本不同而不同。问:抽样误差是个变量,那么抽样误差有多少个问:抽样误差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章 统计 抽样推断 第七 抽样 推断
限制150内