统计抽样推断精品文稿.ppt
《统计抽样推断精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计抽样推断精品文稿.ppt(102页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计抽样推断第1页,本讲稿共102页第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主观指样本单位的抽取不受主观因素及其他系统性因素的影因素及其他系统性因素的影响,每个总体单位都有均等响,每个总体单位都有均等的被抽中机会的被抽中机会一一、抽样推断抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一部从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。从而认识总体的一种统计方法。第2页,本讲稿共102页统计推断统计推断总体指标:总
2、体指标:参数参数(未知量)(未知量)样本总体指标:样本总体指标:统统计量(已知量计量(已知量)抽样推断抽样推断第3页,本讲稿共102页欲了解某湖中鱼的总产量,如果湖中有欲了解某湖中鱼的总产量,如果湖中有N条鱼,条鱼,平均每条鱼的重量为平均每条鱼的重量为 kg,湖中鱼的总产量,湖中鱼的总产量就为就为N kg.但由于不方便在湖中进行全面调查,因此,总产但由于不方便在湖中进行全面调查,因此,总产量也是未知的,这可以通过抽样来估计。量也是未知的,这可以通过抽样来估计。例例1 对湖中鱼产量的估计。对湖中鱼产量的估计。第4页,本讲稿共102页 首先,为了便于抽样,需要对总体做一下处理。首先,为了便于抽样,
3、需要对总体做一下处理。在湖面上均匀地打捞出若干网鱼,假设共有在湖面上均匀地打捞出若干网鱼,假设共有N1条,将条,将它们做上记号后重新扔回湖中。这样就可以从湖中它们做上记号后重新扔回湖中。这样就可以从湖中进行抽样了,重复刚才的做法,再次从湖中均匀地进行抽样了,重复刚才的做法,再次从湖中均匀地打捞出若干网鱼,假设共有打捞出若干网鱼,假设共有n条,这条,这n条就构成了条就构成了一个样本。一个样本。一般而言,这一般而言,这n条鱼会有一部分有记号,设其为条鱼会有一部分有记号,设其为n1条,另外一部分则没有记号,它必然为条,另外一部分则没有记号,它必然为n-n1条,样本条,样本中有记号的鱼所占的比重中有记
4、号的鱼所占的比重(记作记作p)为为n1/n.第5页,本讲稿共102页 可以这样去推理:鱼在湖中的游动具有一定的随可以这样去推理:鱼在湖中的游动具有一定的随机性质,如果网是均匀撒出的,则打捞出的鱼应当机性质,如果网是均匀撒出的,则打捞出的鱼应当对湖中整个的鱼具有较好的代表性。整个湖中有记对湖中整个的鱼具有较好的代表性。整个湖中有记号的鱼所占的比重号的鱼所占的比重(记为记为P)N1/N虽然未知,但可以通虽然未知,但可以通过有记号的鱼所占的比重过有记号的鱼所占的比重n1/n去估计,即去估计,即第6页,本讲稿共102页于是,整个湖中鱼的总数目于是,整个湖中鱼的总数目N的点估计就是的点估计就是同上,如果
5、将样本中同上,如果将样本中n条鱼的平均重量计算出条鱼的平均重量计算出来,记为来,记为 ,它就可以作为湖中全部鱼的平,它就可以作为湖中全部鱼的平均重量均重量 的估计量,则湖中鱼产量的点估计的估计量,则湖中鱼产量的点估计量为量为第7页,本讲稿共102页例例2 某工厂生产了一批产品,共某工厂生产了一批产品,共10000件,须经检验件,须经检验后方可出厂,按规定次品率不得超过后方可出厂,按规定次品率不得超过3。现从中抽。现从中抽取取100件产品,结果发现有件产品,结果发现有5件次品,问这批产品件次品,问这批产品能否投入市场?能否投入市场?统计假设统计假设 H0:很明显样本很明显样本100件产品的实际次
6、品率高于规定的要件产品的实际次品率高于规定的要求,高出求,高出2。高出的。高出的2是由于什么原因造成的是由于什么原因造成的呢?呢?第8页,本讲稿共102页深入考察就会发现有两种可能性:一种情况是该批深入考察就会发现有两种可能性:一种情况是该批10000件产品的次品率超过件产品的次品率超过3,高出的,高出的2是由于选是由于选取取100件产品的随机性而造成的;另一种情况是件产品的随机性而造成的;另一种情况是10000件产品的次品率不符合要求,样本的次品率高出件产品的次品率不符合要求,样本的次品率高出原来的假设不是偶然的或随机的,而是有其内在的、必原来的假设不是偶然的或随机的,而是有其内在的、必然的
7、系统性原因。然的系统性原因。第9页,本讲稿共102页随机原则的实现随机原则的实现抽签法抽签法是将总体中每个单位的是将总体中每个单位的是将总体中每个单位的是将总体中每个单位的编号编号编号编号写在外形完全一致写在外形完全一致写在外形完全一致写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签的签上,将其搅拌均匀,从中任意抽选,签的签上,将其搅拌均匀,从中任意抽选,签的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。上的号码所对应的单位就是样本单位。上的号码所对应的单位就是样本单位。上的号码所对应的单位就是样本单位。随机数表法随机数表法将总体中每个单位将总体中每个单位将总体中
8、每个单位将总体中每个单位编上号码编上号码编上号码编上号码,然后使用随,然后使用随,然后使用随,然后使用随机数表,查出所要抽取的调查单位。机数表,查出所要抽取的调查单位。机数表,查出所要抽取的调查单位。机数表,查出所要抽取的调查单位。计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算机计算机计算机计算机中,需要时将总体中各单位编上号码,启中,需要时将总体中各单位编上号码,启中,需要时将总体中各单位编上号码,启中,需要时将总体中各单位编上号码,启用用用用随机数字发生器随机数字发生器随机数字发生器随机数字发生器
9、输出随机数字,然后输出随机数字,然后输出随机数字,然后输出随机数字,然后从总体中找到相应总体单位形成样本。从总体中找到相应总体单位形成样本。从总体中找到相应总体单位形成样本。从总体中找到相应总体单位形成样本。第10页,本讲稿共102页二、特点:二、特点:1、样本单位是按随机原则抽取的、样本单位是按随机原则抽取的2、抽样推断是一种从数量上由部分推断总体、抽样推断是一种从数量上由部分推断总体 的研究方法的研究方法3、抽样推断是采用概率估计的方法、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制、抽样推断的误差可以事先计算并加以控制第11页,本讲稿共102页 与全面调查相比,抽
10、样调查既节省了人力、物与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的力、财力和时间,又达到了认识总体数量特征的目的。目的。我国在我国在19941994年确立了以周期性普查为基础,年确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之以以经常性抽样调查为主体,同时辅之以重点调查、重点调查、科学核算等综合运用的统计调查方法体系。科学核算等综合运用的统计调查方法体系。第12页,本讲稿共102页三、优点:三、优点:1、更科学、更科学2、更经济、更经济3、时效性强、时效性强 4、应用广、应用广第13页,本讲稿共102页四、抽样推断的应用四、抽样推断的应用(1)调
11、查具有破坏性的场合)调查具有破坏性的场合(2)对无限总体或总体规模非常大的场合)对无限总体或总体规模非常大的场合 进行调查进行调查(3)不必要进行全面调查但又需要知道)不必要进行全面调查但又需要知道 总体的全面情况时总体的全面情况时(4)对全面调查的结果进行核查和修正)对全面调查的结果进行核查和修正(5)对资料时效性要求很强的场合)对资料时效性要求很强的场合 第14页,本讲稿共102页q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用
12、第15页,本讲稿共102页抽样推断的理论基础抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。的性质。大数定律论证了如果独立随机变量总体存在有限大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎的平均数和方差,则对于充分大的样本可以近乎100%100%的概率,期望样本平均数与总体平均数的的概率,期望样本平均数与总体平均数的绝对离差绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方差,如果变量总体存在有限的平均数和方差,那么不论这那么不论这个总体
13、的分布如何,随着样个总体的分布如何,随着样本容量的增加,样本平均数的分布,便本容量的增加,样本平均数的分布,便趋近于趋近于正态分布正态分布。第16页,本讲稿共102页 按照总体所包含总体单位个数的多少,可以按照总体所包含总体单位个数的多少,可以分为有限总体和无限总体。分为有限总体和无限总体。第二节第二节 总体和样本总体和样本 按照按照样样本本单单位的来源不同,可将位的来源不同,可将总总体分体分为为目目标总标总体和抽体和抽样总样总体体。(一一)总体总体一、总体和总体指标一、总体和总体指标第17页,本讲稿共102页目标总体目标总体抽样总体抽样总体是所要认识研究对象的全体,它由具有某是所要认识研究对
14、象的全体,它由具有某种共同性质或特征的单位所组成。常用种共同性质或特征的单位所组成。常用N表示全及总体的单位数目。表示全及总体的单位数目。是指从中抽取样本的总体,亦即样本单是指从中抽取样本的总体,亦即样本单位实际来源的总体。位实际来源的总体。第18页,本讲稿共102页根据总体各个单位的标志值或标志根据总体各个单位的标志值或标志特征所计算的反映总特征所计算的反映总体某种属性的综体某种属性的综合指标合指标,又称,又称总体参数总体参数。总体指标总体指标设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种
15、属性的有单位,不具有某种属性的有 个单位,则个单位,则(二二)主要的总体指标主要的总体指标第19页,本讲稿共102页 总体平均数(又叫总体均值):总体平均数(又叫总体均值):总体平均数(又叫总体均值):总体平均数(又叫总体均值):或记作:或记作:第20页,本讲稿共102页 总体单位标志值的标准差:总体单位标志值的标准差:总体单位标志值的方差总体单位标志值的方差:第21页,本讲稿共102页 总体成数:总体成数:总体成数:总体成数:6.总体是非标志的标准差:总体是非标志的标准差:7.7.总体是非标志的方差:总体是非标志的方差:总体是非标志的方差:总体是非标志的方差:5.总体是非标志的平均数:总体是
16、非标志的平均数:第22页,本讲稿共102页(一一)样本样本二、样本和样本指标二、样本和样本指标又称子样,是指从总体中按照随机原则抽取的那又称子样,是指从总体中按照随机原则抽取的那部分个体的集合。部分个体的集合。样本的单位数称为样本的单位数称为样本容样本容量量,通常用通常用n表示。表示。1nN。n30称为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比称为抽样比.例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家庭户居民进行家庭收支情况调查,其中的收支情况调查,其中的100100万户居万户居民就是总体,而被抽中民就是总体,而被抽中的的
17、1000户居民则构成样本。户居民则构成样本。第23页,本讲稿共102页(二二)主要的样本指标主要的样本指标指根据抽样总体各个单位的标志值指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被或标志特征计算的综合指标,又被称为称为统计量,统计量,它是它是随机变量。随机变量。样本指标样本指标设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则第24页,本讲稿共102页 样本平均数(又叫样本均值):样本平均数(又叫样本均值):第25页,本讲稿共102页
18、 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:样本单位标志值的方差:样本单位标志值的方差:为自由度为自由度为 的无偏估计第26页,本讲稿共102页 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:样本单位是非标志的方差:样本单位是非标志的方差:为为 的的无偏估计无偏估计5.样本单位是非标志的平均数:样本单位是非标志的平均数:第27页,本讲稿共102页三、抽样方法的分类三、抽样方法的分类重复抽样重复抽样从总体从总体N N个单位中随
19、机抽取一个样本容量为个单位中随机抽取一个样本容量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果登并把结果登记下来,又放回总体中重新参加下一次的记下来,又放回总体中重新参加下一次的抽选。又称抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再将其每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称放回参加下一次的抽选。又称不放回抽不放回抽样样.总体单位数总体单位数N N不变,同一单位可能多次不变,同一单位可能多次被抽中。被抽中。总体单位数减少总体单位数减少n n,同一单位只可能被,同一单位只可能被抽中一次。抽中一次。根据取样方式不
20、同,可分为:根据取样方式不同,可分为:第28页,本讲稿共102页抽样方法的分类抽样方法的分类根据对样本的要求不同,可分为:根据对样本的要求不同,可分为:考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有综合起来共有四种抽样方法四种抽样方法第29页,本讲稿共102页样本的可能数目样本的可能数目考虑顺序的不重复抽
21、样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样第30页,本讲稿共102页 第三节:点估计和抽样平均误差第三节:点估计和抽样平均误差 人们每时每刻都在做估计。根据婴儿的哭声估计其人们每时每刻都在做估计。根据婴儿的哭声估计其冷热和什么时候吃奶、根据望闻问切来估计病人的病冷热和什么时候吃奶、根据望闻问切来估计病人的病情、根据外表估计一个人的身高体重、根据前几天的情、根据外表估计一个人的身高体重、根据前几天的数据估计今天的股市行情,根据营业数据等估计一个数据估计今天的股市行情,根据营业数据等估计一个公司的业
22、绩等等。估计就是根据你拥有的信息来对现公司的业绩等等。估计就是根据你拥有的信息来对现实世界进行某种判断。统计中的估计也不例外,它是实世界进行某种判断。统计中的估计也不例外,它是完全根据数据做出的。完全根据数据做出的。第31页,本讲稿共102页点估计点估计从总体中抽取一个随机样本,计算与总体参数从总体中抽取一个随机样本,计算与总体参数相应的样本统计相应的样本统计量,然后把该统计量视为总体量,然后把该统计量视为总体参数的估计值,称为参数的点估计。参数的估计值,称为参数的点估计。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程
23、度要求不高的情况确程度与可靠程度要求不高的情况第32页,本讲稿共102页 的抽样分的抽样分布布点估计的最大好处:给出确定的值点点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差估计的最大问题:无法控制误差第33页,本讲稿共102页抽样估计量的优良标准抽样估计量的优良标准设为待估计的总体参数,设为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性第34页,本讲稿共102页若,则称为比更有效的估计量若,则称为比更有效的估计量若越大
24、越小,则称为的一致估计量若越大越小,则称为的一致估计量作为优良的估计量,除了满足无偏作为优良的估计量,除了满足无偏性的要求外,其方差应比较小性的要求外,其方差应比较小有效性有效性指随着样本单位数指随着样本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性抽样估计量的优良标准抽样估计量的优良标准第35页,本讲稿共102页问题:问题:第一,我们为什么以这一个而不第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数是那一个统计量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量可第二,
25、如果有两个以上的统计量可以用来估计某个总体参数,其估计结果以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优于另一是否一致?是否一个统计量要优于另一个?个?估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性第36页,本讲稿共102页q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:抽样估计量的优良标准抽样估计量的优良标准第37页,本讲稿共102页一、抽样误差一、抽样误差统计误差统计误差指统计调查结
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样 推断 精品 文稿
限制150内