统计抽样推断课件.ppt
《统计抽样推断课件.ppt》由会员分享,可在线阅读,更多相关《统计抽样推断课件.ppt(102页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计抽样推断第1页,此课件共102页哦第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主观指样本单位的抽取不受主观因素及其他系统性因素的影因素及其他系统性因素的影响,每个总体单位都有均等响,每个总体单位都有均等的被抽中机会的被抽中机会一一、抽样推断抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一部从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。断,从而认识总体的一种统计方法。第2页,此课件共102页哦统计推断统计推断总体指标
2、:总体指标:参数参数(未知量)(未知量)样本总体指标:样本总体指标:统计统计量(已知量量(已知量)抽样推断抽样推断第3页,此课件共102页哦欲了解某湖中鱼的总产量,如果湖中有欲了解某湖中鱼的总产量,如果湖中有N条鱼,条鱼,平均每条鱼的重量为平均每条鱼的重量为 kg,湖中鱼的总产量,湖中鱼的总产量就为就为N kg.但由于不方便在湖中进行全面调查,因此,总产但由于不方便在湖中进行全面调查,因此,总产量也是未知的,这可以通过抽样来估计。量也是未知的,这可以通过抽样来估计。例例1 对湖中鱼产量的估计。对湖中鱼产量的估计。第4页,此课件共102页哦 首先,为了便于抽样,需要对总体做一下处首先,为了便于抽
3、样,需要对总体做一下处理。在湖面上均匀地打捞出若干网鱼,假设共有理。在湖面上均匀地打捞出若干网鱼,假设共有N1条,将它们做上记号后重新扔回湖中。这样就可以条,将它们做上记号后重新扔回湖中。这样就可以从湖中进行抽样了,重复刚才的做法,再次从湖中均从湖中进行抽样了,重复刚才的做法,再次从湖中均匀地打捞出若干网鱼,假设共有匀地打捞出若干网鱼,假设共有n条,这条,这n条就构成条就构成了一个样本。了一个样本。一般而言,这一般而言,这n条鱼会有一部分有记号,设其为条鱼会有一部分有记号,设其为n1条,另外一部分则没有记号,它必然为条,另外一部分则没有记号,它必然为n-n1条,样本条,样本中有记号的鱼所占的比
4、重中有记号的鱼所占的比重(记作记作p)为为n1/n.第5页,此课件共102页哦 可以这样去推理:鱼在湖中的游动具有一定的随可以这样去推理:鱼在湖中的游动具有一定的随机性质,如果网是均匀撒出的,则打捞出的鱼应当机性质,如果网是均匀撒出的,则打捞出的鱼应当对湖中整个的鱼具有较好的代表性。整个湖中有记对湖中整个的鱼具有较好的代表性。整个湖中有记号的鱼所占的比重号的鱼所占的比重(记为记为P)N1/N虽然未知,但可以通过虽然未知,但可以通过有记号的鱼所占的比重有记号的鱼所占的比重n1/n去估计,即去估计,即第6页,此课件共102页哦于是,整个湖中鱼的总数目于是,整个湖中鱼的总数目N的点估计就是的点估计就
5、是同上,如果将样本中同上,如果将样本中n条鱼的平均重量计算出条鱼的平均重量计算出来,记为来,记为 ,它就可以作为湖中全部鱼的平,它就可以作为湖中全部鱼的平均重量均重量 的估计量,则湖中鱼产量的点估计的估计量,则湖中鱼产量的点估计量为量为第7页,此课件共102页哦例例2 某工厂生产了一批产品,共某工厂生产了一批产品,共10000件,须经检验件,须经检验后方可出厂,按规定次品率不得超过后方可出厂,按规定次品率不得超过3。现从中抽。现从中抽取取100件产品,结果发现有件产品,结果发现有5件次品,问这批产品能否件次品,问这批产品能否投入市场?投入市场?统计假设统计假设 H0:很明显样本很明显样本100
6、件产品的实际次品率高于规定的要求,件产品的实际次品率高于规定的要求,高出高出2。高出的。高出的2是由于什么原因造成的呢?是由于什么原因造成的呢?第8页,此课件共102页哦深入考察就会发现有两种可能性:一种情况是该批深入考察就会发现有两种可能性:一种情况是该批10000件产品的次品率超过件产品的次品率超过3,高出的,高出的2是由于选是由于选取取100件产品的随机性而造成的;另一种情况是件产品的随机性而造成的;另一种情况是10000件产品的次品率不符合要求,样本的次品率高件产品的次品率不符合要求,样本的次品率高出原来的假设不是偶然的或随机的,而是有其内在的、出原来的假设不是偶然的或随机的,而是有其
7、内在的、必然的系统性原因。必然的系统性原因。第9页,此课件共102页哦随机原则的实现随机原则的实现抽签法抽签法是将总体中每个单位的是将总体中每个单位的编号编号写在外形完全一致写在外形完全一致写在外形完全一致写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的签上,将其搅拌均匀,从中任意抽选,签上的签上,将其搅拌均匀,从中任意抽选,签上的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。的号码所对应的单位就是样本单位。的号码所对应的单位就是样本单位。的号码所对应的单位就是样本单位。随机数表法随机数表法将总体中每个单位将总体中每个单位编上号码编上号码编上号码编上号码,然后
8、使用,然后使用随机数表,查出所要抽取的调查单位。随机数表,查出所要抽取的调查单位。计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算机计算机计算机计算机中,中,中,中,需要时将总体中各单位编上号码,启用需要时将总体中各单位编上号码,启用需要时将总体中各单位编上号码,启用需要时将总体中各单位编上号码,启用随随机数字发生器机数字发生器输出随机数字,然后从总输出随机数字,然后从总输出随机数字,然后从总输出随机数字,然后从总体中找到相应总体单位形成样本。体中找到相应总体单位形成样本。体中找到相应总体单位形成样本。
9、体中找到相应总体单位形成样本。第10页,此课件共102页哦二、特点:二、特点:1、样本单位是按随机原则抽取的、样本单位是按随机原则抽取的2、抽样推断是一种从数量上由部分推断总体、抽样推断是一种从数量上由部分推断总体 的研究方法的研究方法3、抽样推断是采用概率估计的方法、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制、抽样推断的误差可以事先计算并加以控制第11页,此课件共102页哦 与全面调查相比,抽样调查既节省了人力、物力、与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。财力和时间,又达到了认识总体数量特征的目的。我我国在国在19
10、941994年确立了以周期性普查为基础,以经常性年确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之以抽样调查为主体,同时辅之以重点调查、科学核重点调查、科学核算等综合运用的统计调查方法体系。算等综合运用的统计调查方法体系。第12页,此课件共102页哦三、优点:三、优点:1、更科学、更科学2、更经济、更经济3、时效性强、时效性强 4、应用广、应用广第13页,此课件共102页哦四、抽样推断的应用四、抽样推断的应用(1)调查具有破坏性的场合)调查具有破坏性的场合(2)对无限总体或总体规模非常大的场合)对无限总体或总体规模非常大的场合 进行调查进行调查(3)不必要进行全面调查但又需要知道)不
11、必要进行全面调查但又需要知道 总体的全面情况时总体的全面情况时(4)对全面调查的结果进行核查和修正)对全面调查的结果进行核查和修正(5)对资料时效性要求很强的场合)对资料时效性要求很强的场合 第14页,此课件共102页哦不可能不可能进行全面调查时进行全面调查时不必要不必要进行全面调查时进行全面调查时来不及来不及进行全面调查时进行全面调查时对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用第15页,此课件共102页哦抽样推断的理论基础抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性
12、质。的性质。大数定律论证了如果独立随机变量总体存在有限大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎的平均数和方差,则对于充分大的样本可以近乎100%100%的概率,期望样本平均数与总体平均数的的概率,期望样本平均数与总体平均数的绝对离差绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方差,如果变量总体存在有限的平均数和方差,那么不论这那么不论这个总体的分布如何,随着样个总体的分布如何,随着样本容量的增加,样本平均数的分布,便本容量的增加,样本平均数的分布,便趋近于趋近于正态分布正态分布。第16页,此课件共102页哦 按照总体所包含总体单位个数的
13、多少,可以按照总体所包含总体单位个数的多少,可以分为有限总体和无限总体。分为有限总体和无限总体。第二节第二节 总体和样本总体和样本 按照按照样样本本单单位的来源不同,可将位的来源不同,可将总总体分体分为为目目标标总总体和抽体和抽样总样总体体。(一一)总体总体一、总体和总体指标一、总体和总体指标第17页,此课件共102页哦目标总体目标总体抽样总体抽样总体是所要认识研究对象的全体,它由具有是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。常某种共同性质或特征的单位所组成。常用用N表示全及总体的单位数目。表示全及总体的单位数目。是指从中抽取样本的总体,亦即样本单是指从中抽取样本的总体
14、,亦即样本单位实际来源的总体。位实际来源的总体。第18页,此课件共102页哦根据总体各个单位的标志值或标志特根据总体各个单位的标志值或标志特征所计算的反映总征所计算的反映总体某种属性的综合体某种属性的综合指标指标,又称,又称总体参数总体参数。总体指标总体指标设总体中设总体中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则(二二)主要的总体指标主要的总体指标第19页,此课件共102页哦 总体平均数(又叫总体均值):总体平均数(又叫总体均值):或记作:或记作:
15、第20页,此课件共102页哦 总体单位标志值的标准差:总体单位标志值的标准差:总体单位标志值的方差总体单位标志值的方差:第21页,此课件共102页哦 总体成数:总体成数:6.总体是非标志的标准差:总体是非标志的标准差:7.总体是非标志的方差:总体是非标志的方差:5.总体是非标志的平均数:总体是非标志的平均数:第22页,此课件共102页哦(一一)样本样本二、样本和样本指标二、样本和样本指标又称子样,是指从总体中按照随机原则抽取的那部又称子样,是指从总体中按照随机原则抽取的那部分个体的集合。分个体的集合。样本的单位数称为样本的单位数称为样本容样本容量量,通常,通常用用n表示。表示。1nN。n30称
16、为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比称为抽样比.例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家庭户居民进行家庭收支情况调查,其中的收支情况调查,其中的100100万户居万户居民就是总体,而被抽中的民就是总体,而被抽中的1000户居民则构成样本。户居民则构成样本。第23页,此课件共102页哦(二二)主要的样本指标主要的样本指标指根据抽样总体各个单位的标志值指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被或标志特征计算的综合指标,又被称为称为统计量,统计量,它是它是随机变量。随机变量。样本指标样本指标设样本
17、中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则第24页,此课件共102页哦 样本平均数(又叫样本均值):样本平均数(又叫样本均值):第25页,此课件共102页哦 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:为自由度为自由度为 的无偏估计第26页,此课件共102页哦 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:为为 的的无偏估计无偏
18、估计5.样本单位是非标志的平均数:样本单位是非标志的平均数:第27页,此课件共102页哦三、抽样方法的分类三、抽样方法的分类重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量为个单位中随机抽取一个样本容量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结并把结果登记下来,又放回总体中重新参加下一次果登记下来,又放回总体中重新参加下一次的抽选。又称的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称将其放回参加下一次的抽选。又称不不放回抽样放回抽样.总体单位数总体单位数N
19、 N不变,同一单位可能多不变,同一单位可能多次被抽中。次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能被,同一单位只可能被抽中一次。抽中一次。根据取样方式不同,可分为:根据取样方式不同,可分为:第28页,此课件共102页哦抽样方法的分类抽样方法的分类根据对样本的要求不同,可分为:根据对样本的要求不同,可分为:考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的
20、不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有四综合起来共有四种抽样方法种抽样方法第29页,此课件共102页哦样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样第30页,此课件共102页哦 第三节:点估计和抽样平均误差第三节:点估计和抽样平均误差 人们每时每刻都在做估计。根据婴儿的哭声估人们每时每刻都在做估计。根据婴儿的哭声估计其冷热和什么时候吃奶、根据望闻问切来估计病计其冷热和什么时候吃奶、根据望闻问切来估计病人的病情、根据外表估计一个人的
21、身高体重、根据人的病情、根据外表估计一个人的身高体重、根据前几天的数据估计今天的股市行情,根据营业数据前几天的数据估计今天的股市行情,根据营业数据等估计一个公司的业绩等等。估计就是根据你拥有等估计一个公司的业绩等等。估计就是根据你拥有的信息来对现实世界进行某种判断。统计中的估计的信息来对现实世界进行某种判断。统计中的估计也不例外,它是完全根据数据做出的。也不例外,它是完全根据数据做出的。第31页,此课件共102页哦点估计点估计从总体中抽取一个随机样本,计算与总体参数从总体中抽取一个随机样本,计算与总体参数相应的样本统计相应的样本统计量,然后把该统计量视为总体量,然后把该统计量视为总体参数的估计
22、值,称为参数的点估计。参数的估计值,称为参数的点估计。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况第32页,此课件共102页哦 的抽样分布的抽样分布点估计的最大好处:给出确定的值点点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差估计的最大问题:无法控制误差第33页,此课件共102页哦抽样估计量的优良标准抽样估计量的优良标准设为待估计的总体参数,设为待估计的总体参数,为样本统为样本统计量,则的优良标准为:计量,则的优良标准为:若,则称为的无偏若,则称为的无偏估计
23、量估计量指样本指标的均值应等于被估指样本指标的均值应等于被估计的总体指标计的总体指标无偏性无偏性第34页,此课件共102页哦若,则称为比更有效的估计量若,则称为比更有效的估计量若越大越小,则称为的一致估计量若越大越小,则称为的一致估计量作为优良的估计量,除了满足无偏性作为优良的估计量,除了满足无偏性的要求外,其方差应比较小的要求外,其方差应比较小有效性有效性指随着样本单位数指随着样本单位数 的增大,样本的增大,样本估计量将在概率意义下越来越接近估计量将在概率意义下越来越接近于总体真实值于总体真实值一致性一致性抽样估计量的优良标准抽样估计量的优良标准第35页,此课件共102页哦问题:问题:第一,
24、我们为什么以这一个而不第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数是那一个统计量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优结果是否一致?是否一个统计量要优于另一个?于另一个?估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性第36页,此课件共102页哦 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量
25、。为的无偏、有效、一致估计量。数理统计证明:数理统计证明:抽样估计量的优良标准抽样估计量的优良标准第37页,此课件共102页哦一、抽样误差一、抽样误差统计误差统计误差指统计调查结果所获得的统计数字指统计调查结果所获得的统计数字与客观与客观事物实际数值的差别。事物实际数值的差别。(一)登记性误差(一)登记性误差偶然性登记误差偶然性登记误差系统性登记误差系统性登记误差第38页,此课件共102页哦 (二)代表性误差(二)代表性误差 指采用非全面调查的方式,利用部分单位资料推断总体资指采用非全面调查的方式,利用部分单位资料推断总体资料时所产生的误差。料时所产生的误差。1、系统性误差、系统性误差 抽取样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样 推断 课件
限制150内