抽样推断 精.ppt
《抽样推断 精.ppt》由会员分享,可在线阅读,更多相关《抽样推断 精.ppt(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样推断 第1页,本讲稿共73页第一节第一节 抽样推断概述抽样推断概述 指样本单位的抽取不受主观因指样本单位的抽取不受主观因素及其他系统性因素的影响,素及其他系统性因素的影响,每个总体单位都有均等的被抽每个总体单位都有均等的被抽中机会中机会抽样推断抽样推断按照按照随机原则随机原则 从总体中抽取一部分单位进从总体中抽取一部分单位进行观察,并运用数理统计的原例,以被抽行观察,并运用数理统计的原例,以被抽取的部分单位的数量特征为代表,根据观取的部分单位的数量特征为代表,根据观察结果来推断,对总体作出数量上的推断察结果来推断,对总体作出数量上的推断分析。分析。第2页,本讲稿共73页统计推断统计推断全及
2、总体指标:全及总体指标:参数(未知量)参数(未知量)样本总体指标:样本总体指标:统统计量(已知量计量(已知量)抽样推断抽样推断统计学第五章统计学第五章 抽样推断抽样推断第3页,本讲稿共73页q按按随机原则随机原则抽取样本单位抽取样本单位q与全面推断相比较,抽样推断能与全面推断相比较,抽样推断能节省节省人力、人力、费用和时间,比较费用和时间,比较灵活灵活q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可以事先,但抽样误差可以事先计算并控制计算并控制抽样推断的特点抽样推断的特点 与全面调查相比,抽样调查既节省了人力、物力、与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总
3、体数量特征的目的。财力和时间,又达到了认识总体数量特征的目的。我我国在国在19941994年确立了以周期性普查为基础,以经常性抽样调年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以整为主体,同时辅之以重点调查、科学核算等综合运用重点调查、科学核算等综合运用的统计调查方法体系。的统计调查方法体系。统计学第五章统计学第五章 抽样推断抽样推断第4页,本讲稿共73页q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行检验修正检验修正时时q 工业生产过程中的工业生产过程中的质量控
4、制质量控制q 对总体的对总体的假设假设进行进行检验检验,判断真伪,判断真伪抽样推断的作用抽样推断的作用统计学第五章统计学第五章 抽样推断抽样推断第5页,本讲稿共73页抽样推断的理论基础抽样推断的理论基础大数定律大数定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。的性质。大数定律论证了如果独立随机变量总体存在有限的大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎平均数和方差,则对于充分大的样本可以近乎100%100%的概率,期望样本平均数与总体平均数的绝的概率,期望样本平均数与总体平均数的绝对离差对离差为
5、任意小。为任意小。如果变量总体存在有限的平均数和方差,如果变量总体存在有限的平均数和方差,那么不论这那么不论这个总体的分布如何,随着样本个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于容量的增加,样本平均数的分布,便趋近于正态分布正态分布。第6页,本讲稿共73页抽样推断的基本概念抽样推断的基本概念全及总体全及总体抽样总体抽样总体又称总体或母体,是所要认识研究对象的又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单全体,它由具有某种共同性质或特征的单位所组成。常用位所组成。常用N表示全及总体的单位数表示全及总体的单位数目。目。又称样本或子样,是指从全及总体中
6、按又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的集合。照随机原则抽取的那部分个体的集合。抽样总体的单位数称为抽样总体的单位数称为样本容样本容量量,通常用,通常用n表示。表示。1nN。例如:例如:在在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家庭户居民进行家庭收支情况调查,其中的收支情况调查,其中的100100万户居万户居民就是全及总体,而民就是全及总体,而被抽中的被抽中的1000户居民则构成抽样总体。户居民则构成抽样总体。n30称为大样本称为大样本,n 30称为小样本称为小样本.n/N称为抽样比称为抽样比.第7页,本讲稿共73页设总体中设总体
7、中 个总体单位某项标志的标志值分别个总体单位某项标志的标志值分别为为 ,其中具有某种属性的有,其中具有某种属性的有 个个单位,不具有某种属性的有单位,不具有某种属性的有 个单位,则个单位,则 总体平均数(又叫总体均值):总体平均数(又叫总体均值):根据全及总体各个单位的标志值或标志根据全及总体各个单位的标志值或标志特征所计算的反映总特征所计算的反映总体某种属性的综合体某种属性的综合指标指标,又称,又称总体参数总体参数。全及指标全及指标统计学第五章统计学第五章 抽样推断抽样推断第8页,本讲稿共73页 总体单位标志值的标准差:总体单位标志值的标准差:总体单位标志值的方差总体单位标志值的方差:统计学
8、第五章统计学第五章 抽样推断抽样推断第9页,本讲稿共73页 总体成数:总体成数:总体是非标志的标准差:总体是非标志的标准差:总体是非标志的方差:总体是非标志的方差:统计学第五章统计学第五章 抽样推断抽样推断第10页,本讲稿共73页设样本中设样本中 个样本单位某项标志的标志值个样本单位某项标志的标志值分别为分别为 ,其中具有和不具有某,其中具有和不具有某种属性的样本单位数目分别为种属性的样本单位数目分别为 和和 个,则个,则 样本平均数(又叫样本均值):样本平均数(又叫样本均值):指根据抽样总体各个单位的标志值指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被或标志特征计算的综合指标,
9、又被称为称为统计量,统计量,它是它是随机变量。随机变量。抽样指标抽样指标统计学第五章统计学第五章 抽样推断抽样推断第11页,本讲稿共73页 样本单位标志值的标准差:样本单位标志值的标准差:样本单位标志值的方差:样本单位标志值的方差:第12页,本讲稿共73页 样本成数:样本成数:样本单位是非标志的标准差:样本单位是非标志的标准差:样本单位是非标志的方差:样本单位是非标志的方差:统计学第六章统计学第六章 抽样推断抽样推断第13页,本讲稿共73页抽样方法的分类抽样方法的分类重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容量为个单位中随机抽取一个样本容量为n n的的样本,每次从总体中抽取一
10、个,样本,每次从总体中抽取一个,并把结果登记并把结果登记下来,又放回总体中重新参加下一次的抽选。下来,又放回总体中重新参加下一次的抽选。又称又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不再将其每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称放回参加下一次的抽选。又称不放回抽样不放回抽样.总体单位数总体单位数N N不变,同一单位可能多次被不变,同一单位可能多次被抽中。抽中。总体单位数减少总体单位数减少n n,同一单位只可能被抽,同一单位只可能被抽中一次。中一次。根据取样方式不同,可分为:根据取样方式不同,可分为:统计学第五章统计学第五章 抽样推断抽样推断第1
11、4页,本讲稿共73页抽样框抽样框又称为抽样结构,指对可以选择作为样本的总体单又称为抽样结构,指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和位列出名册或排序编号,以确定总体的抽样范围和结构。抽样框的确定是为了计算样本单位的概率。结构。抽样框的确定是为了计算样本单位的概率。样本数样本数又称为样本的可能数目。指从总体又称为样本的可能数目。指从总体N N个单位中随机个单位中随机抽取抽取n n个单位构成样本,通常有多种抽选方法,每一个单位构成样本,通常有多种抽选方法,每一种抽选方式就是种抽选方式就是n n个总体单位的一种排列组合,个总体单位的一种排列组合,n n个个总体单位的排
12、列组合总数,称为样本的可能数目。总体单位的排列组合总数,称为样本的可能数目。第15页,本讲稿共73页问题:问题:第一,我们为什么以这一个而不第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数是那一个统计量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优结果是否一致?是否一个统计量要优于另一个?于另一个?估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性统计学第五章统计学第五章 抽样推断抽样推断第16页
13、,本讲稿共73页第二节第二节 抽样误差抽样误差 抽样误差抽样误差 通常,把抽样指标与所要估计的总体指标之通常,把抽样指标与所要估计的总体指标之间的差值称为抽样误差。抽样误差既是一种随机间的差值称为抽样误差。抽样误差既是一种随机性误差,也是一种代表性误差。抽样误差的大小性误差,也是一种代表性误差。抽样误差的大小能够说明抽样指标估计总体指标是否可行、抽样能够说明抽样指标估计总体指标是否可行、抽样效果是否理想等推断性问题。效果是否理想等推断性问题。第17页,本讲稿共73页抽样误差抽样误差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM17
14、5CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高平均身高=169.8CM平均身高平均身高=174.6CM总平均身高总平均身高=168.6CM统计学第五章统计学第五章 抽样推断抽样推断第18页,本讲稿共73页抽样平均抽样平均误差误差指每一个可能样本的指标值与总指每一个可能样本的指标值与总体指标值之间平均离差,即一系体指标值之间平均离差,即一系列样本指标的标准差列样本指标的标准差式中:式中:为样本平均数的抽样平均误差;为样本平均数的抽样平均误差;为为可能的样本数目;可能的样本数目;为第为第 个可能样本的平均个可能样本的平均数;数;为总体平均数为总体平均
15、数注意:不要混淆抽样注意:不要混淆抽样标准差与样本标准差!标准差与样本标准差!第19页,本讲稿共73页抽样平均误差的计算抽样平均误差的计算 样本平均数的抽样平均误差样本平均数的抽样平均误差当N500时,有重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:统计学第五章统计学第五章 抽样推断抽样推断第20页,本讲稿共73页 样本成数的抽样平均误差样本成数的抽样平均误差重复抽样时:重复抽样时:不重复抽样时不重复抽样时:当N500时,有抽样平均误差的计算公式抽样平均误差的计算公式统计学第五章统计学第五章 抽样推断抽样推断第21页,本讲稿共73页关于总体方差的估计方法关于总体方差的估计方法q用过去同类
16、问题全面调查或抽样调查的经用过去同类问题全面调查或抽样调查的经验数据代替;验数据代替;q用样本标准差用样本标准差 代替总体标准差代替总体标准差 ,用,用 代替代替 。抽样平均误差的计算公式抽样平均误差的计算公式统计学第五章统计学第五章 抽样推断抽样推断第22页,本讲稿共73页抽样极限抽样极限误差误差指在一定的概率保证程度下,抽样指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最指标与总体指标之间抽样误差的最大可能范围,也称作大可能范围,也称作抽样允许误差。抽样允许误差。常用常用表示表示。上式表明,样本平均数(成数)是以总体平均数(成数)上式表明,样本平均数(成数)是以总体平均数(成数
17、)为中心,在相应的区间内变动。为中心,在相应的区间内变动。统计学第五章统计学第五章 抽样推断抽样推断第23页,本讲稿共73页由于总体成数和总体平均数是未知的,它要求靠实测的抽由于总体成数和总体平均数是未知的,它要求靠实测的抽样平均数和抽样成数来估计,因而抽样误差样平均数和抽样成数来估计,因而抽样误差的实际意义是的实际意义是希望总体平均数(成数)落在某个已知的范围内。希望总体平均数(成数)落在某个已知的范围内。抽样极限误差抽样极限误差所以前面的不等式应变换为所以前面的不等式应变换为:在一个特定的全及总体中,当抽样方法和样本容量固在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一
18、个定值,因此,抽样极限误定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。即抽样极差通常以抽样平均误差为标准单位来衡量。即抽样极限误差通常表示为抽样平均误差的限误差通常表示为抽样平均误差的多少倍。多少倍。由于由于t t值与样本估计值落入允许值与样本估计值落入允许误差范围内的概率有关,因此,误差范围内的概率有关,因此,t t也称为也称为概率度概率度。第24页,本讲稿共73页置信度置信度抽样指标和总体指标的误差不超过一定范围抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率保的概率大小,我们将它称之为概率保证程度,证程度,也叫抽样估计的置信度,一
19、般用也叫抽样估计的置信度,一般用F(t)表示。即:表示。即:置信度置信度t值与相应的概率保证程度存在一一对应关,值与相应的概率保证程度存在一一对应关,常用常用t值及相应的概率保证程度为:值及相应的概率保证程度为:t值值 概率保证程度概率保证程度1.00 0.6827 1.96 0.9500 2.00 0.9545 3.00 0.9973在在大大样样本本下下第25页,本讲稿共73页68.27%95.45%99.73%抽样极限误差抽样极限误差统计学第五章统计学第五章 抽样推断抽样推断第26页,本讲稿共73页影响抽样误差的因素影响抽样误差的因素q总体各单位标志值的差异程度(即标总体各单位标志值的差异
20、程度(即标准差的大小):准差的大小):越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:越大,抽样误差越越大,抽样误差越小;小;q抽样方法:抽样方法:不重复抽样的抽样误差比不重复抽样的抽样误差比重复抽样的抽样误差小;重复抽样的抽样误差小;q抽样组织方式:抽样组织方式:简单随机抽样的误差简单随机抽样的误差最大。最大。统计学第五章统计学第五章 抽样推断抽样推断第27页,本讲稿共73页第三节第三节 抽样估计抽样估计 也叫参数估计,就是根据也叫参数估计,就是根据样本指标样本指标数值对数值对总体指标总体指标数值作出估计或推数值作出估计或推断。断。抽样估计抽样估计通常,把用来估
21、计总体特征的样本指标叫通常,把用来估计总体特征的样本指标叫估计量估计量或统计量,或统计量,待估计的总体指标叫待估计的总体指标叫总体参数总体参数。特特点点1、它在逻辑上运用、它在逻辑上运用归纳推理归纳推理而不是演绎推理。而不是演绎推理。2、在方法上运用不确定的、在方法上运用不确定的概率估计方法概率估计方法,而,而不是运用确定的数学分析方法。不是运用确定的数学分析方法。3、抽样估计存在、抽样估计存在抽样误差抽样误差。第28页,本讲稿共73页点估计点估计从总体中抽取一个随机样本,计算与总体参数从总体中抽取一个随机样本,计算与总体参数相应的样本统计相应的样本统计量,然后把该统计量视为总量,然后把该统计
22、量视为总体参数的估计值,称为参数的点估计。体参数的估计值,称为参数的点估计。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况第29页,本讲稿共73页 的抽样分布的抽样分布点估计的最大好处:给出确定的值点点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差估计的最大问题:无法控制误差统计学第五章统计学第五章 抽样推断抽样推断第30页,本讲稿共73页区间估计区间估计给出一个区间给出一个区间(置信区间置信区间)并推断真正的参数并推断真正的参数以一定的概率存在于这个区间的方法
23、。以一定的概率存在于这个区间的方法。区间估计原理区间估计原理以样本统计量为中心,以抽以样本统计量为中心,以抽样平均误差为距离单位,可以构样平均误差为距离单位,可以构造一个区间,并可以一定的概率造一个区间,并可以一定的概率保证待估计的总体参数落在这个保证待估计的总体参数落在这个区间之中。区间越大,则概率保区间之中。区间越大,则概率保证程度越高。证程度越高。第31页,本讲稿共73页区间估计原理区间估计原理0.6827落在落在范围内的概率范围内的概率为为68.27%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线统计学第五章统计学第五章 抽样推断抽样推断第32页,本讲稿共73页区间估计原
24、理区间估计原理0.9545落在落在范围内的概率范围内的概率为为95.45%样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线统计学第五章统计学第五章 抽样推断抽样推断第33页,本讲稿共73页区间估计原理区间估计原理 0.9973落在落在范围内的概率范围内的概率为为99.73%样本抽样分布曲线样本抽样分布曲线样本抽样分布曲线样本抽样分布曲线总体分布曲线总体分布曲线总体分布曲线总体分布曲线统计学第五章统计学第五章 抽样推断抽样推断第34页,本讲稿共73页总体平均数的区间估计总体平均数的区间估计表表达达式式其中,其中,为极限误差为极限误差统计学第五章统计学第五章 抽样推断抽样推断第35页,
25、本讲稿共73页步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本标准差算样本标准差 ,即,即总体平均数的区间估计总体平均数的区间估计统计学第五章统计学第五章 抽样推断抽样推断第36页,本讲稿共73页步步骤骤 计算抽样平均误差计算抽样平均误差:重复抽样时重复抽样时:不重复抽样时不重复抽样时:总体平均数的区间估计总体平均数的区间估计统计学第五章统计学第五章 抽样推断抽样推断第37页,本讲稿共73页步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:总体平均数的区间估计总体平均数的区间估计统计学第五
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样推断 抽样 推断
限制150内