第6章 抽样推断19619.pptx
《第6章 抽样推断19619.pptx》由会员分享,可在线阅读,更多相关《第6章 抽样推断19619.pptx(139页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 抽样推断抽样推断 第六章第六章 抽样推断抽样推断1抽样推断有关概念与理论依据2抽样误差3抽样估计和推算4抽样推断的组织形式第一节第一节 抽样推断有关概念与理论依据抽样推断有关概念与理论依据 一、抽样推断的意义、内容一、抽样推断的意义、内容(一)概念(一)概念 按照随机原则从总体中抽取一部分单位进行按照随机原则从总体中抽取一部分单位进行观察,并根据被抽取的那部分单位的结果,对总观察,并根据被抽取的那部分单位的结果,对总体作出具有一定可靠程度的推断体作出具有一定可靠程度的推断 。统计推断的过程统计推断的过程总体总体总体总体总体均值、总体均值、总体均值、总体均值、比例、方差比例、方差比
2、例、方差比例、方差样样样样本本本本样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差(二)特点(二)特点 1 1、按照随机原则抽取部分单位、按照随机原则抽取部分单位,抽样推断运抽样推断运抽样推断运抽样推断运 用概率估计的方法用概率估计的方法用概率估计的方法用概率估计的方法。2 2、部分单位、部分单位 总体。总体。3 3、抽样误差可以计算和控制。、抽样误差可以计算和控制。(三三)抽样推断的内容抽样推断的内容w参数估计参数估计 依据所
3、获得的样本观察资料,对依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量所研究现象总体的水平、结构、规模等数量特征进行估计。特征进行估计。w假设检验假设检验 利用样本的实际资料来检验事先利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的对总体某些数量特征所作的假设是否可信的一种统计分析方法。一种统计分析方法。二、抽样推断的作用二、抽样推断的作用 抽抽样调查方法是市场经济国家在调查方法样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。成本低、速度快、应用面广等优点。
4、建立起建立起以周期性普查为基础、经常性抽样以周期性普查为基础、经常性抽样调查为主体,必要的统计报表、重点调查、综调查为主体,必要的统计报表、重点调查、综合分析等为补充的国家统计调查方法体系,是合分析等为补充的国家统计调查方法体系,是我国统计方法制度改革的指导思想。我国统计方法制度改革的指导思想。1.1.实实际工作不可能进行全面调查观察,而又需要了解际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资
5、料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。进行检验,判断这种假设的真伪,以决定取舍。三、抽样推断的基本概念三、抽样推断的基本概念(一一)全及总体和抽样总体全及总体和抽样总体(总体和样本总体和样本)全全及总体:所要调查观察的全部事物。及总体:所要调查观察的全部事物。总体单位数用总体单位数用N N表示。表示。抽抽样总体:抽取出来调查观察的单位
6、。样总体:抽取出来调查观察的单位。抽样总体的单位数用抽样总体的单位数用n n表示。表示。n 30 n 30 大样本大样本 n 30 n 30时,时,t分布与标准正态分布分布与标准正态分布N(0,1)就非常接近就非常接近.但对较小的但对较小的n值,值,t分布与标准正态分布之间有较大分布与标准正态分布之间有较大差异差异.且且P|T|t0P|X|t0,其中,其中X N(0,1),即,即在在t分布的尾部比在标准正态分布的尾部有着更大的概分布的尾部比在标准正态分布的尾部有着更大的概率率.t 分布的数学期望与方差分布的数学期望与方差设设Tt(n),则,则E(T)=0,D(T)=设设(X1,X2,Xn)为来
7、自正态总体为来自正态总体 XN(,2)的样本,则统计量的样本,则统计量证证由于由于与与S 2相互独立,且相互独立,且由定义由定义5.4得得 设设(X1,X2,Xn1)和和(Y1,Y2,Yn2)分别是来自正态总体分别是来自正态总体N(1,2)和和N(2,2)的样本,且它们相互独立,则统计量的样本,且它们相互独立,则统计量其中其中、分别为两总体的样本方差分别为两总体的样本方差.分布分布 定义定义 设总体设总体 ,是是 的的一个样本一个样本,则称统计量则称统计量 服从自由度服从自由度为为n n的的 分布,记作分布,记作自由度是指独立随机变量的个数,自由度是指独立随机变量的个数,n n个相互独立的标准
8、正态分布之平方和个相互独立的标准正态分布之平方和服从自由度为服从自由度为n n的的 分布分布 五、抽样推断的基本原理五、抽样推断的基本原理举例说明举例说明 总体方差已知时总体方差已知时总体均值总体均值的区间估计的区间估计 当当X X ,可以证明抽自该总体的简单随机样本,可以证明抽自该总体的简单随机样本X1,X2X1,X2,XnXn的样本平均数的样本平均数 服从数学期望为服从数学期望为 ,方差,方差为为 的正态分布,即的正态分布,即 采用统计量采用统计量Z Z,将非标准正态分布转化为标准正态分布,将非标准正态分布转化为标准正态分布,N(0,1)例例对于给定的置信概率对于给定的置信概率,可以查正态
9、分布表,可以查正态分布表,(即概率度即概率度t)t)使得:使得:得出相应的临界值得出相应的临界值即在给定的显著性水平即在给定的显著性水平 下,总体均值下,总体均值 在在 的置信概率下的置信区间为的置信概率下的置信区间为 第二节第二节 抽样误差抽样误差 一、抽样误差的概念及种类一、抽样误差的概念及种类在抽样调查中,总体指标与样本指标不一致,两者在抽样调查中,总体指标与样本指标不一致,两者的偏差称为抽样误差。的偏差称为抽样误差。抽样误差抽样误差即指随机误差,这是抽样调查即指随机误差,这是抽样调查固有的误差,是无法避免的。固有的误差,是无法避免的。抽样误差的作用:抽样误差的作用:1.1.在在于说明样
10、本指标的代表性大小。于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差小,则样本指标代表性高;误差等于误差等于0 0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。2.2.说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。二、抽样平均误差二、抽样平均误差 (一)概念(一)概念 抽样平均误差抽样平均误差是是所有可能出现的样本指标所有可能出现的样本指标的标的标准差。反映样本指标与总体指标之间误差的一般水准差。反映样本指标与总体指标之间误差的一般水平。平。通常用通常用表示。表示。即是由于抽样的随机
11、性而产生的样本指标与总即是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。体指标之间的平均离差。(二)理论公式(二)理论公式例例1010102010301040105020102020203020402050301030203030304030504010402040304040405050105020503050405050合合计计101010-20400102015-15225103020-10100104025-52510503000201015-15225202020-10100203025-52520403000205035525301020-10100302025-525
12、3030300030403552530504010100401025-52540203000403035525404040101004050451522550103000502035525503040101005040451522550505020400合合计计-2500(三)实际计算公式(三)实际计算公式(以纯随机抽样为例)(以纯随机抽样为例)1.1.重重复抽样复抽样2.2.不不重重复抽样复抽样总体方差未知时解决方法:总体方差未知时解决方法:w1、用样本方差代替、用样本方差代替w2 2、用过去全面调查的资料,也可以、用过去全面调查的资料,也可以用过去用过去 抽样抽样调查的资料代替。调查的资料
13、代替。某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,000个中抽取个中抽取100100个个检查其寿命,得平均寿命为检查其寿命,得平均寿命为20002000小时,根据以往资小时,根据以往资料料=20=20小时,试求抽样平均误差。小时,试求抽样平均误差。例例重复抽样重复抽样:不重复抽样不重复抽样:某玻璃器皿厂某日生产某玻璃器皿厂某日生产1500015000只印花玻璃杯,现只印花玻璃杯,现按重复抽样方法从中抽取按重复抽样方法从中抽取150150只进行质量检验,有只进行质量检验,有147147只合格,试求这批印花玻璃杯合格率的抽样平只合格,试求这批印花玻璃杯合格率的抽样平均误差
14、。均误差。例例(四)影响抽样误差的因素:(四)影响抽样误差的因素:4.4.不不同的抽样组织形式。同的抽样组织形式。1.1.全全及总体标志变异程度。及总体标志变异程度。2.2.抽抽样单位数目的多少。样单位数目的多少。3.3.不不同的抽样方法。同的抽样方法。例:例:假定抽样单位数增加假定抽样单位数增加 2 2 倍、倍、0.50.5倍时,倍时,其他条件不变,抽样平均误差怎样变化?其他条件不变,抽样平均误差怎样变化?解解:抽样单位数增加抽样单位数增加 2 2 倍,即为原来的倍,即为原来的 3 3 倍倍抽样单位数增加抽样单位数增加 0.5 0.5倍,即为原来的倍,即为原来的 1.5 1.5倍倍即:即:当
15、样本单位数增加当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.5770.577倍倍。即:即:当样本单位数增加当样本单位数增加0.50.5倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.81650.8165倍倍。例:例:假定抽样平均误差缩小假定抽样平均误差缩小40%40%时,时,其他其他条件不变,条件不变,抽样单位数怎样变化?抽样单位数怎样变化?解解:抽样平均误差缩小抽样平均误差缩小40%40%时,时,即为原来的即为原来的 60%60%,即:当抽样平均误差缩小即:当抽样平均误差缩小40%40%时,样本时,样本单位数增加单位数增加1.781.78倍。倍。一、抽
16、样极限误差一、抽样极限误差 样本指标与总体指标之间允许的误差范围叫抽样极限样本指标与总体指标之间允许的误差范围叫抽样极限误差。也称抽样允许误差。误差。也称抽样允许误差。它是样本指标可允许变动的上限或下限与总体指标它是样本指标可允许变动的上限或下限与总体指标之差的绝对值。之差的绝对值。即:即:第三节第三节 抽样估计和推算抽样估计和推算 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样总体为足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区的概率落在某一特定的区间内
17、,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率间叫抽样极限误差,也称置信区间,即在概率F(t)F(t)的保的保证下:证下:=t=t,(,(t t为概率度)为概率度)当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3
18、3倍倍(t=3);(t=3);例例可见,可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样极限误差,即扩大或缩小了以后的抽样误差范围。上例资料编成次数分配表如下:上例资料编成次数分配表如下:样本数样本数f f 101-20152-15203-10254-530503545403104521550120合计合计25-30 -30 样本个数样本个数 样本频率样本频率 样本累计频率样本累计频率 0 0 5 5 10 10 15 15 20 20 合计合计 -30 -30 样本个数样本个数 样本频率样本频率 样本累计频率样本累计频率 0 5 0.20 0.20 0 5 0.20 0.20 5
19、8 0.32 0.52 5 8 0.32 0.52 10 6 0.24 0.76 10 6 0.24 0.76 15 4 0.16 0.92 15 4 0.16 0.92 20 2 0.08 1.00 20 2 0.08 1.00 合计合计 25 1.00 -25 1.00 -P409(一)(一)点估计点估计二、抽样估计方法二、抽样估计方法(定值估计)(定值估计)点估计点估计点估计的方法有点估计的方法有矩估计法矩估计法顺序统计量法顺序统计量法最大似然法最大似然法最小二乘法最小二乘法理论基础是理论基础是抽样分布抽样分布 =S2 设设表示总体平均数表示总体平均数的估计量,的估计量,表示总体成数表示
20、总体成数P P的估计量,的估计量,表示总体方差表示总体方差的估计量,的估计量,则点估计的基本公式为:则点估计的基本公式为:点估计量优劣的标准:点估计量优劣的标准:(三)有效性(三)有效性 (一)无偏性(一)无偏性(二)一致性(二)一致性1 1无偏性无偏性设设为未知参数为未知参数的估计量的估计量,若估计量,若估计量的期望等于未知参数的真值,即的期望等于未知参数的真值,即则称则称为为的无偏估计量。的无偏估计量。无偏性无偏性 w估计量的数学期望等于被估计的总体参数估计量的数学期望等于被估计的总体参数P P(X X)X XC CA A 无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏w对于任意给定的对
21、于任意给定的00,有,有对于这种极限,我们称估计量对于这种极限,我们称估计量 依概率收依概率收敛于敛于 。2 2一致性一致性 一致性一致性 w随随着着样样本本容容量量的的增增大大,估估计计量量越越来来越越接接近近被估计的总体参数被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P(X X)X X3 3有效性有效性设设为为的两个无偏估计量,的两个无偏估计量,的方差小于的方差小于的方差,即的方差,即V(V()V()V()则称则称是较是较有效的估计量。有效的估计量。有效性有效性 AB 中位数的抽样分布中位数的抽样
22、分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)一一一一个个个个方方方方差差差差较较较较小小小小的的的的无无无无偏偏偏偏估估估估计计计计量量量量称称称称为为为为一一一一个个个个更更更更有有有有效效效效的估计量。的估计量。的估计量。的估计量。如如如如,与与与与其其其其他他他他估估估估计计计计量量量量相相相相比比比比 ,样样样样本本本本均均均均值值值值是是是是一一一一个个个个更更更更有效的估计量有效的估计量有效的估计量有效的估计量(二二)区间估计区间估计是是根据样本指标和抽样误差去推断全及指根据样本指标和抽样误差去推断全及指标的可能
23、范围,并能反映出估计的准确程度和把标的可能范围,并能反映出估计的准确程度和把握程度。握程度。由于区间估计所表示的是一个可能的范围,而不是由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这个一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就是范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。有一定的概率。区间估计区间估计 落在总体均值某一区间内的样本落在总体均值某一区间内的样本X95.45%95.45%的样本的样本的样本的样本99.73%99.73%的样本的样本的样本的样本x-3x-3 68.27%68.27
24、%的样本的样本的样本的样本x-2x-2 x-x-X+X+3 3 X+2X+2 X+X+xl换句话说,对于总体的被估计指标换句话说,对于总体的被估计指标X X,找出样,找出样本的两个估计量本的两个估计量x1x1和和x2x2,使被估计指标,使被估计指标X X落在落在区间(区间(x1x1,x2x2)内的概率)内的概率1-1-l0101,为已知的。,为已知的。l即即P P(x1Xx2)=1-x1Xx2)=1-是给定的。我们称区是给定的。我们称区间(间(x1 x1,x2 x2)为总体指标)为总体指标X X的置信区间,其的置信区间,其估计置信度为估计置信度为1 1一一,称,称为显著性水平,为显著性水平,x
25、1x1是置信下限,是置信下限,x2x2是置信上限。是置信上限。某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样本,进亩作为样本,进行实割实测,得到样本的平均亩产量为行实割实测,得到样本的平均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。试以概率千克。试以概率95.45%95.45%保证,估计该农场保证,估计该农场1000010000亩小麦平均亩产量亩小麦平均亩产量的可能范围。的可能范围。例例 某农场进行小麦产量的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 抽样推断19619 抽样 推断 19619
限制150内