第七章 抽样推断.pptx
《第七章 抽样推断.pptx》由会员分享,可在线阅读,更多相关《第七章 抽样推断.pptx(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 抽样推断抽样推断1 通过本章的教学,学生应达到下列要求:通过本章的教学,学生应达到下列要求:(1)(1)了解抽样推断的内涵、特点、理论基础了解抽样推断的内涵、特点、理论基础(2)(2)掌握抽样误差的内涵、主要影响因素掌握抽样误差的内涵、主要影响因素(3)(3)掌握抽样估计的内涵掌握抽样估计的内涵(4)(4)掌握抽样平均误差、极限误差与概率度的内掌握抽样平均误差、极限误差与概率度的内涵及相互之间的关系涵及相互之间的关系(5(5)具备基本的抽样方案设计能力)具备基本的抽样方案设计能力2 v抽样推断的一般问题抽样推断的一般问题v抽样推断中的几个基本概念抽样推断中的几个基本概念v抽样误差
2、抽样误差v抽样估计的方法抽样估计的方法v抽样方案设计抽样方案设计3 为了为了实现本章教学目的,在教学过程中应以下列内实现本章教学目的,在教学过程中应以下列内容作为本章教学重点:容作为本章教学重点: 1)抽样估计的理论依据)抽样估计的理论依据2)参数估计的优良标准)参数估计的优良标准3)抽样误差的影响因素)抽样误差的影响因素4)抽样平均误差和极限误差的含义及计算)抽样平均误差和极限误差的含义及计算5)各种抽样方案的设计)各种抽样方案的设计4 1)抽样推断的两个理论依据)抽样推断的两个理论依据2)抽样平均误差、抽样极限误差与概率度之)抽样平均误差、抽样极限误差与概率度之间的关系及其运用间的关系及其
3、运用3)如何根据实际情况设计相应的抽样方案)如何根据实际情况设计相应的抽样方案5关键词关键词:抽样:抽样:sample,sampling; 样本:样本:sample;样本统计量:样本统计量:sample statistic;样本值:样本值:sample value;样本(平)均值:样本(平)均值:sample mean;样本平均数:样本平均数:sample average;随机抽样:随机抽样:sampling at random;样本方差:样本方差:sample variance;抽样误差:抽样误差:sampling error;样本标准差:样本标准差:sample standard devi
4、ation6质质量量质质现象的数现象的数量方面量方面指标指标统计调查、统计调查、统计整理和统计整理和分组分组总量指标总量指标相对指标相对指标平均指标平均指标现象数量特征现象数量特征的动态对比的动态对比动态数列、动态数列、统计指数统计指数现象之间关系的分析现象之间关系的分析相关关系分析相关关系分析通过抽样反映现象的数量特征通过抽样反映现象的数量特征抽样推断抽样推断7第一节第一节 抽样推断的一般问题抽样推断的一般问题v抽样推断的特点抽样推断的特点:1)是一种由部分推断总体的认识方法)是一种由部分推断总体的认识方法2)是建立在随机原则基础上的)是建立在随机原则基础上的3)运用的是概率估计的方法)运用
5、的是概率估计的方法样本均值总体均值;xXxaX4)抽样误差可以事先计算并加以控制)抽样误差可以事先计算并加以控制8v抽样推断的理论基础抽样推断的理论基础大数定律大数定律、中心极限中心极限定理定理样本单位数样本平均数,大数定律:nxXxpiin1)()1lim1)大数定律大数定律随着试验次数的随着试验次数的增多增多,某事件发,某事件发生的频率逐渐稳定于某个生的频率逐渐稳定于某个常数常数2)中心极限定理中心极限定理是研究是研究变量和变量和分布的。如果总分布的。如果总体变量存在有限的数学期望和方差,无论总体的变体变量存在有限的数学期望和方差,无论总体的变量具有怎样的分布,只要满足现有的条件,那么,量
6、具有怎样的分布,只要满足现有的条件,那么,当当n很大很大时时,它们的和它们的和就就近似地服从正态分布近似地服从正态分布。9总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布抽样均值的抽样分布与总体分布的关系抽样均值的抽样分布与总体分布的关系10的正态分布,方差为逼近数学期望为则样本平均数),足够大(一般要求只要样本容量的总体,方差为均数为对任意一个具有总体平nxnn2230),(2nNx)(xEx样本均值11总体总体N样本容量为样本容量为n的的所有样本所有样本计算出每一个计算出每一个样本的均值
7、样本的均值xx的抽样分布的抽样分布抽样分布的形成过程抽样分布的形成过程12第二节第二节 抽样推断中的几个基本概念抽样推断中的几个基本概念13v总体和样本总体和样本1、总体(全及总体)、总体(全及总体)要认识的研究对象的全要认识的研究对象的全体。有体。有有限总体有限总体和和无限总体无限总体之分。之分。N有限总体的总体单位数有限总体的总体单位数在时间、地点一定的条件下,被推断的总体是在时间、地点一定的条件下,被推断的总体是确定确定的、唯一的。的、唯一的。2、样本样本从全及总体中随机抽取的部分单位所从全及总体中随机抽取的部分单位所组成的集合体。用组成的集合体。用n表示样本单位数。表示样本单位数。样本
8、不具有唯一性、是不确定的,但样本一旦抽定样本不具有唯一性、是不确定的,但样本一旦抽定就是已知的就是已知的14v参数和统计量参数和统计量1、参数参数反映总体数量特征的指标反映总体数量特征的指标就特定的总体,其参数具有就特定的总体,其参数具有唯一性唯一性、确定性确定性和和未知性未知性特征特征FXFNXX或总体平均数(均值):常用的统计参数有:FFXXNXX222)()(或总体方差:15QPPXPNNQNNPpp2011;:是非标志的均值和方差;是非标志:2、统计量统计量根据样本值计算的综合指标,是反映根据样本值计算的综合指标,是反映样本数量特征的指标样本数量特征的指标1)统计量是样本变量的函数;)
9、统计量是样本变量的函数;2)统计量本身是一个随机变量;)统计量本身是一个随机变量;3)当抽定一个样本时,就能计算相应的统计量值,)当抽定一个样本时,就能计算相应的统计量值,所以统计量是已知的(还可根据需要构造统计量)所以统计量是已知的(还可根据需要构造统计量)16122*222nxxsffxxnxxsfxfnxx)(样本修正方差:)(或)(样本方差:或样本均值:)1 (,21pppnnxpp方差:样本抽样成数的均值、17v样本容量和样本个数样本容量和样本个数、样本容量样本容量一个样本所包含的单位数,用一个样本所包含的单位数,用表示,是有限的表示,是有限的常用),称为小样本(试验中用大样本);称
10、为大样本(实际中常30,30nn 、样本个数(样本可能数目)样本个数(样本可能数目)从一个特定从一个特定的总体中可能抽出多少个样本。样本个数的多少的总体中可能抽出多少个样本。样本个数的多少与样本容量和抽样方法等因素直接相关与样本容量和抽样方法等因素直接相关v重复抽样和不重复抽样重复抽样和不重复抽样18 第三节第三节 抽样误差抽样误差19一、抽样误差一、抽样误差在随机原则条件下,由于偶然性因素致使在随机原则条件下,由于偶然性因素致使样本各单位的结构与总体的单位结构不同而引样本各单位的结构与总体的单位结构不同而引起的样本指标值与总体值之间的绝对离差。起的样本指标值与总体值之间的绝对离差。误误差差登
11、记性误差登记性误差存在于全面、非全面调存在于全面、非全面调查中。理论上可以消除查中。理论上可以消除代表性误差代表性误差(只存在于非只存在于非全面调查中全面调查中)系统性误差系统性误差非概率抽非概率抽样引起的样引起的抽样误差抽样误差概率抽样概率抽样(难以消除,但可控制)(难以消除,但可控制)20二、影响抽样误差大小的主要因素二、影响抽样误差大小的主要因素1)样本容量的大小。)样本容量的大小。n越大,抽样误差越小。越大,抽样误差越小。2)总体各单位变量值离散程度的大小。)总体各单位变量值离散程度的大小。 小,抽小,抽样误差就小。样误差就小。3)抽样方式的不同。重复抽样的误差要比不重)抽样方式的不同
12、。重复抽样的误差要比不重复抽样的大。复抽样的大。4)抽样的组织形式)抽样的组织形式三、三、抽样平均误差抽样平均误差样本指标的标准差样本指标的标准差主要介绍抽样平均数和抽样成数的平均误差主要介绍抽样平均数和抽样成数的平均误差21抽样平均误差抽样平均误差抽样平均数(成数)的标准差,抽样平均数(成数)的标准差,反映了抽样误差的一般水平反映了抽样误差的一般水平1)是抽样平均数(成数)与是抽样平均数(成数)与其均值其均值之间的平均之间的平均差异程度差异程度2)反映了抽样平均数(成数)与反映了抽样平均数(成数)与总体平均数总体平均数(总体成数)之间的平均离散程度(总体成数)之间的平均离散程度可能的样本数目
13、抽样平均数的标准差)(抽样平均误差)差、抽样平均数的平均误MMxExxx2122间的平均离散程度样本均值与总体均值之)(,)(由于:MXxXxEx2的平方根成反比与样本容量差成正比;抽样平均误差与总体方)在重复抽样条件下:(nnx1差位数来控制抽样平均误)可以通过调整样本单的仅为比总体标准差小得多,)抽样平均数的标准差三者的关系:2112n23来代估计量未知时,则用它的无偏注:总体方差)(很大时:当)(不重复抽样条件下:2*22211)2(sNnnNNnNnxx)()()不重复抽样时:()()重复抽样时:()()(抽样平均误差)、抽样成数的平均误差NnnPPnPPMPpMpEppppp1121
14、1222当当总体总体成数未成数未知时,知时,则用样则用样本成数本成数替代。替代。24四、四、抽样极限误差抽样极限误差(也称允许误差范围)也称允许误差范围)是按要求确定的误差的可能范围,是个误是按要求确定的误差的可能范围,是个误差区间。差区间。ppppppxxxxxxpPpPpPPpxXxXxXXx等价于:表示:抽样成数的极限误差用等价于:表示:用抽样平均数的极限误差25五、五、概率度概率度txxxxnXxtnXxXNnxnNx;而)(标准化过程),(),(根据中心极限定理:10 求得的求得的t值,查标准正态分布表后可得到相应值,查标准正态分布表后可得到相应的概率的概率F(t)26)()();(
15、)(tFtPpPtFtXxPpxt=1:F(t)=68.27%;t=1.64:F(t)=90%;t=1.96:F(t)=95%; t=2:F(t)=95.45%;t=3时,时,F(t)=99.73%27六、六、抽样估计的精度抽样估计的精度抽样误差越大,样本值与总体值之间的误抽样误差越大,样本值与总体值之间的误差就大,估计的精度就越低。差就大,估计的精度就越低。相同的允许误差范围,对高低水平不同的现相同的允许误差范围,对高低水平不同的现象来说,反映的意义是不同的。象来说,反映的意义是不同的。,;表示:或估计精度用;(抽样误差系数)或误差率相对误差范围ppxxpxppxxpxAAAApxXxx11
16、28第四节抽样估计的方法第四节抽样估计的方法一、抽样估计一、抽样估计即以样本的实际资料为依即以样本的实际资料为依据,计算相应的样本指标(统计量),对总据,计算相应的样本指标(统计量),对总体作出数量上的估计和判断。体作出数量上的估计和判断。抽样抽样估计估计点估计点估计用样本统计量直接估计用样本统计量直接估计总体参数总体参数区间估计区间估计用一个区间及其出现用一个区间及其出现的概率来估计总体参数的概率来估计总体参数2911.1302122122122)(得:)(其中:)(已知,则:,且总体方差服从正态分布或布定理可知:如果总体由样本平均数的抽样分区间:如:总体平均数的置信xxxxZxXZxPZX
17、xZPXxZZZZPn 即用同样方法构造的总体参数的多个区间中,包含即用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为总体参数的区间比例为100( )301130212212)(得:。其中:而:)(分布:则抽样平均数服从知,且正态分布的方差未如果xxxxtxXtxPnXxttttPtn 即:即:用同样方法构造的总体参数的多个区间中,有用同样方法构造的总体参数的多个区间中,有100( )的区间比例包含了总体平均数)的区间比例包含了总体平均数31二、抽样估计的特点:二、抽样估计的特点:)在逻辑上运用归纳推理)在逻辑上运用归纳推理)在方法上运用不确定的概率估计方法)在方法上运用不确定的
18、概率估计方法)估计的结论存在一定的抽样误差)估计的结论存在一定的抽样误差三、抽样估计的优良标准三、抽样估计的优良标准)无偏性无偏性经过多次反复抽样,则多个样经过多次反复抽样,则多个样本指标值的平均数应该等于总体指标值本指标值的平均数应该等于总体指标值如抽样平均数、抽样成数、样本修正方差就如抽样平均数、抽样成数、样本修正方差就是无偏估计量是无偏估计量3222*;)()(等于总体方差:样本修正方差的平均数;)(总体成数:样本成数的平均数等于于总体平均数:样本平均数的平均数等sEPpEXxE2)一致性一致性根据大数定律,当样本容量根据大数定律,当样本容量n充分大时,则样本值无限接近总体值充分大时,则
19、样本值无限接近总体值1,lim)(即:具有“一致性”的要求体平均数的估计量如:抽样平均数作为总XxPn333)有效性有效性用样本指标估计总体时,要求用样本指标估计总体时,要求作为优良估计量的方差应比其他估计量(非优作为优良估计量的方差应比其他估计量(非优良估计量)的方差小良估计量)的方差小更有效比),则称()(,有:对于固定的,都是总体的无偏估计量和如果两个统计量:212121DDn在在选择估计量时,一般应首先考虑选择估计量时,一般应首先考虑“无偏估无偏估计量计量”,然后再进一步选择,然后再进一步选择“有效估计量有效估计量”;对于大样本则考虑选择对于大样本则考虑选择“一致估计量一致估计量”样本
20、平均数具有:无偏性、有效性和一致性样本平均数具有:无偏性、有效性和一致性34四、两种具体的抽样估计方法四、两种具体的抽样估计方法v已知抽样误差范围,求概率保证程度和置已知抽样误差范围,求概率保证程度和置信区间信区间计对总体参数进行区间估)(及求:;已知、样本的)2 ;) 12*tFtsxxx例例1:对某型号的电子元件进行耐用性能检查,对某型号的电子元件进行耐用性能检查,抽查的资料如下表。要求耐用时数的允许误差抽查的资料如下表。要求耐用时数的允许误差范围范围x=10.5小时。试估计该批电子元件的平小时。试估计该批电子元件的平均耐用时数。(重复抽样)均耐用时数。(重复抽样)35耐用时数(小时)耐用
21、时数(小时)元件数(元件数(f)组中值(组中值(x)900小时以下小时以下9009509501000100010501050110011001150115012001200小时以上小时以上126354393187592597510251075112511751225 合合 计计100某某电子元件耐用时数统计表电子元件耐用时数统计表36(小时)(小时)(小时)2 . 510091.5191.515 .10551001055502nffxxfxfxx解:解:1)根据抽样资料计算样本平均数和标)根据抽样资料计算样本平均数和标准差,由此可得到抽样平均误差准差,由此可得到抽样平均误差2)根据给定的误差范
22、围和平均误差求解)根据给定的误差范围和平均误差求解t及及概率概率37%66.959566.002.2191.55 .10,即概率为)(得:,查标准正态分布概率表根据公式,可得:tFtxx3)根据给定的允许误差范围和平均误差,确定)根据给定的允许误差范围和平均误差,确定总体参数置信区间的上下限:总体参数置信区间的上下限:小时上限小时下限即:10665 .105 .105510455 .105 .1055xxxxxx说明:有说明:有95.66%的的概率保证(或把握程度)认为概率保证(或把握程度)认为该该批电子元件的平均耐用时数在批电子元件的平均耐用时数在10451066小时之间。小时之间。38例例
23、2:仍利用例:仍利用例1的资料:设该厂的产品质量检验标的资料:设该厂的产品质量检验标准规定,元件耐用时数达准规定,元件耐用时数达1000小时与上为合格品,小时与上为合格品,要求合格率估计的误差范围不超过要求合格率估计的误差范围不超过5%。试估计该批。试估计该批电子元件的合格率电子元件的合格率解:解:1)计算样本合格率和方差,可得抽样平均误差:)计算样本合格率和方差,可得抽样平均误差:%86. 21000819. 0)1 (0819. 009. 091. 0)1 (%911009121nppppnnppp39%96%5%91%86%5%91xxpp上限下限限:求出总体合格率的上下已计算的平均误差
24、,根据给定的极限误差和%16.9276. 1%86. 2%5)(,查表得:求概率:tFtpp说明:有概率说明:有概率92.16%的保证程度认为该批电子元件的的保证程度认为该批电子元件的合格率在合格率在86%96%之间之间40v给出概率或概率度,求解抽样极限误差和置给出概率或概率度,求解抽样极限误差和置信区间信区间例例3:某城市进行居民家计调查。随机抽取:某城市进行居民家计调查。随机抽取400户居民家庭,调查得到年均每户耐用品消费支户居民家庭,调查得到年均每户耐用品消费支出为出为20000元,标准差为元,标准差为8000元。要求以元。要求以95%的概率估计该城市居民家庭年均每户的耐用品的概率估计
25、该城市居民家庭年均每户的耐用品消费支出。(消费支出。(N未知,按重复抽样计算未知,按重复抽样计算)(元)则:,已知4004008000800020000nxx解:解:1)4196. 195. 02ttF查表得:,)()根据给定的置信度元上限元下限则置信区间的上下限:元:20784784200001921678420000)(78440096.1)3xxt说明:说明:有有95%的概率保证程度认为该市居民家庭年均的概率保证程度认为该市居民家庭年均耐用消费品支出在耐用消费品支出在1951620784元之间。元之间。42练习练习1:为了了解某市电信营业厅大客户对:为了了解某市电信营业厅大客户对该电信的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章抽样推断
限制150内