抽样的误差与抽样估计的方法.pptx
《抽样的误差与抽样估计的方法.pptx》由会员分享,可在线阅读,更多相关《抽样的误差与抽样估计的方法.pptx(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教学目的:通过对本章的学习,了解教学目的:通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计抽样估计的基本原理,掌握抽样估计的基本方法。的基本方法。教学设计:对主要的知识点进行讲解,通过在线教学设计:对主要的知识点进行讲解,通过在线学习平台的学习平台的“教学辅导教学辅导”与与“参考资料参考资料”栏目获栏目获取相关知识,从而对重要的知识点有进一步的认取相关知识,从而对重要的知识点有进一步的认识,在此基础上通过练习来加深对相关问题的理识,在此基础上通过练习来加深对相关问题的理解,同时通过网上实时与非实时的答疑解决疑难解,同时通过网上实时与非实时的答疑解决疑难问题。问题。重难点讲解:抽样误差的概
2、念及计算;抽样估计重难点讲解:抽样误差的概念及计算;抽样估计的方法的方法第一节第一节 抽样推断的一般问题抽样推断的一般问题第二节第二节 抽样误差抽样误差第三节第三节 抽样估计的方法抽样估计的方法第四节第四节 抽样组织设计抽样组织设计统计调查方法统计调查方法 全面调查全面调查非非全面调查全面调查 普普 查查 抽样调查抽样调查 重点调查重点调查 典型调查典型调查相关知识回顾:相关知识回顾: 统计报表统计报表 抽样调查抽样调查: :按照按照随机原则随机原则,从总体中抽取一部,从总体中抽取一部分样本单位,根据对样本单位的调查结果来推分样本单位,根据对样本单位的调查结果来推断总体的数量特征。断总体的数量
3、特征。 一、抽样推断的意义一、抽样推断的意义 1 1、概念:、概念: 抽样推断是在抽样调查的基础上,利用样抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。相应数量特征的一种统计分析方法。 第一节第一节 抽样推断的一般问题抽样推断的一般问题推断推断 2 2、特点、特点(1 1)由部分推算整体的一种方法;)由部分推算整体的一种方法;(2 2)抽样推断建立在随机抽样的基础上;)抽样推断建立在随机抽样的基础上;(3 3)抽样推断是运用概率估计的方法;)抽样推断是运用概率估计的方法;(4 4)抽样推断的误
4、差可以计算并加以控制。)抽样推断的误差可以计算并加以控制。推断推断二、抽样推断的内容二、抽样推断的内容(一)参数估计(一)参数估计 用样本的观察资料来估计所研究现象总体的用样本的观察资料来估计所研究现象总体的水平、结构、规模等数量特征,这种推断方法称水平、结构、规模等数量特征,这种推断方法称为参数估计。为参数估计。(二)假设检验(二)假设检验 对总体的状况作出某种假设,然后根据样本对总体的状况作出某种假设,然后根据样本所提供的信息来判断总体未知参数事先所作的假所提供的信息来判断总体未知参数事先所作的假设是否成立的统计分析方法称为假设检验。设是否成立的统计分析方法称为假设检验。三三、抽样的几个基
5、本概念、抽样的几个基本概念 1 1、总体、总体 也称全及总体,指所要认识的研究对象全也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,由具有某种共同性质许多单位组成的集合体,一般用体,一般用N N表示。表示。 无限总体、有限总体无限总体、有限总体 2 2、样本、样本 又称子样,是从全及总体中随机抽取出来,又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体,作为代表这一总体的那部分单位组成的集合体,一般用一般用n n表示。表示。 3 3、随机抽样、随机抽样 按随机原则从总体中抽取样本单位。按随机原则从总体中抽取样本单位。 4 4、非随机抽
6、样、非随机抽样 根据市场调查者的主观分析判断来选取样本根据市场调查者的主观分析判断来选取样本单位。包括偶遇抽样、主观抽样、定额抽样。单位。包括偶遇抽样、主观抽样、定额抽样。5 5、参数、参数 根据总体各单位的标志值或标志特征计算根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及的,反映总体数量特征的综合指标,称为全及指标,由总体各单位的标志值或标志特征所决指标,由总体各单位的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,称定,全及指标的指标值是确定的,唯一的,称为参数。为参数。2 和和总总体体方方差差体体均均值值,常常用用的的总总体体参参数数有有总总对对于
7、于总总体体中中的的数数量量标标志志X FXFNXX FFXXNXX222 对于总体中的品质标志:对于总体中的品质标志: 由于不能用数量来表示,总体参数通常用成数由于不能用数量来表示,总体参数通常用成数P P表示。表示。成数:总体中具有某种性质的单位数在总体全部单位数成数:总体中具有某种性质的单位数在总体全部单位数中的比重,用中的比重,用P P表示。总体中不具有某种性质的单位数在表示。总体中不具有某种性质的单位数在总体中所占的比重,用总体中所占的比重,用Q Q表示表示。有有P+Q=1 P+Q=1 X:X:表示总体变量,有表示总体变量,有N N个单位,所以可以表示为个单位,所以可以表示为nXXX,
8、21道道性性质质的的单单位位数数,可可以以知知表表示示总总体体中中不不具具有有某某种种质质的的单单位位数数,表表示示总总体体中中具具有有某某种种性性表表示示总总体体单单位位数数,用用01NNNNNN 01PNN /1 当某种标志,它的标志表现只有是非两种,可当某种标志,它的标志表现只有是非两种,可 以用以用“1”“1”表示标志表现为表示标志表现为“是是”的标志的标的标志的标志表现,志表现,“0”“0”表示标志表现为表示标志表现为“非非”的标志的标志的标志表现,在此情况下的标志表现,在此情况下: : PNNNNNXP 10101 PQQPPQPQQPNNQNPNNPNPP 22120212022
9、10 PQNN 1/0 6 6、统计量、统计量 根据样本各单位标志值或标志属性计算的综根据样本各单位标志值或标志属性计算的综合指标称为统计量。样本统计量是用来估计总合指标称为统计量。样本统计量是用来估计总体参数的。反映样本的数量特征。体参数的。反映样本的数量特征。 fxfnxx222()()xxxxff n npxp 2ppq 参数参数统计量统计量例题:某批产品共例题:某批产品共500500件,合格品件,合格品480480件,件,不合格品不合格品2020件,要求计算成数合格品率、件,要求计算成数合格品率、PXP %96500480 P%96 PX196. 0%4%96 PQP 7 7、样本容量
10、、样本容量 指一个样本所包含的单位数。指一个样本所包含的单位数。8 8、样本个数、样本个数 又称样本可能数目,是指从一个总体中可能又称样本可能数目,是指从一个总体中可能抽取的样本个数。抽取的样本个数。9 9、重复抽样、重复抽样 从总体从总体N N个单位中随机抽取样本容量为个单位中随机抽取样本容量为n n的样的样本,每次从总体中抽取一个,连续进行本,每次从总体中抽取一个,连续进行n n次实验次实验构成抽样样本。每次抽出一个单位把结果登记构成抽样样本。每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。共可抽下来又放回,重新参加下一次的抽选。共可抽取容量为取容量为n n的样本的样本 个。个
11、。nN1010、不重复抽样、不重复抽样 从总体从总体N N个单位中随机抽取容量为个单位中随机抽取容量为n n的样本,的样本,每次从总体中抽取一个,连续进行每次从总体中抽取一个,连续进行n n次实验构次实验构成抽样样本。但每次抽选出的单位就不再放回成抽样样本。但每次抽选出的单位就不再放回参加下一次抽选。共可抽取容量为参加下一次抽选。共可抽取容量为n n的样本的样本N(N-1)(N-2).(N-n+1)N(N-1)(N-2).(N-n+1)个。个。 结论:总体单位数一致,在相同样本容量的情结论:总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的况下,重复抽样的样本个数大于不
12、重复抽样的样本个数。样本个数。 一、抽样误差的概念一、抽样误差的概念概念:概念: 指由于随机抽样的偶然因素使样本各单指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。抽样指标和全及指标之间的绝对离差。 )()(抽抽样样误误差差偶偶然然性性代代表表性性误误差差系系统统偏偏误误系系统统性性代代表表性性误误差差代代表表性性误误差差登登记记性性误误差差调调查查误误差差 系统偏误与登记性误差可以防止或避免,抽样系统偏误与登记性误差可以防止或避免,抽样误差不可避免,只能加以控制。误差不可避免,只能加以控制
13、。影响抽样误差大小的因素:影响抽样误差大小的因素:(1 1)总体各单位标志值的差异程度;)总体各单位标志值的差异程度;(2 2)样本单位数;)样本单位数;(3 3)抽样方法;)抽样方法;(4 4)抽样组织形式。)抽样组织形式。二、抽样平均误差二、抽样平均误差( (抽样指标的标准差抽样指标的标准差) ) 反映抽样误差一般水平的指标。是所有可能反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差。出现的样本指标和总体指标的平均离差。1 1、抽样平均数的平均误差,也可称为、抽样平均数的平均误差,也可称为抽样平均抽样平均数的标准差数的标准差( (表明各样本均值与总体均值离差表明各样
14、本均值与总体均值离差的一般水平)的一般水平)(1 1)重复抽样情况下)重复抽样情况下 )(计计算算公公式式n nx x :样本单位数:样本单位数总体标准差总体标准差n: 例:设有三个数例:设有三个数8 8、1010、1212,这一总体的均值、标,这一总体的均值、标准差分别为:准差分别为:10312108 X1.6331.6333 32 210)10)(12(122 210)10)(10(102 210)10)(8(8N N2 2x xx x用重复抽样的方法,从用重复抽样的方法,从8 8、1010、1212三个数中抽两个三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的数构成样本,求样本
15、的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表一般水平,所有可能的样本以及样本的平均值列表如下:如下:样本个数样本个数样本变量样本变量样本均值样本均值 平均数离差平均数离差 离差平方离差平方 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 8 8 8 10 8 12 10 10 10 12 10 8 12 12 12 8 12 10 8 9 10 10 11 9 12 10 11-2-1 0 0 1 2 0 1-1 410014011 合合 计计 90 0 1210990)( MxxE样样本本平平均均数数的的平平均均数数抽样平均数的标准差:抽样平
16、均数的标准差: 1 1. .1 15 55 5x x 9122nxEx 现在按重复抽样误差公式计算抽样平均误差现在按重复抽样误差公式计算抽样平均误差1 1. .1 15 55 51 1. .6 63 33 32 2 nx 几个基本关系:几个基本关系: a. a.样本平均数的平均数等于总体平均数;样本平均数的平均数等于总体平均数; b. b.抽样平均误差实质上就是抽样平均数的标准抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;差,也称为抽样标准误差;c.c.抽样平均数的标准差(抽样平均误差)比总体标抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的准差小很多,仅
17、为总体标准差的 。 d.d.可以通过调整样本单位数可以通过调整样本单位数n n来控制抽样平均误差来控制抽样平均误差。n1(2)(2)在不重复抽样的情况下在不重复抽样的情况下 12NnNnx )1(2 Nnnx 样本个数样本个数样本变量样本变量样本均值样本均值 平均数离差平均数离差 离差平方离差平方 1 1 2 2 3 3 4 4 5 5 6 6 8 10 8 12 10 12 10 8 12 8 12 10 9 10 11 9 10 11-10 1 -1 0 1 101101 合合 计计 60 0 410660)( MxxE样样本本平平均均数数的的平平均均数数 816.6420 0 x x n
18、xEx 按不重复抽样误差公式计算抽样平均误差按不重复抽样误差公式计算抽样平均误差816. 0)1323(22633. 112 NnNnx )( (差差重重复复抽抽样样的的抽抽样样平平均均误误nNnNn 12代代替替标标准准差差经经常常是是未未知知的的,用用样样本本在在计计算算中中,总总体体标标准准差差s s 12 nxxs )(2nxxs 某工厂有某工厂有15001500个工人,用简单随机重复抽样个工人,用简单随机重复抽样的方法抽取的方法抽取5050个工人作为样本,调查其工资水平,个工人作为样本,调查其工资水平,资料如下:资料如下:月平均工资月平均工资(元)(元)524524534534540
19、540550550560560580580600600660660工人数工人数 (人)(人)4 46 69 910108 86 64 43 3计算样本平均数和抽样平均误差。计算样本平均数和抽样平均误差。5 56 60 0( (元元)5 50 03 36 66 60 06 65 53 34 44 45 52 24 4 fxfx 3 32 2. .4 45 5(元元)5 50 03 34 45 56 60 0) )( (5 52 24 42 2 2)560660(2ffxx )4 4. .5 59 9( (5 50 03 32 2. .4 45 5元元 nx 2 2、抽样成数的平均误差(表明各样本
20、成数与总、抽样成数的平均误差(表明各样本成数与总体成数绝对离差的一般水平)体成数绝对离差的一般水平)(1)(1)在重复抽样下在重复抽样下n nP)P)P(1P(1P P )(2nx P P:总体成数:总体成数n:n:样本单位数样本单位数(2)(2)在不重复抽样下在不重复抽样下1 1) )- -( (N N n nn n) )- -P P) )( (N NP P( (1 1P P ) ) )N Nn n(1(1n np)p)p(1p(1p p( ( 在实际计算中,用样本成数在实际计算中,用样本成数p p代替总体成数代替总体成数P Pnnp1 从从20002000件产品中抽查件产品中抽查20020
21、0件,其中合格品件,其中合格品190190件,件,要求:计算样本合格率及其抽样平均误差。要求:计算样本合格率及其抽样平均误差。 解:在重复抽样下:解:在重复抽样下:95. 0200/190 p0 0. .0 01 15 54 42 20 00 00 0. .0 05 50 0. .9 95 5n np p) )p p( (1 1 p 在不重复抽样下:在不重复抽样下:0 0. .0 01 14 46 6) )N Nn n( (1 1n np p) )p p( (1 1p p 某电子产品使用寿命在某电子产品使用寿命在30003000小时以下为不合格小时以下为不合格品。现在用简单随机抽样方法从品。现
22、在用简单随机抽样方法从50005000个产品中抽取个产品中抽取100100个对其使用寿命进行调查,结果如下表所示个对其使用寿命进行调查,结果如下表所示 使用寿命(小时)使用寿命(小时) 产品数量(个)产品数量(个)30003000以下以下3000300040004000400040005000500050005000以上以上2 2303050501818合计合计100100要求:要求:(1)按重复抽样和不重复抽样计算该产品平均)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差;寿命的抽样平均误差;(2)按重复抽样和不重复抽样计算该产品合格)按重复抽样和不重复抽样计算该产品合格率的抽样平均
23、误差。率的抽样平均误差。解:根据资料可算出解:根据资料可算出 使用寿命(小时)使用寿命(小时) 组中值组中值 产品数量(个)产品数量(个) xfxf30003000以下以下3000300040004000400040005000500050005000以上以上25002500350035004500450055005500 2 2 30 30 50 50 18 18 500050001050001050002250002250009900099000 合计合计 100 100434000434000)(4340100434000小时小时样本均值样本均值 fxfx)(03.73110018434
24、05500243402500222小时样本标准差ffxx%9810098 p样样本本合合格格品品率率)(.小时小时样平均误差样平均误差重复抽样下平均寿命抽重复抽样下平均寿命抽17310003731 nx)(37.725000100110003.731122小小时时抽抽样样平平均均误误差差不不重重复复抽抽样样下下平平均均寿寿命命 Nnnx 014. 01000196. 010002. 098. 01 nppp 平平均均误误差差重重复复抽抽样样下下合合格格率率抽抽样样 01386. 098. 01000196. 05000100110002. 098. 011 样样平平均均误误差差不不重重复复抽抽
25、样样下下合合格格率率抽抽Nnnppp 三、抽样极限误差三、抽样极限误差 指变动的抽样指标与确定的总体指标之间指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。离差的可能范围,统计上称为抽样极限误差。设设误误差差抽抽样样平平均均数数的的抽抽样样极极限限:x 差差抽抽样样成成数数的的抽抽样样极极限限误误:p Xxx PpP pppPp xxxXx .,),()称称为为置置信信区区间间或或(ppxxppxx 四、抽样误差的概率度四、抽样误差的概率度 xt x xppt 抽抽样样误误差差的的概概率率度度。就就称称为为,得得到到数数值值除除以以或或者者用用除除以以用用ttppx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 误差 估计 方法
限制150内