《抽样估计的基本方法.ppt》由会员分享,可在线阅读,更多相关《抽样估计的基本方法.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二节第二节 抽样估计的基本方法抽样估计的基本方法所谓抽样估计就是根据样本提供的信息对总体的所谓抽样估计就是根据样本提供的信息对总体的某些特征进行估计或推断。用来估计总体特征的某些特征进行估计或推断。用来估计总体特征的样本指标也叫估计量或统计量,待估计的总体指样本指标也叫估计量或统计量,待估计的总体指标也叫总体参数,所以对总体数字特征的抽样估标也叫总体参数,所以对总体数字特征的抽样估计也叫参数估计。参数估计可分成点估计和区间计也叫参数估计。参数估计可分成点估计和区间估计两类。估计两类。一、点估计一、点估计点估计,也叫定值估计,就是直接以一个样本估点估计,也叫定值估计,就是直接以一个样本估计量来
2、估计总体参数。当己知一个样本的观察值计量来估计总体参数。当己知一个样本的观察值时,便可得到总体参数的一个估计值。点估计常时,便可得到总体参数的一个估计值。点估计常用的方法有两种:矩估计法和极大似然估计法。用的方法有两种:矩估计法和极大似然估计法。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度与可靠程度要求不高的情况面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一(一一)矩估计法矩估计法矩估计法是英国统计学家矩估计法是英国统计学
3、家KPearson提出的。提出的。其基本思想是:由于样本来源于总体,样本矩其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。可知,样本矩依概率收敛于总体矩。(二二)极大似然估计法极大似然估计法 极大似然估计法是由极大似然估计法是由fisher提出的一种参数提出的一种参数估计方法。其基本思想是:设总体分布的函数估计方法。其基本思想是:设总体分布的函数形式已知,但有未知参数可以取很多值,在未形式已知,但有未知参数可以取很多值,在未知参数一切可能取值中选一个使样本观察值出知参数一切可能取值中选一个使
4、样本观察值出现的概率为最大的值作为未知参数的估计值,现的概率为最大的值作为未知参数的估计值,记作,并称为未知参数的极大似然估计值。这记作,并称为未知参数的极大似然估计值。这种求估计量的方法称为极大似然估计法。种求估计量的方法称为极大似然估计法。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一(三三)估计量优劣的标准估计量优劣的标准 评价估计量的优劣常用下列三个标准。评价估计量的优劣常用下列三个标准。1无偏性无偏性 2有效性有效性 3一致性一致性 点点估估计计的的优优点点是是简简单单、具具体体明明确确。但但由由于于样样本本的的随随机机性性,从从一一个个样样本本得得到到的的估估计计值值
5、往往往往不不会会恰恰好好等等于于实实际际值值,总总有有一一定定的的抽抽样样误误差差。而而点点估估计计本本身身无无法法说说明明抽抽样样误误差差的的大大小小,也也无无法法说说明估计结果有多大的把握程度。明估计结果有多大的把握程度。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一(四)影响抽样误差的因素四)影响抽样误差的因素1、总体各单位的差异程度(即标准差的、总体各单位的差异程度(即标准差的大小):大小):越大,抽样误差越大;越大,抽样误差越大;2、样本单位数的多少:、样本单位数的多少:越大,抽样越大,抽样误差越小;误差越小;3、抽样方法:、抽样方法:不重复抽样的抽样误差比不重复抽样的
6、抽样误差比重复抽样的抽样误差小;重复抽样的抽样误差小;4、抽样组织方式:、抽样组织方式:简单随机抽样的误差简单随机抽样的误差最大。最大。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一前面曾指出,为了考察抽样数据与实际数据的差异性,我们计算实际抽样误差,前面曾指出,为了考察抽样数据与实际数据的差异性,我们计算实际抽样误差,只能用抽样平均误差来反映。只能用抽样平均误差来反映。而抽样平均而抽样平均这实际上是做这实际上是做误差的计算,通常要计算总体平均数和所有的样本平均数,误差的计算,通常要计算总体平均数和所有的样本平均数,但实际抽样误差通常是无法计算的,但实际抽样误差通常是无法计算的,
7、不到的。不到的。我们是通过收集一个样本资料方式,来衡量抽样数据与实际数据我们是通过收集一个样本资料方式,来衡量抽样数据与实际数据的差异性的,的差异性的,这必然会出现误差。这必然会出现误差。但对于某一项调查来说,根据客观要求,一般应但对于某一项调查来说,根据客观要求,一般应有一个允许的误差限,也就是说若抽样误差在这有一个允许的误差限,也就是说若抽样误差在这个限度之内,就认为是可允许的,这一允许的误个限度之内,就认为是可允许的,这一允许的误差限度就称为极限误差。差限度就称为极限误差。(五五)抽样极限误差的概念抽样极限误差的概念 面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 一二、区间估
8、计二、区间估计 区间估计就是根据样本估计量以一定可靠程度区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不推断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果布,所以它能给出估计精度,也能说明估计结果的把握程度。设总体参数为的把握程度。设总体参数为 、为由样本确为由样本确定的两个统计量,对于给定的定的两个统计量,对于给定的 ,有,有 ,则称则称(,)为参数的置信度为为参数的置信度为1-a的置信的置信区间。区间。面向21世纪课程教材第四章第四章 抽样
9、与抽样估计 第二节 二步骤步骤 计算样本平均数计算样本平均数 ;搜集总体方差的经验数据搜集总体方差的经验数据 ;或计;或计算样本方差算样本方差 ,即,即区间估计算步骤区间估计算步骤面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二步步骤骤 计算抽样平均误差:计算抽样平均误差:重复抽样时:重复抽样时:不重复抽样时:不重复抽样时:区间估计算步骤区间估计算步骤面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二步步骤骤 计算抽样极限误差:计算抽样极限误差:确定总体平均数的置信区间:确定总体平均数的置信区间:区间估计算步骤区间估计算步骤面向21世纪课程教材第四章第四章 抽样与抽样估计
10、 第二节 二(一一)总体均值的区间估计总体均值的区间估计1总体方差已知时,正态总体均值的区间估计总体方差已知时,正态总体均值的区间估计根据样本平均数的抽样分布定理,若给定根据样本平均数的抽样分布定理,若给定1-a,可由标准正态分布表查得临界值可由标准正态分布表查得临界值 ,即即 上式就是置信度为上式就是置信度为1-a时总体均值的置信区间。时总体均值的置信区间。同时,抽样极限误差可按如下公式来确定:同时,抽样极限误差可按如下公式来确定:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二(大样本条件下)(大样本条件下)样本平均数的样本平均数的极限误差:极限误差:样本成数的极样本成数的极限
11、误差:限误差:Z Z为概率度,是给定概率保证程度下样本均值为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。偏离总体均值的抽样平均误差的倍数。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二Z与相应的概率保证程度存在一一对应关系,与相应的概率保证程度存在一一对应关系,常用常用Z值及相应的概率保证程度为:值及相应的概率保证程度为:z值值 概率保证程度概率保证程度1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二例
12、:某企业生产某种产品的工人有例:某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随人,某日采用不重复抽样从中随机抽取机抽取100人调查他们的当日产量,样本人均产量为人调查他们的当日产量,样本人均产量为35件,产量的样本件,产量的样本标准差为标准差为4.5件,试以件,试以0.9545的置信度估计平均产量的抽样极限误差。的置信度估计平均产量的抽样极限误差。由题意知,样本标准差由题意知,样本标准差s解:解:=1000,样本单位数样本单位数n总体单位数总体单位数N=4.5(件),(件),=100属于大样本,并且采用不重复抽样,属于大样本,并且采用不重复抽样,抽样平均误差抽样平均误差。但抽样
13、平均误差和概率度均未知,因此,我们先求。但抽样平均误差和概率度均未知,因此,我们先求因此,因此,平均产量的抽样极限误差平均产量的抽样极限误差然后,再求概率度然后,再求概率度。题中给出题中给出置信度为置信度为0.9545,因此,因此,=0.0455,=0.02275,通过查表并计算,得概率度通过查表并计算,得概率度因此,我们求得因此,我们求得平均产量的抽样极限误差为:平均产量的抽样极限误差为:解释就是根据就是根据,然后查附表。,然后查附表。概率度概率度求法。求法。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二例:某企业从长
14、期实践中得知,其产品直径例:某企业从长期实践中得知,其产品直径X是一个随机变量,是一个随机变量,服从标准差为服从标准差为0.05的正态分布。从某日产品中随机抽取的正态分布。从某日产品中随机抽取6个,测个,测得其直径分别为得其直径分别为14.8、15.3、15.1、14.7、15.1、15(单位:厘(单位:厘米)。在米)。在0.95的置信度下,求该产品直径的均值置信区间。的置信度下,求该产品直径的均值置信区间。查表得查表得样本均值样本均值抽样平均误差抽样平均误差抽样极限误差抽样极限误差所求的置信区间所求的置信区间【例】【例】某企业生产某种产品的工人某企业生产某种产品的工人有有10001000人,
15、某日采用不重复抽样从人,某日采用不重复抽样从中随机抽取中随机抽取100100人调查他们的当日人调查他们的当日产量,要求在产量,要求在9595的概率保证程度的概率保证程度下,下,估计该厂全部工人的日平均产估计该厂全部工人的日平均产量和日总产量量和日总产量。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)1101141141181181221221261261301301341341381381421121161201241281321361403718232118643368122160285226
16、8823768165605887006489284648600784合计合计100126004144100100名工人的日产量分组资料名工人的日产量分组资料面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二解:解:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二则该企业工人人均产量则该企业工人人均产量 及日总产及日总产量量 的置信区间为:的置信区间为:即该企业工人人均产量在即该企业工人人均产量在124.797124.797至至127.203127.203件之间,其日总产量在件之间,其日总产量在124797124797至至127203127203件之间,估计的可靠程度为件之
17、间,估计的可靠程度为9595。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二2总体方差未知时,正态总体均值区间估计总体方差未知时,正态总体均值区间估计(小样本小样本)根据抽样分布定理,小样本条件下,如果总体是正态根据抽样分布定理,小样本条件下,如果总体是正态分布的,总体标准差未知而需要用样本标准差分布的,总体标准差未知而需要用样本标准差S来代来代替,则由此可得,总体均值的置信度为替,则由此可得,总体均值的置信度为1-a的置信区间:的置信区间:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二给定概率l-a,抽样极限误差为:查表得样本均值样本标准差允许误差所求的置信区间面
18、向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二例:某商场从一批袋装食品中随机抽取10袋,测得每袋(单位:克)重量分别为:789、780、794、762、802、813、770、785、810、806。要求以95%的把握度,估计这批食品平均每袋重量的区间范围。(二二)总体比率的区间估计总体比率的区间估计 根根据据样样本本比比例例的的抽抽样样分分布布定定理理,在在大大样样本本下下,样样本本比比率率的的分分布布趋趋近近于于均均值值为为总总体体比比率率P,方方差差为为p(1-P)的的正正态态分分布布,服服从从标标准准正正态态分分布布 。因因此此,给给定定置置信信度度(1-a),查查正正态态
19、分分布布表表得得Za/2,样样本本比比例例的的抽抽样样极极限限误误差差为为 ,所所以以,总体比率的置信度为总体比率的置信度为1a的置信区间为的置信区间为:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二优质品率P的置信置信区间例:某厂对一批产品的质量进行检验,采用重复抽样抽取样品200只,样品优质率为85%,试计算当把握程度为90%时优质率的区间范围。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 二例:某大学在校学生中随机抽取例:某大学在校学生中随机抽取150名学生(重复),调名学生(重复),调查他们每周看电视的时间,得到资料如下表,要求以查他们每周看电视的时间,得到资
20、料如下表,要求以95.45%的概率把握程度估计该校学生平均每周看电视节目的概率把握程度估计该校学生平均每周看电视节目的时间。的时间。每周看电视的时间(小时)每周看电视的时间(小时)学生数(人)学生数(人)组中值组中值4以下以下203463856848781030910以上以上1411合计合计150以95.45%的概率把握度估计该校学生平均平均每周看电视在8小时以上人数所占比重。三、抽样容量的确定三、抽样容量的确定 样本容量是指样本中含有的总体单位数。一般把样本容量是指样本中含有的总体单位数。一般把抽样数目大于抽样数目大于30的样本的样本 称为大样本,而把抽样数称为大样本,而把抽样数目小于目小于
21、30的样本称为小样本。对社会经济现象进的样本称为小样本。对社会经济现象进行抽样调查一般采用大样本。行抽样调查一般采用大样本。若若规规定定在在一一定定概概率率保保证证程程度度下下允允许许误误差差为为 ,则可得出确定必要的抽样数目的计算公式为则可得出确定必要的抽样数目的计算公式为:若采用不重复抽样,也可确定必要的抽样数目:若采用不重复抽样,也可确定必要的抽样数目:面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 三某大学有学生3000名,根据近年资料,学生的人均月生活费用的标准差为40元,要求误差不超过10元,估计的置信度为95.45%,问需要抽取多少人?已知重复抽样不重复抽样面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 三从从上上述述公公式式和和例例题题可可见见,必必要要的的抽抽样样数数目目受受以以下因素影响:下因素影响:(1)总体方差总体方差(或总体标准差或总体标准差)。(2)允许误差范围。允许误差范围。(3)置信度置信度(1-a)。(4)抽样方法。抽样方法。(5)抽样组织方式。抽样组织方式。面向21世纪课程教材第四章第四章 抽样与抽样估计 第二节 三
限制150内