第四章抽样分布最新精选文档.ppt
《第四章抽样分布最新精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章抽样分布最新精选文档.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章抽样分布最新第四章抽样分布最新本讲稿第一页,共一百零五页统计推断的过程统计推断的过程样样样样本本本本总总体体样本统计样本统计量量例如:样本例如:样本均值、比例、均值、比例、方差方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差例、方差例、方差例、方差2本讲稿第二页,共一百零五页 学习目标学习目标n1.理解概率及概率分布的意义;理解概率及概率分布的意义;n2.掌握抽样的基本概念以及抽样分布的概念;掌握抽样的基本概念以及抽样分布的概念;n3.掌握总体参数点估计的基本方法及其优良掌握总体参数点估计的基本方法及其优良 标准;标准;n4.掌握总体均值和成数指标的估计方法;掌握总体均值和成
2、数指标的估计方法;n5.了解抽样设计的基本内容。了解抽样设计的基本内容。3本讲稿第三页,共一百零五页 第一节第一节 频率、概率与概率分布频率、概率与概率分布n(Omitted)4本讲稿第四页,共一百零五页 第二节第二节 抽样分布抽样分布 一、抽样的基本概念一、抽样的基本概念 抽样涉及的基本概念有:抽样涉及的基本概念有:1.总体与样本总体与样本(在第一章在第一章)2.样本容量与样本个数样本容量与样本个数 3.总体参数与样本统计量总体参数与样本统计量 这些概念是统计学特有的,体现了统计学的基这些概念是统计学特有的,体现了统计学的基本思想与方法。本思想与方法。5本讲稿第五页,共一百零五页(一)样本容
3、量与样本个数(一)样本容量与样本个数 1.样本容量:样本容量:样本是从总体中抽出的部分单位的集合,这个集合的样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,它表明一个样本中所包含的单位数。大小称为样本容量,它表明一个样本中所包含的单位数。一般地说,样本容量大,抽样误差会小,但调查费用会一般地说,样本容量大,抽样误差会小,但调查费用会增加,反之,样本容量过小,又将导致抽样误差增大,甚至增加,反之,样本容量过小,又将导致抽样误差增大,甚至失去抽样推断的价值。因此,在抽样设计中应根据调查目的失去抽样推断的价值。因此,在抽样设计中应根据调查目的和要求认真考虑合适的样本容量。和要求认真考
4、虑合适的样本容量。6本讲稿第六页,共一百零五页2.样本个数:样本个数:样样本本个个数数又又称称样样本本可可能能数数目目,它它是是指指从从一一个个总总体体中中可可能能抽抽取取多多少少个个样样本本。样本个数的多少与抽样方法有关。关于样本个数的计算我们将在“重复抽样与不重复抽样”中介绍。注意:注意:这这个个概概念念只只是是对对有有限限总总体体有有意意义义,对对无无限限总体没有意义!总体没有意义!7本讲稿第七页,共一百零五页(二)总体参数与样本统计量(二)总体参数与样本统计量1.总体参数:总体参数:总总体体分分布布的的参参数数往往往往是是总总体体的的数数量量特特征征,也是统计推断的对象。也是统计推断的
5、对象。常常见见的的总总体体参参数数有有:总总体体平平均均数数指指标标,总总体体成成数数(比比率率)指指标标,总总体体分分布布的的方方差差、标标准准差差,等等等等。它它们们都都是是反反映映总总体体分分布布特特征征的的重重要要指指标标。总总体体成成数数(也也称称总总体体比比率率)指指标标是是指指总总体体中中具具有有某某性性质质的的单单位位数数目目在在总总体体中中所所占的比重,它反映了总体的结构特征。占的比重,它反映了总体的结构特征。8本讲稿第八页,共一百零五页2.样本统计量:样本统计量:通通俗俗地地说说,样样本本统统计计量量是是样样本本的的函函数数。由由于于样样本本是是从从总总体体中中随随机机地地
6、抽抽出出来来的的,因因此此,样样本本统统计计量量也也是是随随机机变变量量。我我们们利利用用样样本本统统计计量量来来估估计计或或推推断断总总体体的的参参数数和和数数量量特特征征。设已有样本设已有样本 ,常见的统计量有:,常见的统计量有:样本平均数样本平均数 9本讲稿第九页,共一百零五页10本讲稿第十页,共一百零五页(三)重复抽样与不重复抽样(三)重复抽样与不重复抽样1.1.重重复复抽抽样样:重重复复抽抽样样(或或重重置置抽抽样样)是是指指从从总总体体中中抽抽出出一一个个样样本本单单位位,记记录录其其标标志志值值后后,又将其放回总体中继续参加下一轮又将其放回总体中继续参加下一轮抽样抽样。重重复复抽
7、抽样样的的特特点点是是:第第一一,n n个个单单位位构构成成的的样样本本是是n n次次试试验验的的结结果果。第第二二,每每次次试试验验是是独独立立的的,即即其其试试验验的的结结果果与与前前次次、后后次次的的结结果果无无关关。第第三三,每每次次试试验验是是在在相相同同条条件件下下进进行行的的,每每个个单单位位在在每每次次试试验验中中选选中中的的机机会会(概概率率)是是相相同同的的。在在重重复复试试验验中中,样样本本可可能能的的个个数是数是Nn,N N为总体单位数,为总体单位数,n n为样本容量。为样本容量。11本讲稿第十一页,共一百零五页2.不不重重复复抽抽样样:不不重重复复抽抽样样亦亦称称为为
8、不不重重置置抽抽样样,即即每每次次从从总总体体抽抽取取一一个个单单位位,登登记记后后不不放放回回原原总总体体,不不参参加加下下一轮抽样。下一次继续从总体中余下的单位抽取样本。一轮抽样。下一次继续从总体中余下的单位抽取样本。其其特特点点是是:n个个单单位位的的样样本本由由 n 次次试试验验结结果果构构成成,但但由由于于每每次次抽抽出出不不重重复复,所所以以实实质质上上相相当当于于从从总总体体中中同同时时抽抽取取n个个样样本本单单位位。如如果果考考虑虑顺顺序序,其其样样本本可可能能个个数数为为 ;如果不考虑顺序,其样本可能个数为;如果不考虑顺序,其样本可能个数为 12本讲稿第十二页,共一百零五页
9、二、抽样分布二、抽样分布(一一)重复抽样分布重复抽样分布13本讲稿第十三页,共一百零五页 所以,由概率论知,如果总体是正态分布的,所以,由概率论知,如果总体是正态分布的,则则样本平均数的抽样分布是如下样本平均数的抽样分布是如下正态分布正态分布这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。14本讲稿第十四页,共一百零五页 某班组某班组5个工人的日工资个工人的日工资为为34、38、42、46、50元。元。现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个构成样本。共个构成样本。共有有52=25个样本。个样本。例例 子子15本讲稿第十五页,共一百零五页
10、此指标反映所有的样本平此指标反映所有的样本平均数与总体平均数的平均误差,均数与总体平均数的平均误差,称为称为抽样平均误差抽样平均误差,用,用 表表示。示。n得出两个结论得出两个结论16本讲稿第十六页,共一百零五页2.2.总体成数的估计总体成数的估计样本成数分布的性质:样本成数分布的性质:总总体体成成数数p是是指指具具有有某某种种特特征征的的单单位位在在总总体体中中的的比比重重。在在前前面面我我们们已已经经知知道道,成成数数是是一一个个特特殊殊平平均均数数,设设总总体体单单位位总总数数目目是是N,总总体体中中有有该特征的单位数是该特征的单位数是N N1 1。设。设X是是0、1变量,变量,即:总体
11、单位有该特征,则即:总体单位有该特征,则X取取1,否则取,否则取0,则有:则有:现现从从总总体体中中抽抽出出n n个个单单位位,如如果果其其中中有有相相应应特特征征的的单单位位数数是是n n1 1,则则样样本本成数是:成数是:17本讲稿第十七页,共一百零五页 P也也是是一一个个随随机机变变量量,利利用用样样本本平平均均数数的的分分布布性性质质结论,即有:结论,即有:E(P)=p18本讲稿第十八页,共一百零五页(二二)不重置抽样分布不重置抽样分布1、样本平均数的分布、样本平均数的分布 某班组某班组5个工人的日工个工人的日工资为资为34、38、42、46、50元。元。现用不重置抽样的方法从现用不重
12、置抽样的方法从5人中随机抽人中随机抽2个构成样本。个构成样本。共有共有20个样本。个样本。19本讲稿第十九页,共一百零五页20本讲稿第二十页,共一百零五页得出两个结论:得出两个结论:此指标反映所有的样本平均数与总体平均数的平此指标反映所有的样本平均数与总体平均数的平均误差,称为均误差,称为抽样平均误差抽样平均误差,用,用 表示。表示。21本讲稿第二十一页,共一百零五页2.样本成数的分布样本成数的分布 抽样平均误差为:抽样平均误差为:对于(对于(0,1)分布的总体,)分布的总体,总体平均数为:总体平均数为:总体方差为:总体方差为:从总体中抽取容量为从总体中抽取容量为n的样本,样本成数的样本,样本
13、成数p的分布实质是样的分布实质是样本平均数的分布。有:本平均数的分布。有:22本讲稿第二十二页,共一百零五页三、大数定理与中心极限定理三、大数定理与中心极限定理(一一)大数定理大数定理 大大数数定定理理又又称称作作大大数数法法则则。人人们们在在观观察察个个别别事事物物时时,是是连连同同一一切切个个别别的的特特性性来来观观察察的的。个个别别现现象象受受偶偶然然因因素素影影响响,有有各各自自不不同同的的表表现现。但但是是,对对总总体体的的大大量量观观察察后后进进行行平平均均,就就能能使使偶偶然然因因素素的的影影响响相相互互抵抵消消,消消除除由由个个别别偶偶然然因因素素引引起起的的极极端端性性影影响
14、响,从从而而使使总总体体平平均均数数稳稳定定下下来来,反反映映出出事事物物变变化化的的一一般般规规律,这就是大数定理的意义。律,这就是大数定理的意义。23本讲稿第二十三页,共一百零五页24本讲稿第二十四页,共一百零五页25本讲稿第二十五页,共一百零五页 2.中心极限定理中心极限定理 26本讲稿第二十六页,共一百零五页第三节第三节 总体参数估计总体参数估计一、总体参数估计概述一、总体参数估计概述n总体参数估计就是以样本统计量来估计总体总体参数估计就是以样本统计量来估计总体参数。参数。n参数估计应满足以下两个要求:一是估计的参数估计应满足以下两个要求:一是估计的精度要求,二是可靠性要求。所谓精度就
15、是精度要求,二是可靠性要求。所谓精度就是估计误差的最大范围,即误差的最大值,可估计误差的最大范围,即误差的最大值,可通过极限误差来反映;所谓可靠性是指估计通过极限误差来反映;所谓可靠性是指估计结果正确的概率大小。结果正确的概率大小。27本讲稿第二十七页,共一百零五页28本讲稿第二十八页,共一百零五页参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计29本讲稿第二十九页,共一百零五页二、点二、点 估估 计计
16、本讲稿第三十页,共一百零五页(一一)点估计的定义点估计的定义 点估计就是根据总体参数与样本统计量之间的内点估计就是根据总体参数与样本统计量之间的内在联系,直接以样本统计量作为相应总体参数的估计在联系,直接以样本统计量作为相应总体参数的估计量。量。在统计中经常使用的点估计量有:在统计中经常使用的点估计量有:31本讲稿第三十一页,共一百零五页 【例例4-9】对某企业的产品进行抽样检验,设对某企业的产品进行抽样检验,设 抽抽出出100件件产产品品,其其中中不不合合格格产产品品5件件,试试估估计计该该企企业业产产品品的合格率是多少?的合格率是多少?我我们们可可以以通通过过样样本本的的合合格格率率来来估
17、估计计企企业业产产品品的的合合格格率率。样样本本合合格格率率p=95/100=95%,我我们们估估计计该该企企业业产产品品的的合合格率是格率是95%。32本讲稿第三十二页,共一百零五页(二二)估计的评价标准估计的评价标准n点点估估计计的的优优点点是是直直接接给给出出了了总总体体参参数数的的估估计计值值。不不足足之之处处是不能提供估计误差的信息。是不能提供估计误差的信息。n样样本本统统计计量量是是一一个个随随机机变变量量,从从一一次次抽抽样样的的结结果果来来判判断断一一个个统统计计量量的的优优劣劣是是没没有有理理由由的的,必必须须通通过过多多次次试试验验或或从从抽抽样样分分布布的的特特点点出出发
18、发,才才能能判判断断这这个个估估计计量量是是否否为为优优良良的的估计量。估计量。n点点估估计计优优良良性性准准则则主主要要包包括括三三条条:无无偏偏性性、有效性有效性和和一致性一致性。33本讲稿第三十三页,共一百零五页1.无偏性无偏性 34本讲稿第三十四页,共一百零五页估计量的优良性准则估计量的优良性准则(无偏性)(无偏性)n无无偏偏性性:估估计计量量的的数数学学期期望望等等于于被被估估计计的的总总体体参数参数P P(X X)X XCA无无 偏偏有有有有 偏偏偏偏35本讲稿第三十五页,共一百零五页例:例:这就是为什么样本方差用这就是为什么样本方差用n-1的原因!的原因!36本讲稿第三十六页,共
19、一百零五页2.有效性有效性 37本讲稿第三十七页,共一百零五页估计量的优良性准则估计量的优良性准则(有效性)(有效性)AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)有效性:有效性:一个方差较小的无偏估计量称为一个更一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量,样本均值是一个更有效的估计量38本讲稿第三十八页,共一百零五页3.一致性一致性 39本讲稿第三十九页,共一百零五页估计量的优良性准则估计量的优良性准则(一致性)(一致性)n一一致致
20、性性:随随着着样样本本容容量量的的增增大大,估估计计量量越越来来越越接接近被估计的总体参数近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P(X X)X X40本讲稿第四十页,共一百零五页三、区间估计三、区间估计本讲稿第四十一页,共一百零五页(一一)区间估计的含义区间估计的含义42本讲稿第四十二页,共一百零五页区间估计区间估计(概念要点)(概念要点)1.根据一个样本的观察值给出总体参数的估计范围根据一个样本的观察值给出总体参数的估计范围2.给出总体参数落在这一区间的概率给出总体参数落在这一区间的概率3.
21、例如例如:总体均值落在总体均值落在5070之间,置信度为之间,置信度为 95%样本统计量样本统计量(点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限43本讲稿第四十三页,共一百零五页置信区间估计置信区间估计(内容)(内容)2 2 已知已知 2 2未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间44本讲稿第四十四页,共一百零五页落在总体均值某一区间内的样本落在总体均值某一区间内的样本 x_XX=Z x95%95%的样本的样本的样本的样本 -1.96 x +1.96 x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 抽样 分布 最新 精选 文档
限制150内