第-5-章---参数估计ppt课件(全).ppt
《第-5-章---参数估计ppt课件(全).ppt》由会员分享,可在线阅读,更多相关《第-5-章---参数估计ppt课件(全).ppt(111页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 5 5 章章 参数估计参数估计5.1 5.1 参数估计的一般问题参数估计的一般问题 5.2 5.2 一个总体参数的区间估计一个总体参数的区间估计5.3 5.3 两个总体参数的区间估计两个总体参数的区间估计5.4 5.4 样本容量的确定样本容量的确定5.55.5抽样设计抽样设计学习目标学习目标1.抽样调查的概念抽样调查的概念2.估计量与估计值的概念估计量与估计值的概念3.点估计与区间估计的区别点估计与区间估计的区别4.评价估计量优良性的标准评价估计量优良性的标准5.一个总体参数的区间估计方法一个总体参数的区间估计方法6.两个总体参数的区间估计方法两个总体参数的区间估计方法7.样本容量的确定
2、方法样本容量的确定方法8.抽样组织设计抽样组织设计参数估计在统计方法中的地位参数估计在统计方法中的地位5.1 5.1 参数估计的一般问题参数估计的一般问题5.1.1 5.1.1 抽样调查的概念抽样调查的概念5.1.2 5.1.2 抽样中涉及的几个基本概念抽样中涉及的几个基本概念 评价估计量的优良标准评价估计量的优良标准抽样调查的概念抽样调查的概念抽样调查抽样调查:按随机原则从总体中抽取一部分单:按随机原则从总体中抽取一部分单位进行调查,用调查所得的数值对总体数量位进行调查,用调查所得的数值对总体数量特征作出推断的一种统计调查方法。特征作出推断的一种统计调查方法。特点特点:(1 1)遵循随机原则
3、)遵循随机原则 (2 2)以部分推断总体)以部分推断总体 (3 3)抽样误差可以事先计算并加以控制。)抽样误差可以事先计算并加以控制。抽样调查的概念抽样调查的概念作用作用:(1 1)某些现象不可能采用全面调查时,可以)某些现象不可能采用全面调查时,可以通过抽样调查作出推断通过抽样调查作出推断 (2 2)当某些现象没有必要采用全面调查时,)当某些现象没有必要采用全面调查时,也可通过抽样调查来作出推断也可通过抽样调查来作出推断 (3 3)抽样调查和全面调查相结合,可以相互)抽样调查和全面调查相结合,可以相互补充,也可以对全面调查资料起到检验核对补充,也可以对全面调查资料起到检验核对的作用的作用 (
4、4 4)对某些总体的假设需要依靠抽样调查进)对某些总体的假设需要依靠抽样调查进行检验行检验 (5 5)抽样调查方法可以用于工业生产过程中)抽样调查方法可以用于工业生产过程中的质量控制。的质量控制。5.1.2 5.1.2 抽样中涉及的几个基本概念抽样中涉及的几个基本概念总体与样本总体与样本 总体参数和样本统计量总体参数和样本统计量 重复抽样与不重复抽样重复抽样与不重复抽样 估计量与估计值估计量与估计值点估计与区间估计点估计与区间估计总体与样本总体与样本总体总体是根据研究目的确定的所要研究的事物的全体,是由客观存在的、具有同一性质的大量个别事物构成的集合。对于特定的问题来说,总体是唯一的确定的。组
5、成总体的个别事物称为总体单位总体单位,总体所包含的总体单位的个数称为总体容量总体容量,通常用大写的字母N N表示。样本样本是按随机原则从总体中抽取出来的那部分单位组成的集合。样本中所包含的单位个数称为样本容量样本容量,一般用小写的字母n n表示。通常将样本容量小于样本容量小于3030的样本称为小样本小样本,而将样本容量大于样本容量大于3030的样本称为大样本大样本。与总体是唯一确定的不同,样本不是唯一的,从一个总体中可以抽取很多个样本,全部样本的可能数目与样本容量及随机抽样的方法有关。总体参数总体参数是根据总体各单位的标志值或标志是根据总体各单位的标志值或标志表现计算的反映总体数量特征的综合指
6、标,表现计算的反映总体数量特征的综合指标,是抽样推断的对象。由于是抽样推断的对象。由于总体是唯一确定的总体是唯一确定的,根据总体计算的根据总体计算的总体参数也是唯一确定的,总体参数也是唯一确定的,只不过通常是未知的。只不过通常是未知的。一个总体可以有多个一个总体可以有多个参数,从不同方面反映总体的综合数量特征。参数,从不同方面反映总体的综合数量特征。常用的总体参数有常用的总体参数有:总体平均数总体平均数 总体比例总体比例 总体方差总体方差 总体标准差等。总体标准差等。总体参数与样本统计量总体参数与样本统计量样本统计量样本统计量是根据样本中各单位标志值或标是根据样本中各单位标志值或标志表现计算的
7、志表现计算的样本指标,是样本变量的函数,样本指标,是样本变量的函数,是用来估计总体参数的是用来估计总体参数的。其计算方法是确定。其计算方法是确定的,但它的取值随着样本的不同而发生变化,的,但它的取值随着样本的不同而发生变化,因此因此统计量是随机变量统计量是随机变量。与总体参数相对应,。与总体参数相对应,样本统计量有样本统计量有:样本平均数样本平均数 样本比例样本比例 样本方差样本方差 样本标准差等。样本标准差等。总体参数与样本统计量总体参数与样本统计量常用的总体参数常用的总体参数总体均值总体均值总体方差总体方差总体比例总体比例 常用的样本统计量(一)常用的样本统计量(一)样本均值样本均值样本方
8、差样本方差样本比例样本比例 常用的样本统计量常用的样本统计量(二)二)Z Z统计量统计量t t统计量统计量2统计量统计量重复抽样与不重复抽样重复抽样与不重复抽样 重复抽样重复抽样,也称放回抽样,是指按随机原则从总体中抽取一个单位登记后,又放回总体参加下一次抽选的方法,同一单位有重复抽中的可能。在重复抽样的情况下,每次抽取的样本单位都是在完全相同的条件下进行的,总体容量N保持不变,每个单位被抽中的机会均等。其样本可能的数目是 不重复抽样不重复抽样,也称不放回抽样,是指从总体中随机抽取一个单位登记后,不再放回总体参加下一次抽选的方法,每个单位最多只能被抽中一次。每抽一个,总体单位数就减少一个,因此
9、各次样本单位被抽中的机会发生变化,第一个样本单位被抽中的机会是 ,第二个样本单位被抽中的机会是 ,依此类推。不重复抽样相当于一次从总体中抽出n个单位。在不重复抽样条件下,样本可能的数目为 。估计量与估计值估计量与估计值1.1.估计量:用于估计总体参数的随机变量估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2.2.参数用参数用 表示,估计量表示,估计量用用 表示表示3.3.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值如果样本均值如
10、果样本均值 x x=80=80,则,则8080就是就是 的估计值的估计值矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计点估计与区间估计点估计与区间估计点估计点估计(point estimate)(point estimate)1.1.用用样样本本的的估估计计量量的的某某个个取取值值直直接接作作为为总总体体参参数数的的估估计计值值例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计2.2.无法给出估
11、计值接近总体参数程度的信息无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计区间估计(interval estimate)(interval estimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%
12、样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-为是总体
13、参数未在区间内的比例3.常用的置信水平值有 99%,95%,90%相应的相应的 为0.01,0.05,0.10置信水平置信水平(confidence level)(confidence level)1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个总体参数以一定的概率落在这一区间的表述是错误的置信区间
14、置信区间 (confidence interval)(confidence interval)置信区间置信区间 (95%(95%的置信区间的置信区间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值置信区间与置信水平置信区间与置信水平 均值的抽样分均值的抽样分均值的抽样分均值的抽样分布布布布(1-(1-)区间包含了区间包含了区间包含了区间包含了 的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2 /2 2影响区间宽度的因素影响区间宽度的因素1.总体数据的离散程度,用来测度2.样本容量n3.置信水
15、平(1-),影响 z 的大小评价估计量的优良标准评价估计量的优良标准l无偏性无偏性l有效性有效性l一致性一致性无偏性无偏性(unbiasedness)(unbiasedness)无无偏偏性性:估计量抽样分布的数学期望等于被估计的总体参数P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏有效性有效性(efficiency)(efficiency)有有有有效效效效性性性性:对对同同一一总总体体参参数数的的两两个个无无偏偏点点估估计计量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分
16、布P P()一致性一致性(consistency)(consistency)一一致致性性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()5.2 5.2 一个总体参数的区间估计一个总体参数的区间估计5.2.1 5.2.1 总体均值的区间估计总体均值的区间估计5.2.2 5.2.2 总体比例的区间估计总体比例的区间估计5.2.3 5.2.3 总体方差的区间估计总体方差的区间估计一个总体参数的区间估计一个总体参数的区间估计总体参数体参数符号表示符号表示样本本统计量量
17、均均值比例比例方差方差总体均值的区间估计总体均值的区间估计(正态总体、正态总体、已知,或非正态总体、大样本已知,或非正态总体、大样本)总体均值的区间估计总体均值的区间估计(大样本大样本)1.假定条件假定条件总体服从正态分布,且方差()已知如果不是正态分布,可由正态分布来近似(n 30)2.2.使用正态分布统计量使用正态分布统计量 z z3.3.总体均值总体均值总体均值总体均值 在在在在1-1-1-1-置信水平下的置信水平下的置信水平下的置信水平下的置信区间为置信区间为置信区间为置信区间为总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例 】一一一一家家家家食食食食品品品品生生生
18、生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,为为为为对对对对产产产产量量量量质质质质量量量量进进进进行行行行监监监监测测测测,企企企企业业业业质质质质检检检检部部部部门门门门经经经经常常常常要要要要进进进进行行行行抽抽抽抽检检检检,以以以以分分分分析析析析每每每每袋袋袋袋重重重重量量量量是是是是否否否否符符符符合合合合要要要要求求求求。现现现现从从从从某某某某天天天天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机抽抽抽抽取取取取了了了了25252525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量
19、量量(单单单单位位位位:g g g g)如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布,且且且且总总总总体体体体标标标标准准准准差差差差为为为为10g10g10g10g。试试试试估估估估计计计计该该该该批批批批产产产产品品品品平平平平均均均均重重重重量的置信区间,置信水平为量的置信区间,置信水平为量的置信区间,置信水平为量的置信区间,置信水平为95%95%95%95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.010
20、8.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解解解:已已 知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z/2/2=1.96=1.96。根根据据样样本本数数据据计计算算得得:。由由于于是是正正态态总总体体,且且方方差差已已知知。总总体体均均值值 在在1-1-置置信水平下的置信区间为信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g
21、101.44g109.28g总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】一一一一家家家家保保保保险险险险公公公公司司司司收收收收集集集集到到到到由由由由36363636投投投投保保保保个个个个人人人人组组组组成成成成的的的的随随随随机机机机样样样样本本本本,得得得得到到到到每每每每个个个个投投投投保保保保人人人人的的的的年年年年龄龄龄龄(单单单单位位位位:周周周周岁岁岁岁)数数数数据据据据如如如如下下下下表表表表。试试试试建建建建立立立立投投投投保保保保人人人人年年年年龄龄龄龄90%90%90%90%的置信区间的置信区间的置信区间的置信区间 36个投保人年龄的数据个投保
22、人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本数据计算得:本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁总体均值的区间估计总体均值的区间估计(正态总体、正态总体、未知、小
23、样本未知、小样本)总体均值的区间估计总体均值的区间估计(小样本小样本)1.1.假定条件假定条件总体服从正态分布,但方差()未知小样本(n 30)2.2.使用使用 t t 分布统计量分布统计量3.3.总体均值总体均值总体均值总体均值 在在在在1-1-1-1-置信水平下的置信水平下的置信水平下的置信水平下的置信区间为置信区间为置信区间为置信区间为t t 分布分布 t t t t 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,它它它它通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和
24、和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的的的的参参参参数数数数。随随随随着着着着自自自自由由由由度度度度的的的的增增增增大大大大,分分分分布也逐渐趋于正态分布布也逐渐趋于正态分布布也逐渐趋于正态分布布也逐渐趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分标准正态分布布t t不同自由度的不同自由度的t t分分布布标准正态分标准正态分布布t t(dfdf=13)13)t t(dfdf=5)=5)z zt t 分布分布(用用Exce
25、lExcel生成生成t t分布的临界值表分布的临界值表)1.将分布自由度n的值输入到工作表的A列2.将右尾概率的取值输入到第1行3.在B2单元格输入公式“=TINV(B$1*$A2)”,然后将其向下、向右复制即可得 t t 分布分布(用用ExcelExcel绘制绘制t t分布图分布图)第第1步:步:在工作表的第1列A2:A62输入一个等差数列,初始值为“-3”,步长为“0.1”,终值为“3”第第2步:步:在单元格C1输入t分布的自由度(如“20”)第第3步:步:在单元格B2输入公式“=TDIST(-A2,$C$1,1)”,并将其复制到B3:B32区域,在B33输入公式“=TDIST(A33,$
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 ppt 课件
限制150内