统计学第七章-参数估计-PPT.ppt
《统计学第七章-参数估计-PPT.ppt》由会员分享,可在线阅读,更多相关《统计学第七章-参数估计-PPT.ppt(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 参数估计参数估计7.1 参数估计的一般问题参数估计的一般问题7.2 一个总体参数的区间估计一个总体参数的区间估计7.3 两个总体参数的区间估计两个总体参数的区间估计7.4 样本量的确定样本量的确定学习目标学习目标1.1.估计量与估计值的概念估计量与估计值的概念2.2.点估计与区间估计的区别点估计与区间估计的区别3.3.评价估计量优良性的标准评价估计量优良性的标准4.4.一个总体参数的区间估计方法一个总体参数的区间估计方法5.5.两个总体参数的区间估计方法两个总体参数的区间估计方法6.6.样本容量的确定方法样本容量的确定方法参数估计在统计方法中的地参数估计在统计方法中的地位位统计推
2、断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等7.1 参数估计的一般问题参数估计的一般问题1、参数估计(、参数估计(Parameter Estimation),用样本估计量估计总体估计值。,用样本估计量估计总体估计值。(1)、)、点(值)估计(近似值)点(值)估计(近似值)(2)、)、区间估计(近似范围)区间估计(近似范围)一、估计量和估计值一、估计量和估计值n n估计:人人都做过。如
3、:估计:人人都做过。如:n n上课时,你会上课时,你会估计估计一下老师提问你的概率有多一下老师提问你的概率有多大?大?n n过马路闯红灯时,你会过马路闯红灯时,你会估计估计一下被罚款的概率一下被罚款的概率有多大?有多大?n n推销员年初时要推销员年初时要估计估计今年超额完成任务的概率今年超额完成任务的概率有多大?有多大?(1)估估计计量量:用用来来估估计计总总体体参参数数的的样样本本统统计计量量。如如:样样本本算算术术平平均均数数、样样本本中中位位数数、样样本本标准差、样本方差等。标准差、样本方差等。例如例如例如例如:样本均值就是总体均值样本均值就是总体均值样本均值就是总体均值样本均值就是总体
4、均值 的一个估计量的一个估计量的一个估计量的一个估计量(2)参数用参数用 表示,估计量表示,估计量用用 表示表示(3)估估计计值值:估估计计参参数数时时计计算算出出来来的的统统计计量量的的具体值具体值如果样本均值如果样本均值如果样本均值如果样本均值 x x =80=80,则,则,则,则8080就是就是就是就是 的估计值的估计值的估计值的估计值2、估计量与估计值(estimator&estimated value)参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计
5、量法估估 计计 方方 法法点点 估估 计计区间估计区间估计二、点估计(point estimation)Population Parameter总体参数总体参数Point Estimator is a single value(statistic)used to estimate a population value(parameter).1、用样本的估计量直接作为总体参数的估计值、用样本的估计量直接作为总体参数的估计值例如:用样本均值直接例如:用样本均值直接例如:用样本均值直接例如:用样本均值直接作为作为作为作为总体均值的估计总体均值的估计总体均值的估计总体均值的估计例例例例如如如如:用用用
6、用两两两两个个个个样样样样本本本本均均均均值值值值之之之之差差差差直直直直接接接接作作作作为为为为总总总总体体体体均均均均值值值值之差的估计之差的估计之差的估计之差的估计Point estimation点估计点估计PopulationSampleParameterStatistic FormulaMean,Variance,s2Proportion,px x =xin12)(22nxixss=pp=x successesn trials总体参数总体参数样本统计量样本统计量计算公式计算公式2、点点估估计计的的方方法法有有矩矩估估计计法法、顺顺序序统统计计量量法法、最大似然法、最小二乘法等最大似然
7、法、最小二乘法等3、点估计、点估计用样本用样本估计量估计量直接作为总体均数的直接作为总体均数的估计值,估计值,未考虑抽样误差未考虑抽样误差,没有给出估计没有给出估计值接近总体参数程度的信息值接近总体参数程度的信息。三、区间估计三、区间估计(interval estimate)在在在在点点点点估估估估计计计计的的的的基基基基础础础础上上上上,给给给给出出出出总总总总体体体体参参参参数数数数估估估估计计计计的的的的一一一一个个个个区区区区间间间间范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计
8、量加减抽样误差而得到的 根根根根据据据据样样样样本本本本统统统统计计计计量量量量的的的的抽抽抽抽样样样样分分分分布布布布能能能能够够够够对对对对样样样样本本本本统统统统计计计计量量量量与与与与总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量 比比比比如如如如,某某某某班班班班级级级级平平平平均均均均分分分分数数数数在在在在75758585之之之之间间间间,置置置置信信信信水水水水平平平平是是是是95%95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间
9、置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x(1)将构造置信区间的步骤重复很多次,)将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所置信区间包含总体参数真值的次数所占的比例称为置信水平占的比例称为置信水平(2)表示为)表示为(1-为是总体参数未在
10、区间内的比例为是总体参数未在区间内的比例为是总体参数未在区间内的比例为是总体参数未在区间内的比例 (3)常用的置信水平值有)常用的置信水平值有 99%,95%,90%相应的相应的相应的相应的 为为为为0.010.01,0.050.05,0.100.101、置信水平、置信水平 (confidence cofficient)(1 1)由样本统计量所构造的总体参数的估计)由样本统计量所构造的总体参数的估计)由样本统计量所构造的总体参数的估计)由样本统计量所构造的总体参数的估计区间称为置信区间区间称为置信区间区间称为置信区间区间称为置信区间(2 2)统计学家在某种程度上确信这个区间会)统计学家在某种程
11、度上确信这个区间会)统计学家在某种程度上确信这个区间会)统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置包含真正的总体参数,所以给它取名为置包含真正的总体参数,所以给它取名为置包含真正的总体参数,所以给它取名为置信区间信区间信区间信区间 (3 3)用一个具体的样本所构造的区间是一个)用一个具体的样本所构造的区间是一个)用一个具体的样本所构造的区间是一个)用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产特定的区间,我们无法知道这个样本所产特定的区间,我们无法知道这个样本所产特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值生的区间是否包
12、含总体参数的真值生的区间是否包含总体参数的真值生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参我们只能是希望这个区间是大量包含总体参我们只能是希望这个区间是大量包含总体参我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数数真值的区间中的一个,但它也可能是少数数真值的区间中的一个,但它也可能是少数数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个几个不包含参数真值的区间中的一个几个不包含参数真值的区间中的一个几个不包含参数真值的区间中的一个2、置信区间、置信区间(confidence interval)例:例:虽然不能知道某校全
13、体女大学生身高均数的确虽然不能知道某校全体女大学生身高均数的确切数值,但有切数值,但有95%的把握说校全体女大学生身高均数的把握说校全体女大学生身高均数在在163.0-164.5cm之间,有之间,有99%的把握说校全体女的把握说校全体女大学生身高均数在大学生身高均数在 162.7 164.7cm之间。之间。换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0-164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错,说错的概率是的概率是5%;做出校全体女大学生身高均数为;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是的结论
14、,说对的概率是99%,说错的概率,说错的概率是是1%。3、置信区间与置信水平、置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)区间包含了区间包含了区间包含了区间包含了 的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2 /2 2The factors that determine the width of a confidence interval are:4、影响置信区间宽度的因素有:影响置信区间宽度的因素有:(1).The sample size,n.样本容量样本容量n(2).The variability in the popul
15、ation总体数据的离散程度,总体数据的离散程度,用用 来测度来测度(3).The desired level of confidence.置信水平置信水平(1-),影响,影响 z 的大小的大小5、标准误(Standard error)(1)、概念、概念抽样误差:由于抽样引起的样本统计量与总抽样误差:由于抽样引起的样本统计量与总体参数之间的差异。体参数之间的差异。标准误标准误:表示抽样误差大小的指标;:表示抽样误差大小的指标;即样本均值的标准差;即样本均值的标准差;(3)、(样本均值)标准误(样本均值)标准误意义:意义:反映抽样误差的大小。标准误越小,抽样误反映抽样误差的大小。标准误越小,抽样
16、误差越小,用样本均数估计总体均数的可靠性越大。差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准误,标准误(2)、(样本均值)标准误的计算、(样本均值)标准误的计算四、评价估计量的标准1、无偏性、无偏性(unbiasedness)n n无偏性:估计量抽样分布的数学期望等于被无偏性:估计量抽样分布的数学期望等于被n n 估计的总体参数估计的总体参数 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏2、有效性、有效性(efficiency)有有效效性性:与与离离散散度度相相联联系系。对对同同一一总总体体参参数数的的两两个个无无
17、偏偏点点估估计计量量,有有更更小小标标准准差差的的估估计计量更有效量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()3、一致性、一致性(consistency)n n一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量的值越来越接近被估计的总体参数量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()7.2 一个总体参数的区间估计一个总体参数的区间估计7.2.1 总体均值的区间估计总体均值的区间估计7.2.2 总体比例的区间
18、估计总体比例的区间估计7.2.3 总体方差的区间估计总体方差的区间估计A confidence interval is a range of values within which the population parameter is expected to occur.区间估计给出总体参数的近似范围区间估计给出总体参数的近似范围Interval Estimation区间估计区间估计一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差总体均值的区间估计总体均值的区间估计(正态总体、正态总体、已知,或非正态总体、大已知,或非正
19、态总体、大样本样本)总体均值的区间估计总体均值的区间估计(大样本大样本)n n1.1.假定条件假定条件假定条件假定条件 总体服从正态分布总体服从正态分布总体服从正态分布总体服从正态分布,且方差且方差且方差且方差()未知未知未知未知 如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n n 30)30)2.2.使用正态分布统计量使用正态分布统计量使用正态分布统计量使用正态分布统计量 z z3.总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信水平下的置信水平下的置信水平下的置信区间为
20、置信区间为置信区间为置信区间为Interval Estimatesn nAn Interval Estimate states the range within which a population parameter probably lies.n n区间估计表明总体参数可能存在的范围区间估计表明总体参数可能存在的范围Interval EstimatesmThe interval within which a populationparameter is expected to occur is called a confidence interval.m总体参数可能存在的区间称为置信区间总
21、体参数可能存在的区间称为置信区间mThe two confidence intervals that are used extensively are the 95%and the 90%.常用的置信水平及值为:常用的置信水平及值为:Z=1.96Z=1.65Interpretation of Confidence Intervalsn nFor a 95%confidence interval about 95%of the similarly constructed intervals will contain the parameter being estimated.n n95%of t
22、he sample means for a specified sample size will lie within 1.96 standard deviations of the hypothesized population mean.总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例 】一一一一家家家家食食食食品品品品生生生生产产产产企企企企业业业业以以以以生生生生产产产产袋袋袋袋装装装装食食食食品品品品为为为为主主主主,为为为为对对对对产产产产量量量量质质质质量量量量进进进进行行行行监监监监测测测测,企企企企业业业业质质质质检检检检部部部部门门门门经经经经常常常常要要
23、要要进进进进行行行行抽抽抽抽检检检检,以以以以分分分分析析析析每每每每袋袋袋袋重重重重量量量量是是是是否否否否符符符符合合合合要要要要求求求求。现现现现从从从从某某某某天天天天生生生生产产产产的的的的一一一一批批批批食食食食品品品品中中中中随随随随机机机机抽抽抽抽取取取取了了了了2525袋袋袋袋,测测测测得得得得每每每每袋袋袋袋重重重重量量量量如如如如下下下下表表表表所所所所示示示示。已已已已知知知知产产产产品品品品重重重重量量量量的的的的分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布,且且且且总总总总体体体体标标标标准准准准差差差差为为为为10g10g。试试试试估估估估计计
24、计计该该该该批批批批产产产产品品品品平平平平均均均均重重重重量量量量的的的的置信区间,置信水平为置信区间,置信水平为置信区间,置信水平为置信区间,置信水平为95%95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解:已已知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z
25、/2/2=1.96=1.96。根根据样本数据计算得:据样本数据计算得:总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】一一一一家家家家保保保保险险险险公公公公司司司司收收收收集集集集到到到到由由由由3636投投投投保保保保个个个个人人人人组组组组成成成成的的的的随随随随机机机机样样样样本本本本,得得得得到到到到每每每每个个个个投投投投保保保保人
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第七 参数估计 PPT
限制150内