总体参数估计.pptx
《总体参数估计.pptx》由会员分享,可在线阅读,更多相关《总体参数估计.pptx(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 总体参数估计参数估计在统计方法中的地位参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计第1页/共85页第六章 总体参数估计统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量如:样本均值、如:样本均值、比例、方差比例、方差总体均值、比例、方差等第2页/共85页第六章 总体参数估计第一节 参数估计的一般问题一、估计量与估计值 用来估计总体参数的统计量的名称,称用来估计总体参数的统计量的名称,称为为估计量估计量,用符号,用符号 表示。表示。用来估计总体参数时计算出来的估计量用来估计总体参数时计算出来的估计量的具体数值,称为的具体数值,称为估计值估计值。第3页/
2、共85页第六章 总体参数估计二、点估计与区间估计(一)点估计定义:用样本估计量的值直接作为总体参数的用样本估计量的值直接作为总体参数的估计值,称作参数的估计值,称作参数的点估计点估计。第4页/共85页第六章 总体参数估计(二)区间估计(二)区间估计定义:定义:在点估计的基础上,给出总体参数估计的一个范围,称为参数的在点估计的基础上,给出总体参数估计的一个范围,称为参数的区区间估计间估计。例如,某班级平均分数在例如,某班级平均分数在例如,某班级平均分数在例如,某班级平均分数在75758585之间,置信水平是之间,置信水平是之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量 (点估计
3、点估计)置信区间置信区间置信下限置信下限置信上限置信上限第5页/共85页第六章 总体参数估计置信区间图示置信区间图示x95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第6页/共85页第六章 总体参数估计置置 信信 水水 平平1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-)为是总体参数未在区间内的比例3.常用的置信水平值有 99%,95%
4、,90%相应的 为0.01,0.05,0.10第7页/共85页第六章 总体参数估计置置 信信 区区 间间1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个第8页/共85页第六章 总体参数估计置信水平与置信区间置信水平与置信区间均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了%的区间未包
5、含的区间未包含 1 1 /2 2 /2 2第9页/共85页第六章 总体参数估计影响置信区间宽度的因素影响置信区间宽度的因素 1 1、总体数据的离散程度(总体标准差)、总体数据的离散程度(总体标准差)2 2、样本容量、样本容量 3 3、置信水平,影响、置信水平,影响z z的大小的大小第10页/共85页第六章 总体参数估计定义:由样本统计量构造的总体参数估计区由样本统计量构造的总体参数估计区间,称为间,称为置信区间置信区间,其中区间的最小值称为,其中区间的最小值称为置信下限置信下限,最大值称为,最大值称为置信上限置信上限。定义:如果我们将构造置信区间的步骤重复多如果我们将构造置信区间的步骤重复多次
6、,置信区间中包含总体参数真值的次数所次,置信区间中包含总体参数真值的次数所占的比率,称为占的比率,称为置信水平置信水平,或称为置信系数。,或称为置信系数。第11页/共85页第六章 总体参数估计三、评价估计量的标准三、评价估计量的标准(一)无偏性(一)无偏性定义:定义:无偏性是指估计量抽样分布的数学期望等于无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为被估计的总体参数。设总体参数为 ,所选择的,所选择的估计量为估计量为 ,如果,则称,如果,则称 为为 的无偏估的无偏估计量。计量。P P()B BA A无偏无偏无偏有偏有偏有偏第12页/共85页第六章 总体参数估计(二)有效性
7、(二)有效性定义:定义:对同一个参数的两个无偏估计量对同一个参数的两个无偏估计量 和和 ,若,若 ,我们称,我们称 是是 比更有效的比更有效的一个估计量。一个估计量。AB 的抽样分布的抽样分布 的抽样分布的抽样分布P P()第13页/共85页第六章 总体参数估计(三)一致性(三)一致性 定义:定义:一致性是指随着样本容量的增大,点估计一致性是指随着样本容量的增大,点估计量的值越来越接近被估计的总体参数。量的值越来越接近被估计的总体参数。AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P()第14页/共85页第六章 总体参数估计 第二节第二节 一个总体参数的区间估计一个总体参数的
8、区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差第15页/共85页第六章 总体参数估计一、总体均值的区间估计一、总体均值的区间估计(一)正态总体、方差已知,或非正态总体、大(一)正态总体、方差已知,或非正态总体、大样本样本 当当总体服从正态分布总体服从正态分布且且 已知已知,或总体不,或总体不是正态分布但是正态分布但大样本大样本时,样本均值的抽样分布时,样本均值的抽样分布均为正态分布,其数学期望为总体均值均为正态分布,其数学期望为总体均值 ,方,方差为差为 。而样本均值经过标准化后的随机变。而样本均值经过标准化后的随机变量则服从标准正态分布,即量则服从标准正
9、态分布,即 N(0N(0,1)1)。第16页/共85页第六章 总体参数估计 根据正态分布的性质可以构造出总体均根据正态分布的性质可以构造出总体均值在置信水平下的置信区间为:值在置信水平下的置信区间为:第17页/共85页第六章 总体参数估计 如果总体服从正态分布但如果总体服从正态分布但 未知未知,或总,或总体并不服从正态分布,只要在体并不服从正态分布,只要在大样本大样本条件下,条件下,总体方差用样本方差总体方差用样本方差S S2 2代替,这时总体均值代替,这时总体均值在置信水平下的置信区间可以写为:在置信水平下的置信区间可以写为:第18页/共85页第六章 总体参数估计例题:例题:一家食品生产企业
10、以生产袋装食品为主,一家食品生产企业以生产袋装食品为主,每天的产量大约为每天的产量大约为80008000袋左右。按规定每袋袋左右。按规定每袋的重量应为的重量应为100g100g。为对产量质量进行监测,。为对产量质量进行监测,企业质监部门经常要进行抽检,以分析每袋企业质监部门经常要进行抽检,以分析每袋重量是否符合要求。先从某天生产的一批食重量是否符合要求。先从某天生产的一批食品中随机抽取了品中随机抽取了2525袋,测得每袋重量(单位:袋,测得每袋重量(单位:g g)如表所示。)如表所示。第19页/共85页第六章 总体参数估计112.5101.0103.0102.0100.5102.6107.59
11、5.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3表:表:25袋食品的重量袋食品的重量 已知产品重量服从正态分布,且总体标准差为已知产品重量服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为。试估计该批产品平均重量的置信区间,置信水平为95%。第20页/共85页第六章 总体参数估计例题:一家保险公司收集到由例题:一家保险公司收集到由3636投保人组成的随机投保人组成的随机样本,得到每个投保人的年龄数据如表所示。试样本,得到每个投保人的年龄数据如表所
12、示。试建立投保人年龄建立投保人年龄90%90%的置信区间。的置信区间。表:表:3636个投保人年龄的数据个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532第21页/共85页第六章 总体参数估计(二)正态总体、方差未知、小样本 需要用样本方差需要用样本方差S S2 2代替代替 ,这时样本均值,这时样本均值经过标准化以后的随机变量则服从自由度为经过标准化以后的随机变量则服从自由度为(n-1n-1)的)的t t分布,即分布,即 t(n-1)t(n-1)这时需要应用这时需要应用t t分布来建
13、立总体均值的置信区间。分布来建立总体均值的置信区间。第22页/共85页第六章 总体参数估计 t t 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,它它它它通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的的的的参参参参数数数数。随随随随着着着着自自自自由由由由度度度度的的的的增增增增大大大大,分分分分布布布布也也也也逐逐逐逐渐渐
14、渐渐趋于正态分布趋于正态分布趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较t 分布标准正态分布标准正态分布t t不同自由度的t分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z第23页/共85页第六章 总体参数估计 根据根据t t分布建立的总体均值在置信区间为分布建立的总体均值在置信区间为 是自由度为是自由度为n-1n-1时,时,t t分布中右侧面积为分布中右侧面积为 时时的的t t值,该值,该 值可以通过值可以通过t t分布表查得。分布表查得。第24页/共85页第六章 总体参数估计例题:已知某种灯泡的寿命服从正态分布,现从一例
15、题:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取批灯泡中随机抽取1616只,测得其使用寿命(单位:只,测得其使用寿命(单位:h h)如下:)如下:1510 1450 1480 1460 1520 1480 1490 1460 1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470 1480 1510 1530 1470 1500 1520 1510 1470 建立该批灯泡平均使用寿命建立该批灯泡平均使用寿命95%95%的置信区间。的置信区间。第25页/共85页第六章 总体参数估计二
16、、总体比例的区间估计(大样本)二、总体比例的区间估计(大样本)总体比例总体比例P P在在 置信水平下的置信区间置信水平下的置信区间 当当P P未知时,用未知时,用p p来代替来代替P P第26页/共85页第六章 总体参数估计例题:例题:某城市要顾及下岗职工中女性所占的比某城市要顾及下岗职工中女性所占的比例,随机抽取了例,随机抽取了100100名下岗职工,其中名下岗职工,其中6565人人为女性。试以为女性。试以95%95%的置信水平估计该城市下的置信水平估计该城市下岗职工中女性比例的置信区间。岗职工中女性比例的置信区间。第27页/共85页第六章 总体参数估计三、总体方差的区间估计三、总体方差的区
17、间估计1.1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.2.假设假设总体服从正态分布总体服从正态分布3.3.总体方差总体方差 的点估计量为的点估计量为 ,且且4.总体方差在1-置信水平下的置信区间为第28页/共85页第六章 总体参数估计总体方差区间估计总体方差区间估计(图示)(图示)1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为n n-1-1的的 第29页/共85页第六章 总体参数估计【例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋
18、,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第30页/共85页第六章 总体参数估计第三节第三节 两个总体参数的区间估计两个总体参数的区间估计 一、两个总体均值之差
19、的区间估计一、两个总体均值之差的区间估计 二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计 三、两个总体方差比的区间估计三、两个总体方差比的区间估计第31页/共85页第六章 总体参数估计两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比第32页/共85页第六章 总体参数估计一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计(一)两个总体均值之差的估计:独立样本(一)两个总体均值之差的估计:独立样本1 1、大样本的估计、大样本的估计 假定条件假定条件 两个两个总体都服从正态分布,总体都服从正态分布,、已知已
20、知 若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n(n1 1 3030和和n n2 2 30)30)两个样本是独立的随机样本两个样本是独立的随机样本第33页/共85页第六章 总体参数估计使用正态分布统计量使用正态分布统计量 z z第34页/共85页第六章 总体参数估计(1)1,2已知时,两个总体均值之差1-2在1-置信水平下的置信区间为(2)(2 2)1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为第35页/共85页第六章 总体参数估计【例例】某某地地区区教教育育委委员员会会想想估
21、估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表 。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%95%的置信区间的置信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n2=33S1=5.8 S2=7.2第36页/共85页第六章 总体参数估计解解:两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信区间为置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间
22、为5.035.03分分10.9710.97分分第37页/共85页第六章 总体参数估计2 2、小样本的估计、小样本的估计 假定条件两个总体都服从正态分布两个总体方差未知两个独立的小样本(n130和n230)(1)两个总体方差未知但相等:1=2 总体方差的合并估计量第38页/共85页第六章 总体参数估计估计量x1-x2的抽样标准差第39页/共85页第六章 总体参数估计两个样本均值之差的标准化两个总体均值之差1-2在1-置信水平下的置信区间为第40页/共85页第六章 总体参数估计【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(
23、分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1第41页/共85页第六章 总体参数估计解解:根据样本数据计算得根据样本数据计算得 合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总体 参数估计
限制150内