总体参数估计.pptx
第六章 总体参数估计参数估计在统计方法中的地位参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计第1页/共85页第六章 总体参数估计统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量如:样本均值、如:样本均值、比例、方差比例、方差总体均值、比例、方差等第2页/共85页第六章 总体参数估计第一节 参数估计的一般问题一、估计量与估计值 用来估计总体参数的统计量的名称,称用来估计总体参数的统计量的名称,称为为估计量估计量,用符号,用符号 表示。表示。用来估计总体参数时计算出来的估计量用来估计总体参数时计算出来的估计量的具体数值,称为的具体数值,称为估计值估计值。第3页/共85页第六章 总体参数估计二、点估计与区间估计(一)点估计定义:用样本估计量的值直接作为总体参数的用样本估计量的值直接作为总体参数的估计值,称作参数的估计值,称作参数的点估计点估计。第4页/共85页第六章 总体参数估计(二)区间估计(二)区间估计定义:定义:在点估计的基础上,给出总体参数估计的一个范围,称为参数的在点估计的基础上,给出总体参数估计的一个范围,称为参数的区区间估计间估计。例如,某班级平均分数在例如,某班级平均分数在例如,某班级平均分数在例如,某班级平均分数在75758585之间,置信水平是之间,置信水平是之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量 (点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限第5页/共85页第六章 总体参数估计置信区间图示置信区间图示x95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第6页/共85页第六章 总体参数估计置置 信信 水水 平平1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-)为是总体参数未在区间内的比例3.常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10第7页/共85页第六章 总体参数估计置置 信信 区区 间间1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个第8页/共85页第六章 总体参数估计置信水平与置信区间置信水平与置信区间均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了%的区间未包含的区间未包含 1 1 /2 2 /2 2第9页/共85页第六章 总体参数估计影响置信区间宽度的因素影响置信区间宽度的因素 1 1、总体数据的离散程度(总体标准差)、总体数据的离散程度(总体标准差)2 2、样本容量、样本容量 3 3、置信水平,影响、置信水平,影响z z的大小的大小第10页/共85页第六章 总体参数估计定义:由样本统计量构造的总体参数估计区由样本统计量构造的总体参数估计区间,称为间,称为置信区间置信区间,其中区间的最小值称为,其中区间的最小值称为置信下限置信下限,最大值称为,最大值称为置信上限置信上限。定义:如果我们将构造置信区间的步骤重复多如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所次,置信区间中包含总体参数真值的次数所占的比率,称为占的比率,称为置信水平置信水平,或称为置信系数。,或称为置信系数。第11页/共85页第六章 总体参数估计三、评价估计量的标准三、评价估计量的标准(一)无偏性(一)无偏性定义:定义:无偏性是指估计量抽样分布的数学期望等于无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为被估计的总体参数。设总体参数为 ,所选择的,所选择的估计量为估计量为 ,如果,则称,如果,则称 为为 的无偏估的无偏估计量。计量。P P()B BA A无偏无偏无偏有偏有偏有偏第12页/共85页第六章 总体参数估计(二)有效性(二)有效性定义:定义:对同一个参数的两个无偏估计量对同一个参数的两个无偏估计量 和和 ,若,若 ,我们称,我们称 是是 比更有效的比更有效的一个估计量。一个估计量。AB 的抽样分布的抽样分布 的抽样分布的抽样分布P P()第13页/共85页第六章 总体参数估计(三)一致性(三)一致性 定义:定义:一致性是指随着样本容量的增大,点估计一致性是指随着样本容量的增大,点估计量的值越来越接近被估计的总体参数。量的值越来越接近被估计的总体参数。AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P()第14页/共85页第六章 总体参数估计 第二节第二节 一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差第15页/共85页第六章 总体参数估计一、总体均值的区间估计一、总体均值的区间估计(一)正态总体、方差已知,或非正态总体、大(一)正态总体、方差已知,或非正态总体、大样本样本 当当总体服从正态分布总体服从正态分布且且 已知已知,或总体不,或总体不是正态分布但是正态分布但大样本大样本时,样本均值的抽样分布时,样本均值的抽样分布均为正态分布,其数学期望为总体均值均为正态分布,其数学期望为总体均值 ,方,方差为差为 。而样本均值经过标准化后的随机变。而样本均值经过标准化后的随机变量则服从标准正态分布,即量则服从标准正态分布,即 N(0N(0,1)1)。第16页/共85页第六章 总体参数估计 根据正态分布的性质可以构造出总体均根据正态分布的性质可以构造出总体均值在置信水平下的置信区间为:值在置信水平下的置信区间为:第17页/共85页第六章 总体参数估计 如果总体服从正态分布但如果总体服从正态分布但 未知未知,或总,或总体并不服从正态分布,只要在体并不服从正态分布,只要在大样本大样本条件下,条件下,总体方差用样本方差总体方差用样本方差S S2 2代替,这时总体均值代替,这时总体均值在置信水平下的置信区间可以写为:在置信水平下的置信区间可以写为:第18页/共85页第六章 总体参数估计例题:例题:一家食品生产企业以生产袋装食品为主,一家食品生产企业以生产袋装食品为主,每天的产量大约为每天的产量大约为80008000袋左右。按规定每袋袋左右。按规定每袋的重量应为的重量应为100g100g。为对产量质量进行监测,。为对产量质量进行监测,企业质监部门经常要进行抽检,以分析每袋企业质监部门经常要进行抽检,以分析每袋重量是否符合要求。先从某天生产的一批食重量是否符合要求。先从某天生产的一批食品中随机抽取了品中随机抽取了2525袋,测得每袋重量(单位:袋,测得每袋重量(单位:g g)如表所示。)如表所示。第19页/共85页第六章 总体参数估计112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3表:表:25袋食品的重量袋食品的重量 已知产品重量服从正态分布,且总体标准差为已知产品重量服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为。试估计该批产品平均重量的置信区间,置信水平为95%。第20页/共85页第六章 总体参数估计例题:一家保险公司收集到由例题:一家保险公司收集到由3636投保人组成的随机投保人组成的随机样本,得到每个投保人的年龄数据如表所示。试样本,得到每个投保人的年龄数据如表所示。试建立投保人年龄建立投保人年龄90%90%的置信区间。的置信区间。表:表:3636个投保人年龄的数据个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532第21页/共85页第六章 总体参数估计(二)正态总体、方差未知、小样本 需要用样本方差需要用样本方差S S2 2代替代替 ,这时样本均值,这时样本均值经过标准化以后的随机变量则服从自由度为经过标准化以后的随机变量则服从自由度为(n-1n-1)的)的t t分布,即分布,即 t(n-1)t(n-1)这时需要应用这时需要应用t t分布来建立总体均值的置信区间。分布来建立总体均值的置信区间。第22页/共85页第六章 总体参数估计 t t 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,它它它它通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的的的的参参参参数数数数。随随随随着着着着自自自自由由由由度度度度的的的的增增增增大大大大,分分分分布布布布也也也也逐逐逐逐渐渐渐渐趋于正态分布趋于正态分布趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较t 分布标准正态分布标准正态分布t t不同自由度的t分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z第23页/共85页第六章 总体参数估计 根据根据t t分布建立的总体均值在置信区间为分布建立的总体均值在置信区间为 是自由度为是自由度为n-1n-1时,时,t t分布中右侧面积为分布中右侧面积为 时时的的t t值,该值,该 值可以通过值可以通过t t分布表查得。分布表查得。第24页/共85页第六章 总体参数估计例题:已知某种灯泡的寿命服从正态分布,现从一例题:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取批灯泡中随机抽取1616只,测得其使用寿命(单位:只,测得其使用寿命(单位:h h)如下:)如下:1510 1450 1480 1460 1520 1480 1490 1460 1510 1450 1480 1460 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470 1480 1510 1530 1470 1500 1520 1510 1470 建立该批灯泡平均使用寿命建立该批灯泡平均使用寿命95%95%的置信区间。的置信区间。第25页/共85页第六章 总体参数估计二、总体比例的区间估计(大样本)二、总体比例的区间估计(大样本)总体比例总体比例P P在在 置信水平下的置信区间置信水平下的置信区间 当当P P未知时,用未知时,用p p来代替来代替P P第26页/共85页第六章 总体参数估计例题:例题:某城市要顾及下岗职工中女性所占的比某城市要顾及下岗职工中女性所占的比例,随机抽取了例,随机抽取了100100名下岗职工,其中名下岗职工,其中6565人人为女性。试以为女性。试以95%95%的置信水平估计该城市下的置信水平估计该城市下岗职工中女性比例的置信区间。岗职工中女性比例的置信区间。第27页/共85页第六章 总体参数估计三、总体方差的区间估计三、总体方差的区间估计1.1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.2.假设假设总体服从正态分布总体服从正态分布3.3.总体方差总体方差 的点估计量为的点估计量为 ,且且4.总体方差在1-置信水平下的置信区间为第28页/共85页第六章 总体参数估计总体方差区间估计总体方差区间估计(图示)(图示)1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为n n-1-1的的 第29页/共85页第六章 总体参数估计【例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第30页/共85页第六章 总体参数估计第三节第三节 两个总体参数的区间估计两个总体参数的区间估计 一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计 二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计 三、两个总体方差比的区间估计三、两个总体方差比的区间估计第31页/共85页第六章 总体参数估计两个总体参数的区间估计两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比第32页/共85页第六章 总体参数估计一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计(一)两个总体均值之差的估计:独立样本(一)两个总体均值之差的估计:独立样本1 1、大样本的估计、大样本的估计 假定条件假定条件 两个两个总体都服从正态分布,总体都服从正态分布,、已知已知 若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似(n(n1 1 3030和和n n2 2 30)30)两个样本是独立的随机样本两个样本是独立的随机样本第33页/共85页第六章 总体参数估计使用正态分布统计量使用正态分布统计量 z z第34页/共85页第六章 总体参数估计(1)1,2已知时,两个总体均值之差1-2在1-置信水平下的置信区间为(2)(2 2)1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为第35页/共85页第六章 总体参数估计【例例】某某地地区区教教育育委委员员会会想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表 。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%95%的置信区间的置信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n2=33S1=5.8 S2=7.2第36页/共85页第六章 总体参数估计解解:两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信区间为置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为两所中学高考英语平均分数之差的置信区间为5.035.03分分10.9710.97分分第37页/共85页第六章 总体参数估计2 2、小样本的估计、小样本的估计 假定条件两个总体都服从正态分布两个总体方差未知两个独立的小样本(n130和n230)(1)两个总体方差未知但相等:1=2 总体方差的合并估计量第38页/共85页第六章 总体参数估计估计量x1-x2的抽样标准差第39页/共85页第六章 总体参数估计两个样本均值之差的标准化两个总体均值之差1-2在1-置信水平下的置信区间为第40页/共85页第六章 总体参数估计【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 1第41页/共85页第六章 总体参数估计解解:根据样本数据计算得根据样本数据计算得 合并估计量为:合并估计量为:两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.140.14分钟分钟7.267.26分钟分钟第42页/共85页第六章 总体参数估计(2 2)两个总体方差未知且不相等:两个总体方差未知且不相等:且且n n1 1=n=n2 2=n=n 使用统计量使用统计量 在在 置信水平下的置信区间为置信水平下的置信区间为第43页/共85页第六章 总体参数估计(2)两个总体方差未知且不相等:两个总体方差未知且不相等:且且n1n1n2n2使用统计量使用统计量样本均值之差将标准化后不再服从自由度为(样本均值之差将标准化后不再服从自由度为(n1+n2-2n1+n2-2)的)的t t分布,而是分布,而是近似服从自由度为近似服从自由度为v v的的t t分布分布第44页/共85页第六章 总体参数估计两个总体均值之差1-2在1-置信水平下的置信区间为自由度自由度第45页/共85页第六章 总体参数估计【例】沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排名工人,即n1=12,n2=8,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 1第46页/共85页第六章 总体参数估计解:根据样本数据计算得 自由度为:两种方法组装产品所需平均时间之差的置信区间为0.192分钟9.058分钟第47页/共85页第六章 总体参数估计(二)两个总体均值之差的估计:匹配样本(二)两个总体均值之差的估计:匹配样本1 1、匹配大样本、匹配大样本假定条件两个匹配的大样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布两个总体均值之差d=1-2在1-置信水平下的置信区间为对应差值的均值对应差值的标准差第48页/共85页第六章 总体参数估计2 2、匹配小样本、匹配小样本假定条件两个匹配的小样本(n1 30和n2 30)两个总体各观察值的配对差服从正态分布 两个总体均值之差d=1-2在1-置信水平下的置信区间为第49页/共85页第六章 总体参数估计【例】由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表。试建立两种试卷分数 之 差d=1-2 95%的置信区间 10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号试卷试卷A试卷试卷B差值差值d17871726344193726111489845691741754951-27685513876601698577810553916第50页/共85页第六章 总体参数估计解解:根据样本数据计算得根据样本数据计算得两种试卷所产生的分数之差的置信区间为两种试卷所产生的分数之差的置信区间为6.336.33分分15.6715.67分分第51页/共85页第六章 总体参数估计二、两个总体比例之差的区间估计二、两个总体比例之差的区间估计1、假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的2、两个总体比例之差P1-P2在1-置信水平下的置信区间为第52页/共85页第六章 总体参数估计【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率差别的置信区间 1 12 2第53页/共85页第六章 总体参数估计解解:已知已知 n n1 1=500=500,n n2 2=400=400,p p1 1=45%=45%,p p2 2=32%=32%,1-1-=95%=95%,z z/2/2=1.96=1.96 P P1 1-P P2 2置信度为置信度为95%95%的置信区间为的置信区间为城城 市市 与与 农农 村村 收收 视视 率率 差差 值值 的的 置置 信信 区区 间间 为为6.68%19.32%6.68%19.32%第54页/共85页第六章 总体参数估计三、两个总体方差之比的区间估计三、两个总体方差之比的区间估计1、比较两个总体的方差比2、用两个样本的方差比来判断如果S12/S22接近于1,说明两个总体方差很接近如果S12/S22远离1,说明两个总体方差之间存在差异3、总体方差比在1-置信水平下的置信区间为第55页/共85页第六章 总体参数估计两个总体方差之比的区间估计两个总体方差之比的区间估计(图示)(图示)F FF F1-1-F F 总体方差比总体方差比1-1-的置信区间的置信区间方差比置信区间示意图第56页/共85页第六章 总体参数估计【例】为了研究男女学生在生活费支出(元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果:男学生:女学生:试以90%置信水平估计男女学生生活费支出方差比的置信区间 第57页/共85页第六章 总体参数估计解解:根根据据自自由由度度 n n1 1=25-1=24=25-1=24,n n2 2=25-1=24=25-1=24,查查得得 F F/2/2(24)=1.98(24)=1.98,F F1-1-/2/2(24)=1/1.98=0.505(24)=1/1.98=0.505 1 12 2/2 22 2置信度为置信度为90%90%的置信区间为的置信区间为男男 女女 学学 生生 生生 活活 费费 支支 出出 方方 差差 比比 的的 置置 信信 区区 间间 为为0.471.840.471.84 第58页/共85页第六章 总体参数估计第四节第四节 样本容量的确定样本容量的确定一、估计总体均值时样本容量的确定一、估计总体均值时样本容量的确定 E E代表所希望达到的边际误差,即代表所希望达到的边际误差,即 本容量的公式本容量的公式 第59页/共85页第六章 总体参数估计公式反映的信息:公式反映的信息:(1 1)样本容量与置信水平成正比;)样本容量与置信水平成正比;(2 2)样本容量与总体方差成正比;)样本容量与总体方差成正比;(3 3)样本容量与边际误差成反比。)样本容量与边际误差成反比。第60页/共85页第六章 总体参数估计【例题例题】拥有工商管理学士学位的大学毕业生的年拥有工商管理学士学位的大学毕业生的年薪的标准差约为薪的标准差约为20002000元,假定想要以元,假定想要以95%95%的置的置信水平估计年薪的置信区间,希望边际误差为信水平估计年薪的置信区间,希望边际误差为400400元。应抽取多大的样本容量?元。应抽取多大的样本容量?第61页/共85页第六章 总体参数估计解解:已知已知 =500=500,E E=200,=200,1-1-=95%=95%,z z/2/2=1.96=1.96 1 12 2/2 22 2置信度为置信度为90%90%的置信区间为的置信区间为即应抽取即应抽取9797人作为样本人作为样本 第62页/共85页第六章 总体参数估计二、估计总体比例时的样本容量的确定 E E为所希望达到的边际误差,即为所希望达到的边际误差,即 估计总体比利时样本容量的确定公式估计总体比利时样本容量的确定公式 第63页/共85页第六章 总体参数估计【例题例题】根据以往的生产统计,某种产品的合格根据以往的生产统计,某种产品的合格率约为率约为90%90%,现要求边际误差为,现要求边际误差为5%5%,在求置,在求置信水平为信水平为95%95%的置信区间时,应抽取多少个的置信区间时,应抽取多少个产品作为样本?产品作为样本?第64页/共85页第六章 总体参数估计解解:已已 知知=90%=90%,=0.05=0.05,z z/2/2=1.96=1.96,E E=5%=5%应抽取的样本容量应抽取的样本容量为为 应抽取应抽取139139个产品作为样本个产品作为样本第65页/共85页第六章 总体参数估计三、估计两个总体均值之差时样本容量的确三、估计两个总体均值之差时样本容量的确定定1、设n1和n2为来自两个总体的样本,并假定n1=n22、根据均值之差的区间估计公式可得两个样本的容量n为其中:其中:其中:第66页/共85页第六章 总体参数估计【例】一所中学的教务处想要估计试验班和普通班考试成绩平均分数差值的置信区间。要求置信水平为95%,预先估计两个班考试分数的方差分别为:试验班12=90,普通班 22=120。如果要求估计的误差范围(边际误差)不超过5分,在两个班应分别抽取多少名学生进行调查?第67页/共85页第六章 总体参数估计解解:已已知知 1 12 2=90=90,2 22 2=120=120,E E=5,=5,1-1-=95%=95%,z z/2/2=1.96=1.96即应抽取即应抽取1717人作为样本人作为样本 第68页/共85页第六章 总体参数估计四、估计两个总体比例之差时样本容量的确定四、估计两个总体比例之差时样本容量的确定1、设n1和n2为来自两个总体的样本,并假定n1=n22、根据比例之差的区间估计公式可得两个样本的容量n为其中:其中:第69页/共85页第六章 总体参数估计【例例】一一家家瓶瓶装装饮饮料料制制造造商商想想要要估估计计顾顾客客对对一一种种新新型型饮饮料料认认知知的的广广告告效效果果。他他在在广广告告前前和和广广告告后后分分别别从从市市场场营营销销区区各各抽抽选选一一个个消消费费者者随随机机样样本本,并并询询问问这这些些消消费费者者是是否否听听说说过过这这种种新新型型饮饮料料。这这位位制制造造商商想想以以10%10%的的误误差差范范围围和和95%95%的的置置信信水水平平估估计计广广告告前前后后知知道道该该新新型型饮饮料料消消费费者者的的比比例例之之差差,他他抽抽取取的的两两个个样样本本分分别别应应包包括括多多少少人人?(假假定定两两个个样样本本容容量量相等相等)绿色绿色健康饮品健康饮品第70页/共85页第六章 总体参数估计解:E=10%,1-=95%,z/2=1.96,由于没有P的信息,用0.5代替即应抽取193位消费者作为样本 第71页/共85页第六章 总体参数估计第六章课后作业:第六章课后作业:1.1.从一个标准差为从一个标准差为5 5的总体中以重复抽样的方的总体中以重复抽样的方式抽出一个容量为式抽出一个容量为4040的样本,样本均值为的样本,样本均值为25.25.(1 1)样本均值的抽样标准差是多少?)样本均值的抽样标准差是多少?(2 2)在)在95%95%的置信水平下,边际误差是多少?的置信水平下,边际误差是多少?第72页/共85页第六章 总体参数估计2.2.某快餐店想要估计每位顾客午餐的平均花费某快餐店想要估计每位顾客午餐的平均花费金额,在为期金额,在为期3 3周的时间里以重复抽样的方式周的时间里以重复抽样的方式选取选取4949名顾客组成了一个简单随机样本。名顾客组成了一个简单随机样本。(1 1)假定总体标准差为)假定总体标准差为1515元,求样本均值的抽元,求样本均值的抽样标准化差。样标准化差。(2 2)在)在95%95%的置信水平下,求边际误差;的置信水平下,求边际误差;(3 3)如果样本均值为)如果样本均值为120120元,求总体均值在元,求总体均值在95%95%置信水平下的置信区间。置信水平下的置信区间。第73页/共85页第六章 总体参数估计3.3.在一项家电调查中,随机抽取了在一项家电调查中,随机抽取了200200户居民,调查他们是否户居民,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%23%。求总体比例的置信区间,置信水平分别为。求总体比例的置信区间,置信水平分别为90%90%和和95%95%。4.4.某居民小区共有居民某居民小区共有居民500500户,校小区管理者准备采用一项新户,校小区管理者准备采用一项新的供水设施,想了解居民赞成与否。采取重复抽样方法随的供水设施,想了解居民赞成与否。采取重复抽样方法随机抽取了机抽取了5050户,其中有户,其中有3232户赞成,户赞成,1818户反对。户反对。(1 1)求总体中赞成该项改革的户数比例的置信区间,置信水)求总体中赞成该项改革的户数比例的置信区间,置信水平为平为95%95%。(2 2)如果小区管理者预计赞成的比例达到)如果小区管理者预计赞成的比例达到80%80%,应抽取多少,应抽取多少户进行调查?户进行调查?第74页/共85页第六章 总体参数估计5.5.从两个正态总体中分别抽取两个独立的随机样本,它们的从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:均值和标准差如下表所示:(1 1)求在)求在 90%90%置信水平下的置信区间。置信水平下的置信区间。(2 2)求在)求在 95%95%置信水平下的置信区间。置信水平下的置信区间。来自总体来自总体1 1的样本的样本来自总体来自总体2的样本的样本第75页/共85页第六章 总体参数估计6.6.从两个正态总体中分别抽取两个独立的随机样本,它们的均从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:值和标准差如下表:求求 在在95%95%置信水平下的置信区间。置信水平下的置信区间。(1 1)设)设n1=n2=100n1=n2=100。(2 2)设)设n1=n2=10n1=n2=10,。来自总体来自总体1 1的样本的样本来自总体来自总体2的样本的样本第76页/共85页第六章 总体参数估计(3 3)设)设n1=n2=10n1=n2=10,。(4 4)设)设n1=10n1=10,n2=20n2=20,。(5 5)设)设n1=10n1=10,n2=20n2=20,。第77页/共85页第六章 总体参数估计7.7.下表是由下表是由4 4对观察值组成的随机样本:对观察值组成的随机样本:(1 1)计算)计算A A与与B B各对观察值之差,再利用得出的差值计算各对观察值之差,再利用得出的差值计算 和和 。配对号配对号来自总体来自总体A 的样本的样本来自总体来自总体B的样本的样本1202573106485第78页/共85页第六章 总体参数估计(2 2)设)设 设设 分别为总体分别为总体A A和和B B的均值,构造的均值,构造 在在95%95%置信水平下的置信区间。置信水平下的置信区间。第79页/共85页第六章 总体参数估计8.8.从两个总体中各抽取一个从两个总体中各抽取一个n n1 1=n=n2 2=250=250的独立随机样本,的独立随机样本,来自总体来自总体1 1的样本比例为的样本比例为p p1 1=40%=40%,来自总体,来自总体2 2 的样本的样本比例为比例为p p2 2=30%=30%。(1 1)构造)构造P P1 1-P-P2 2在在90%90%的置信水平下的置信区间。的置信水平下的置信区间。(2 2)构造)构造P P1 1-P-P2 2在在95%95%的置信水平下的置信区间。的置信水平下的置信区间。9.9.根据以往的生产数据,某种产品的废品率为根据以往的生产数据,某种产品的废品率为2%2%。如。如果要求在果要求在95%95%置信水平下的置信区间,若要求边际误置信水平下的置信区间,若要求边际误差不超过差不超过4%4%,应抽取多大的样本?,应抽取多大的样本?第80页/共85页第六章 总体参数估计10.10.某超市想要估计每位顾客平均每次购物花费的金额。某超市想要估计每位顾客平均每次购物花费的金额。根据过去的经验,标准差大约为根据过去的经验,标准差大约为120120元,现要求以元,现要求以95%95%的置信水平估计每位顾客购物金额的置信区间,的置信水平估计每位顾客购物金额的置信区间,并要求边际误差不超过并要求边际误差不超过2020元,应抽取多少位顾客作元,应抽取多少位顾客作为样本?为样本?11.11.假定两个总体的标准差分别为假定两个总体的标准差分别为 和和 ,若要求误差范围不超过若要求误差范围不超过5 5,相应的置信水平为,相应的置信水平为95%95%,假定假定n1=n2n1=n2,估计两个总体均值之差,估计两个总体均值之差 时所时所需的样本容量为多大?需的样本容量为多大?第81页/共85页第六章 总体参数估计12.12.假定假定n n1 1=n=n2 2,边际误差为,边际误差为0.050.05,相应的置信水平为,相应的置信水平为95%95%,估,估计两个总体比例之差计两个总体比例之差P P1 1-P-P2 2时所需要的样本容量为多大?时所需要的样本容量为多大?13.13.生产工序的方差是工序质量的一个重要度量。当方差较大生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进减小方差。下面是两部机器生产时,需要对工序进行改进减小方差。下面是两部机器生产的袋茶重量(单位:的袋茶重量(单位:g g)的数据:)的数据:构造两个总体方差比在构造两个总体方差比在90%90%置信水平下的置信区间。置信水平下的置信区间。第82页/共85页第六章 总体参数估计机器机器1机器机器23.453.223.903.223.283.353.202.983.703.383.193.303.223.753.283.303.203.053.503.383.353.303.293.332.953.453.203.343.353.273.163.483.123.283.163.283.203.183.253.303.343.25第83页/共85页第六章 总体参数估计第84页/共85页谢谢您的观看!第85页/共85页