区间估计及运算(精品).ppt





《区间估计及运算(精品).ppt》由会员分享,可在线阅读,更多相关《区间估计及运算(精品).ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四节 区间估计的计算与原理一、两种主要的估计方法一、两种主要的估计方法p点估计点估计是指根据抽取到的具体样本数据,是指根据抽取到的具体样本数据,代入估计量得到的一个估计值。代入估计量得到的一个估计值。p区间估计是在点估计的基础上估计出总体区间估计是在点估计的基础上估计出总体参数一个可能的范围,同时还给出总体参参数一个可能的范围,同时还给出总体参数以多大的概率落在这个范围之内。数以多大的概率落在这个范围之内。二、为什么要区间估计呢?二、为什么要区间估计呢?在上述警察逮捕人数的例子中,你计算得出在上述警察逮捕人数的例子中,你计算得出均值为均值为15.6人,你的上司可能会问,这一均人,你的上司可能
2、会问,这一均值的确是值的确是15.6吗?吗?你的回答将是不知道。但是,你的计算告诉你的回答将是不知道。但是,你的计算告诉你,这一均值的最优估计值是你,这一均值的最优估计值是15.6。你的上司可能又会问了,你的上司可能又会问了,15.6这一估计值到这一估计值到底有多好?底有多好?也就是说,这一均值估计量包也就是说,这一均值估计量包含多大的误差?含多大的误差?回答上述问题的一个办法是抽取很多的样本,回答上述问题的一个办法是抽取很多的样本,计算每一个样本的均值,然后向上司展示计算每一个样本的均值,然后向上司展示均值估计量的变化范围。不过,这种办法均值估计量的变化范围。不过,这种办法显得有些笨。显得有
3、些笨。如果你想把这一问题处理得更加高明些,你如果你想把这一问题处理得更加高明些,你就应该计算所有样本均值的平均误差。均就应该计算所有样本均值的平均误差。均值的标准差有一个专门的名称:均值标准值的标准差有一个专门的名称:均值标准误差。误差。关于区间估计关于区间估计设设 为总体为总体x 的未知参数,的未知参数,为来自为来自总体的容量为总体的容量为n的简单随机样本,对于预先的简单随机样本,对于预先给定的一个充分小的正数给定的一个充分小的正数 ,我们,我们构造两个统计量:构造两个统计量:使得使得则称区间则称区间 为总体参数为总体参数 的区间估的区间估计或置信区间。计或置信区间。称为置信区间的置称为置信
4、区间的置信度,也称置信概率、置信系数或置信水平,信度,也称置信概率、置信系数或置信水平,称为置信下限,称为置信下限,称为置信上限。称为置信上限。三、置信区间的含义三、置信区间的含义若独立地反复多次抽取容量相同的简单随机样本,每一个样若独立地反复多次抽取容量相同的简单随机样本,每一个样本都确定一个随机区间本都确定一个随机区间 ,在这些区间中,包含,在这些区间中,包含总体参数总体参数 真值的约占真值的约占 ,或者说有,或者说有 的随机区间的随机区间 会包含总体参数会包含总体参数 的真值。的真值。例如,若例如,若 ,独立地反复抽取容量相同的简单随机,独立地反复抽取容量相同的简单随机样本样本10001
5、000次,在得到的次,在得到的10001000个随机区间中,不包含总体参个随机区间中,不包含总体参数数 真值的大约有真值的大约有5050个。个。四、简单随机抽样和等距抽样的参数估计四、简单随机抽样和等距抽样的参数估计(一)总体均值的置信区间和参数估计(一)总体均值的置信区间和参数估计总体均值的区间估计根据已知条件不同,有总体均值的区间估计根据已知条件不同,有不同的计算方法。不同的计算方法。1.1.从正态总体中抽取样本,且总体方差已知,从正态总体中抽取样本,且总体方差已知,均值均值的区间估计的区间估计 1.1.从正态总体中抽取样本,且总体方差已知,从正态总体中抽取样本,且总体方差已知,均值均值的
6、区间估计的区间估计 (1)重复抽样的条件下设 ,已知,为来自总体的容量为n的简单随机样本,则 的抽样分布为在重复抽样的方式下,总体均值在重复抽样的方式下,总体均值的置信的置信度为度为1-1-的置信区间为的置信区间为其中,其中,是标准正态分布是标准正态分布水平的双侧分位水平的双侧分位数。数。例一:例一:假设参加某种寿险投保人的年龄服从正假设参加某种寿险投保人的年龄服从正态分布,标准差为态分布,标准差为=7.77=7.77岁。从中抽取岁。从中抽取3636人组成一个简单随机样本(重复抽样),人组成一个简单随机样本(重复抽样),其平均年龄为其平均年龄为39.539.5岁,试建立投保人平均岁,试建立投保
7、人平均年龄年龄的的90%90%的置信区间。的置信区间。解解 假设用随机变量假设用随机变量X X表示某种寿险投保人的表示某种寿险投保人的年龄,则由已知条件有年龄,则由已知条件有 ,n=36n=36。与置信度。与置信度90%90%相对应的相对应的=0.10=0.10,查表,得到查表,得到 由公式,由公式,得,总体均值得,总体均值的置信度为的置信度为90%90%的置信区间为的置信区间为 于是可以说,我们有于是可以说,我们有90%90%的把握确信,寿险的把握确信,寿险投保人总体的平均年龄介于投保人总体的平均年龄介于37.3737.37到到 41.6341.63岁之间。岁之间。1.1.从正态总体中抽取样
8、本,且总体方差已知,从正态总体中抽取样本,且总体方差已知,均值均值的区间估计的区间估计 (2)在不重复抽样的条件下,置信区间为例例2 2 一家食品公司,每天大约生产袋装食品一家食品公司,每天大约生产袋装食品若干,总体方差为若干,总体方差为100100。为对产品质量进行。为对产品质量进行检测,该企业质检部门采用抽样技术,每检测,该企业质检部门采用抽样技术,每天抽取一定数量的食品,以分析每袋重量天抽取一定数量的食品,以分析每袋重量是否符合质量要求。现从某一天生产的一是否符合质量要求。现从某一天生产的一批食品批食品80008000袋中随机抽取了袋中随机抽取了2525袋(不重复袋(不重复抽样),测得它
9、们的重量如下表所示:抽样),测得它们的重量如下表所示:已知产品重量服从正态分布,且总体方差为已知产品重量服从正态分布,且总体方差为100100。试估计该批产品平均重量的置信区间,置信水试估计该批产品平均重量的置信区间,置信水平为平为9595。解解 已知已知=10=10;n=25;1-n=25;1-=59%;=1.96=59%;=1.96根据样本资料,计算的样本均值为:根据样本资料,计算的样本均值为:根据公式得根据公式得 =105.361.96=105.361.96 即即105.363.914115=(101.4459,105.363.914115=(101.4459,109.2741)109.
10、2741),该批产品平均重量在,该批产品平均重量在9595置信水平下的置信区间为:置信水平下的置信区间为:101.4459101.4459109.2741109.2741。2.正态总体,大样本,若总体方差正态总体,大样本,若总体方差 未知,可用样本标准差未知,可用样本标准差S S代替。代替。能够把公式写出来吗?能够把公式写出来吗?重复抽样:?重复抽样:?不重复抽样:不重复抽样:?例三:例三:假设参加某种寿险投保人的年龄服从正假设参加某种寿险投保人的年龄服从正态分布。从中抽取态分布。从中抽取3636人组成一个简单随机人组成一个简单随机样本(重复抽样,年龄数据见下页表),样本(重复抽样,年龄数据见
11、下页表),试建立投保人平均年龄试建立投保人平均年龄的的90%90%的置信区的置信区间。间。解:已知解:已知n=36n=36,1-=90%=90%;1.6451.645,由,由于总体方差未知,但为大样本,故可用样于总体方差未知,但为大样本,故可用样本方差代替。本方差代替。根据样本资料计算的样本均值和样本根据样本资料计算的样本均值和样本标准差为:标准差为:则置信区间为:则置信区间为:即即39.52.13=(37.3739.52.13=(37.37,41.63)41.63),投保人平均,投保人平均年龄在年龄在9090的置信水平下的置信区间为的置信水平下的置信区间为37.3737.37岁岁41.634
12、1.63岁。岁。3.3.正态总体、小样本情况下,总体方差未知,正态总体、小样本情况下,总体方差未知,总体均值的估计总体均值的估计 (重复抽样条件下)(重复抽样条件下)(不重复抽样条件下)(不重复抽样条件下)如果总体服从正态分布如果总体服从正态分布,只要总体方差只要总体方差已知,即使在小样本情况下,也可以计算总已知,即使在小样本情况下,也可以计算总体均值的置信区间。如果总体方差未知,需体均值的置信区间。如果总体方差未知,需用样本方差代替,在小样本情况下,应用用样本方差代替,在小样本情况下,应用t t分布来建立总体均值的置信区间。分布来建立总体均值的置信区间。t t分布是类似正态分布的一种对称分布
13、,分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。随着自由度通常要比正态分布平坦和分散。随着自由度的增大,的增大,t t分布逐渐趋于正态分布。分布逐渐趋于正态分布。4 4.非正态总体且大样本时,均值非正态总体且大样本时,均值的区间估计的区间估计 首先,当总体为非正态分布时,只要样本容首先,当总体为非正态分布时,只要样本容量充分大(一般习惯上要求量充分大(一般习惯上要求n=30n=30),),的抽样分布近似服从正态分布。的抽样分布近似服从正态分布。当当 已知时,仍可用上述公式,根据重复抽样已知时,仍可用上述公式,根据重复抽样与否,近似求出总体均值与否,近似求出总体均值的置信区间;的
14、置信区间;其次,当其次,当未知时,只要将上述公式中的总未知时,只要将上述公式中的总体标准差体标准差用样本标准差用样本标准差S S代替,就可近似代替,就可近似得到总体均值得到总体均值的置信区间:的置信区间:(重复抽样条件下)(重复抽样条件下)(不重复抽样条件下)(不重复抽样条件下)例例 为了解居民用于服装消费的支出情况为了解居民用于服装消费的支出情况(非正态分布),随机抽取(非正态分布),随机抽取9090户居民组成户居民组成一个简单随机样本(重复抽样),计算得一个简单随机样本(重复抽样),计算得样本均值为样本均值为810810元,样本标准差为元,样本标准差为8585元,试元,试建立该地区每户居民
15、平均用于服装消费支建立该地区每户居民平均用于服装消费支出的出的95%95%的置信区间。的置信区间。解解 假设用随机变量假设用随机变量X X表示居民的服装消费支表示居民的服装消费支出,本题虽然总体分布未知,但由于出,本题虽然总体分布未知,但由于n=90n=90,是大样本且,是大样本且未知,所以可利用公式近未知,所以可利用公式近似得到总体均值似得到总体均值的置信区间。根据题意,的置信区间。根据题意,元,元,元,元,n=90n=90,与置信度,与置信度95%95%相对应相对应的的=0.05=0.05,查表得到:,查表得到:将这些数据代入公式,便可得到总体将这些数据代入公式,便可得到总体均值均值的置信
16、度为的置信度为95%95%的置信区间为的置信区间为于是,我们有于是,我们有95%95%的把握认为,该地区每户居的把握认为,该地区每户居民平均用于服装消费的支出大约介于民平均用于服装消费的支出大约介于792.44792.44元到元到827.56827.56元之间。元之间。总体总体分布分布样本容量已知重复抽样已知不重复抽样正态分布小样本(=30)非正态分布小样本(=30)总体均值总体均值的区间估计(置信度为的区间估计(置信度为1-1-)简单随机抽样和等距抽样简单随机抽样和等距抽样 总体均值总体均值的区间估计(置信度为的区间估计(置信度为1-1-)简单随机抽样和等距抽样简单随机抽样和等距抽样 总体总
17、体分布分布样本容量未知重复抽样未知不重复抽样正态分布小样本(=30)非正态分布小样本(=30)四、简单随机抽样和等距抽样的参数估计四、简单随机抽样和等距抽样的参数估计(二)两个总体均值之差的区间估计间(二)两个总体均值之差的区间估计间1 1两正态总体方差已知时,且大样本,两正态总体方差已知时,且大样本,的区间估计的区间估计因此,两个总体均值差因此,两个总体均值差 的置信度为的置信度为1-1-的置信区间为:的置信区间为:如果两个总体方差如果两个总体方差 ,未知,则可利用未知,则可利用 ,代替两个总体方差即可。代替两个总体方差即可。下述公式可近似求出两个总体均值差下述公式可近似求出两个总体均值差
18、的置信度为的置信度为1-1-的置信区间。的置信区间。四、简单随机抽样和等距抽样的参数估计四、简单随机抽样和等距抽样的参数估计(二)两个总体均值之差的区间估计间(二)两个总体均值之差的区间估计间2 2两正态总体方差未知但相等时,两正态总体方差未知但相等时,的的区间估计(小样本)区间估计(小样本)当两个正态总体方差未知但相等,即当两个正态总体方差未知但相等,即 ,且,且 未知时,未知时,这时两个样本均值之差(这时两个样本均值之差()的抽样)的抽样分布为分布为所以因为 未知,则用共同方差 的合并估计量两个总体均值差两个总体均值差 的置信度为的置信度为1-1-的的置信区间为置信区间为其中,其中,是是水
19、平的自由度为水平的自由度为 的的t t分布双侧分位数。分布双侧分位数。例题:某公司为了解男女推销员的推销能力是否某公司为了解男女推销员的推销能力是否有差别,随机抽取有差别,随机抽取1616名男推销员和名男推销员和2525名女名女推销员进行测试。男推销员的平均销售额推销员进行测试。男推销员的平均销售额为为3025030250元,标准差为元,标准差为1840018400元,女推销员元,女推销员的平均销售额为的平均销售额为3375033750元,标准差为元,标准差为1350013500元。假设男女推销员的销售额服从正态分元。假设男女推销员的销售额服从正态分布,且方差相等。试建立男女推销员销售布,且方
20、差相等。试建立男女推销员销售额之差的额之差的95%95%的置信区间。的置信区间。解解 假设用随机变量 ,分别表示男女推销员的销售额,则由已知条件有 元,元,元,元,。又因两总体方差相等,可以估计出它们的共同方差:与置信度与置信度95%95%相对应的相对应的=0.05=0.05,查,查t t 分布分布表,得到表,得到 ,由公式得,由公式得男女推销员销售额之差的置信度为男女推销员销售额之差的置信度为95%95%的置的置信区间为信区间为于是,我们有于是,我们有95%95%的把握认为:男推销员的把握认为:男推销员的销售额既有可能比女推销员多的销售额既有可能比女推销员多65686568元,元,也有可能比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 区间 估计 运算 精品

限制150内