《最新应用统计学第四章推断统计PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新应用统计学第四章推断统计PPT课件.ppt(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学第四章推断统计应用统计学第四章推断统计 第四章第四章 统计推断统计推断一、一、概念概念 1 1、参数估计:在抽样分布及抽样分布的基础上,据样、参数估计:在抽样分布及抽样分布的基础上,据样本统计量来推断总体参数的统计方法。本统计量来推断总体参数的统计方法。2 2、估计量:用来估计总体参数的统计量的名称;估计量:用来估计总体参数的统计量的名称;估计值:计算得到的样本估计量的具体数值估计值:计算得到的样本估计量的具体数值 第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断 第四章第四
2、章 统计推断统计推断 第四章第四章 统计推断统计推断 1、一个总体均值、一个总体均值 的置信区间的置信区间:(1 1)大样本(大样本(n 30n 30)时,总体均值的置信区间为:)时,总体均值的置信区间为:方差方差 已知时:已知时:方差方差 未知时:未知时:(用(用 代替代替 )补充:当样本来自非正态总体时,应将样本容量增加到补充:当样本来自非正态总体时,应将样本容量增加到3030以上,再进行抽样和区间估计,均值的置信区间同上面推以上,再进行抽样和区间估计,均值的置信区间同上面推导的大样本导的大样本(n 30n 30)的情况。的情况。第四章第四章 统计推断统计推断(2 2)样本来自正态总体样本
3、来自正态总体 样本容量为小样本即(样本容量为小样本即(n n 3030)时,总体均值的置信区间为:)时,总体均值的置信区间为:已知时,已知时,未知时,未知时,第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断例例1 1 现从一批灯泡中随机地取现从一批灯泡中随机地取1616只,测的其使用寿命(以小时为单位)只,测的其使用寿命(以小时为单位)如下表所示。如下表所示。设灯泡的使用寿命近似地服从正态分布,试求灯泡的平均使用寿命设灯泡的使用寿命近似地服从正态分布,试求灯泡的平均使用寿命95%95%的的置信区间置信区间 。解解 :总体的方差未知,故总体均值的置信区间为:总体的方差未知,故总体均
4、值的置信区间为:而,经过计算得,而,经过计算得,又查表得,又查表得,故所求的置信区间为(故所求的置信区间为(1476.8,1503.21476.8,1503.2)。)。1510152014801500145014801510152014801490153015101460146014701470 第四章第四章 统计推断统计推断例例2 2:某食品生产企业以生产袋装食品为主,每天的产量为:某食品生产企业以生产袋装食品为主,每天的产量为80008000袋左右,按照规定每袋的重量应为袋左右,按照规定每袋的重量应为100100克,为对产品质量克,为对产品质量进行监测,企业质检部门从某天生产的一批产品中随
5、机抽取进行监测,企业质检部门从某天生产的一批产品中随机抽取了了6464袋,测得该样本的均值为袋,测得该样本的均值为105.36105.36克,标准差为克,标准差为1010克,试克,试估计该批产品平均重量的置信区间为多少?(置信度为估计该批产品平均重量的置信区间为多少?(置信度为95%95%)例例3 3:从某公司生产的一批瓶装产品中,随机抽取:从某公司生产的一批瓶装产品中,随机抽取1010罐产品,罐产品,测得每罐的重量分别为测得每罐的重量分别为318318、320320、322322、321321、321321、323323、319319、320320、320320、324324(克),以(克)
6、,以95%95%的置信度求该公司这批产品平的置信度求该公司这批产品平均重量的置信区间。(产品重量服从正态分布)均重量的置信区间。(产品重量服从正态分布)第四章第四章 统计推断统计推断复习:设复习:设 来自正态总体来自正态总体 的样本,的样本,分别为样本的均值和方差。则分别为样本的均值和方差。则 样本来自正态总体,则总体方差样本来自正态总体,则总体方差 的置信区间为的置信区间为 第四章第四章 统计推断统计推断由样本比率的抽样分布可以知,当样本容量由样本比率的抽样分布可以知,当样本容量 足够足够(一般指不小于(一般指不小于3030,且且 都大于都大于5 5),),样本比率的抽样分布近似正态分布。设
7、总体比率为样本比率的抽样分布近似正态分布。设总体比率为 ,则有则有 对于置信度对于置信度 ,P P的置信区间为的置信区间为 第四章第四章 统计推断统计推断由样本比率的抽样分布可以知,当样本容量由样本比率的抽样分布可以知,当样本容量 足够足够(一般指不小于(一般指不小于3030,且且 都大于都大于5 5),),样本比率的抽样分布近似正态分布。设总体比率为样本比率的抽样分布近似正态分布。设总体比率为 ,则有则有 对于置信度对于置信度 ,P P的置信区间为的置信区间为 第四章第四章 统计推断统计推断例例4 4:对某种奶粉进行检查,从中随机抽取:对某种奶粉进行检查,从中随机抽取2020袋,测得样本袋,
8、测得样本的平均重量为的平均重量为250.8250.8克,标准差为克,标准差为1.251.25克,已知其重量服克,已知其重量服从从 正态分布,求总体方差在置信度为正态分布,求总体方差在置信度为90%90%时的置信区间为时的置信区间为多少?多少?例例5 5:某城市要估计下岗职工中女性所占的比例,随机抽取:某城市要估计下岗职工中女性所占的比例,随机抽取了了100100个职工,其中个职工,其中6565人为女性。对于置信度人为女性。对于置信度95%95%,试求,试求该城市下岗职工中女性所占的比例的置信区间为多少?该城市下岗职工中女性所占的比例的置信区间为多少?第四章第四章 统计推断统计推断一、一、假设检
9、验的基本问题假设检验的基本问题 1 1、假设检验假设检验:在总体的分布函数已知,但参数未知时,:在总体的分布函数已知,但参数未知时,先对总体分布中的未知参数(均值、比率、方差)提先对总体分布中的未知参数(均值、比率、方差)提出假设,利用样本提供的信息来检验这个假设,即接出假设,利用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。受此假设还是拒绝此假设。第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断备择假设(备择假设(H1H1):研究者予以支持的假设。表示为总体参数):研究者予以支持的假设。表示为总体参数 “、”某个给定的数值。某个给定的数值。原假设原假设(H(H0 0
10、):检验中予以拒绝或者接受的假设,备择假设的对立:检验中予以拒绝或者接受的假设,备择假设的对立 假设,检验的目的就是为了收集证据拒绝原假设。假设,检验的目的就是为了收集证据拒绝原假设。表示为总体参数表示为总体参数“、”某个给定的数值。某个给定的数值。第四章第四章 统计推断统计推断“弃真弃真”错误:错误:原假设为真时原假设为真时,我们却作出拒绝的错我们却作出拒绝的错 误决策误决策,称这类为第一类错误。该错误发生的概率为称这类为第一类错误。该错误发生的概率为 。“取伪取伪”错误:错误:当原假设为假时当原假设为假时,我们却接受了原假设我们却接受了原假设,称这类错误为第二类错误。称这类错误为第二类错误
11、。第四章第四章 统计推断统计推断显著性检验:显著性检验:这种只对犯第一类错误的概率加以控制这种只对犯第一类错误的概率加以控制,而不考虑而不考虑 犯第二类错误的检验问题犯第二类错误的检验问题,称为显著性检验问题。称为显著性检验问题。显著性水平:显著性水平:“弃真弃真”错误发生的概率错误发生的概率 ,是事先给定的概率是事先给定的概率 值,也是统计量落在拒绝区域的概率。值,也是统计量落在拒绝区域的概率。第四章第四章 统计推断统计推断 5 5、拒绝域、拒绝域:拒绝原假设的统计量所有可能取值组成的集合。:拒绝原假设的统计量所有可能取值组成的集合。6 6、检验统计量:、检验统计量:据样本观测计算得到的,并
12、据此对原假设和备择假设据样本观测计算得到的,并据此对原假设和备择假设 做出决策的某个样本统计量做出决策的某个样本统计量7、假设检验的类型及拒绝域的决定:假设检验的类型及拒绝域的决定:双侧检验,备择假设为双侧检验,备择假设为“”“”,拒区域位于临界值两侧;,拒区域位于临界值两侧;右侧检验,备择假设为右侧检验,备择假设为“”,拒区域位于临界值右侧;,拒区域位于临界值右侧;左侧检验,备择假设为左侧检验,备择假设为“”,拒区域位于临界值左侧;,拒区域位于临界值左侧;第四章第四章 统计推断统计推断第一步:根据实际问题的要求第一步:根据实际问题的要求,提出原假设和备择假设;提出原假设和备择假设;第二步:第
13、二步:给定显著性水平以及样本容量;给定显著性水平以及样本容量;第第三三步步:确确定定检检验验统统计计量量及及其其分分布布,并并由由原原假假设设的的内内容容 确定拒绝域的形式(构建统计量);确定拒绝域的形式(构建统计量);第四步:第四步:由由 拒绝拒绝|为真为真=求出拒绝域;求出拒绝域;第五步;根据样本观测值计算检验统计量的具体值;第五步;根据样本观测值计算检验统计量的具体值;第六步;作出拒绝还是接受原假设的统计判断。第六步;作出拒绝还是接受原假设的统计判断。第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断例例1 1 某某厂厂生生产产某某种种型型号号的的内内胎胎,从从长长期期的的生
14、生产产经经验验知知道道其其扯扯断断强强力力服服从从均均值值 =1380=1380(N/N/),标标准准差差 =50=50(N/N/)的的正正态态分分布布。该该厂厂为为提提高高产产品品的的质质量量,改改变变了了原原来来的的配配方方进进行行现现场场生生产产试试验验。设设新新配配方方生生产产的的内内胎胎其其扯扯断断强强力力仍仍服服从从正正态态分分布布。由由于于在在试试验验中中除除配配方方外外,其其他他条条件件都都保保持持不不变变,因因此此可可以以认认为为新新配配方方未未改改变变此此型型号号内内胎胎扯扯断断强强力力的的方方差差。采采用用新新配配方方的的5 5 次次试试验验,测测得得内内胎胎扯扯断断强强
15、力力为为(单单位位:N/N/):14501450,14601460,13601360,14301430,14201420,试试问问采采用用新新配配方方,是是否否能能提提高高内内胎的扯断强力?胎的扯断强力?第四章第四章 统计推断统计推断解:第一步:提出假设解:第一步:提出假设 第二步:计算检验统计量第二步:计算检验统计量 解得解得 ,=50=50,=1380=1380,求得,求得 第三步:确定拒绝域,备择假设为第三步:确定拒绝域,备择假设为“”,则为右侧检验,拒绝,则为右侧检验,拒绝 域为域为 Z Z ,=0.05,=,=0.05,=第四步:由第四步:由 ,可知,可知Z Z ,落在拒绝域,拒绝原
16、假设。,落在拒绝域,拒绝原假设。第四章第四章 统计推断统计推断 第四章第四章 统计推断统计推断例例2 2 某种元件,按照标准其使用寿命不低于某种元件,按照标准其使用寿命不低于10001000(小时),现从生产(小时),现从生产出的一批元件中随机抽取出的一批元件中随机抽取2525件,测得其平均寿命为件,测得其平均寿命为950950(小时),样(小时),样本标准差为本标准差为100100(小时)。(小时)。假设该种元件寿命服从正态分布,对于置假设该种元件寿命服从正态分布,对于置信度信度95%,95%,试问这批元件是否可以认为合格?试问这批元件是否可以认为合格?解解 此问题即要检验此问题即要检验 检
17、验统计量检验统计量 而由已知可得,而由已知可得,,,n=25n=25,计算得到,计算得到 备择假设为备择假设为“”,则是左侧检验,拒绝域为,则是左侧检验,拒绝域为 。查表求得查表求得 ,可知,可知 故拒绝原假设,认为这批元件不合格。故拒绝原假设,认为这批元件不合格。第四章第四章 统计推断统计推断例例3 3:有人说某学院学生平均每天锻炼时间至少为:有人说某学院学生平均每天锻炼时间至少为3030分分钟,钟,随机在该学院抽取随机在该学院抽取100100名学生,测得他们每天的名学生,测得他们每天的平均锻炼时间为平均锻炼时间为3131分钟,标准差为分钟,标准差为1212分钟,试在显著分钟,试在显著性水平
18、为性水平为0.050.05时,检验该人的说法是否可信?时,检验该人的说法是否可信?例例4 4:某停车场管理员认为,该停车场每辆车平均停车:某停车场管理员认为,该停车场每辆车平均停车时间不会超过时间不会超过3030分钟,现从该停车场随机抽取分钟,现从该停车场随机抽取1616辆汽辆汽车进行观测,测得平均停车时间为车进行观测,测得平均停车时间为2828分钟,标准差为分钟,标准差为5.35.3分钟,试在分钟,试在=0.05=0.05时,检验该管理人员的说法是否时,检验该管理人员的说法是否可信?(车辆的停车时间服从正态分布)可信?(车辆的停车时间服从正态分布)第四章第四章 统计推断统计推断复习:设复习:
19、设 来自正态总体来自正态总体 的样本,的样本,分别为样本的均值和方差。则分别为样本的均值和方差。则方差的检验统计量为方差的检验统计量为:第四章第四章 统计推断统计推断由样本比率的抽样分布可以知,当样本容量由样本比率的抽样分布可以知,当样本容量 足够大足够大(一般指不小于(一般指不小于3030,且且 都大于都大于5 5),),样本比率的抽样分布近似正态分布。设总体比率为样本比率的抽样分布近似正态分布。设总体比率为 ,则有则有 比率的检验统计量为比率的检验统计量为 第四章第四章 统计推断统计推断例5:某公司为了分析新产品的电视广告效果,随机访问了100名用户,了解到其中有36人是通过电视广告了解该产品的。试以0.05的显著性水平作出判断,此项调查结果是否支持全部用户有一半以上是通过电视广告了解该产品的假定是否正确?例6:一家制造厂仅当原材料的抗强度方差不超过5时,方予接受材料,今从一批新到的原材料中抽出24个样本,测得方差为7,这个数据能否为制造厂拒绝这批原材料提供充分依据?(=0.05)结束语结束语谢谢大家聆听!谢谢大家聆听!34
限制150内