概率论与数理统计第九章.ppt





《概率论与数理统计第九章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第九章.ppt(155页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于概率论与数理统计第九章1现在学习的是第1页,共155页2n方差分析方差分析(Analysis of variance,简称简称:ANOVA),是由英国统计学家费歇尔是由英国统计学家费歇尔(Fisher)在在20世纪世纪20年代提出的年代提出的,可用于推断两个或两个以上可用于推断两个或两个以上总体均值是否有差异的显著性检验总体均值是否有差异的显著性检验.现在学习的是第2页,共155页31单因素方差分析单因素方差分析例:为了比较三种不同类型日光灯管的寿命例:为了比较三种不同类型日光灯管的寿命(小时小时),现将从每种类型日光灯管中抽取现将从每种类型日光灯管中抽取 8个个,总共总共 24 个日光灯
2、管进行老化试验个日光灯管进行老化试验,根据下面经老化根据下面经老化试验后测算得出的各个日光灯管的寿命试验后测算得出的各个日光灯管的寿命(小时小时),试判断三种不同类型日光灯管的寿命是不是有存在试判断三种不同类型日光灯管的寿命是不是有存在差异差异.现在学习的是第3页,共155页4日光灯管的寿命日光灯管的寿命(小小时时)类型寿命(小时)类型I52906210574050005930612060805310类型II58405500598062506470599054705840类型.III71306660634064707580656072906730引起日光灯管寿命不同的原因有二个方面引起日光灯管
3、寿命不同的原因有二个方面:n其一其一,由于日光灯类型不同由于日光灯类型不同,而引起寿命不同而引起寿命不同.n其二其二,同一种类型日光灯管同一种类型日光灯管,由于其它随机因素由于其它随机因素的影响的影响,也使其寿命不同也使其寿命不同.现在学习的是第4页,共155页5n在方差分析中在方差分析中,通常把研究对象的特征值通常把研究对象的特征值,即所即所考察的试验结果考察的试验结果(例如日光灯管的寿命例如日光灯管的寿命)称为称为 试验指标试验指标.n对试验指标产生影响的原因称为对试验指标产生影响的原因称为 因素因素,“日光日光灯管类型灯管类型”即为即为因素因素.n因素中各个不同状态称为因素中各个不同状态
4、称为 水平水平,如日光灯管三如日光灯管三个不同的类型个不同的类型,即为三个即为三个水平水平.现在学习的是第5页,共155页6n单因素方差分析单因素方差分析 仅考虑有一个因素仅考虑有一个因素A对试验指对试验指标的影响标的影响.假如因素假如因素 A有有r 个水平个水平,分别在第分别在第 i 水平下进行了水平下进行了 多次独立观测多次独立观测,所得到的试验指所得到的试验指标的数据标的数据 现在学习的是第6页,共155页7每个总体相互独立每个总体相互独立.因此因此,可写成如下的可写成如下的 数学模型数学模型:现在学习的是第7页,共155页8n 方差分析的目的就是要比较因素方差分析的目的就是要比较因素A
5、 的的r 个水平下试验指标理论均值的差异个水平下试验指标理论均值的差异,问题可归结为比较这问题可归结为比较这r个总体的均值个总体的均值差异差异.现在学习的是第8页,共155页9检验假设检验假设现在学习的是第9页,共155页10假设等价于假设等价于现在学习的是第10页,共155页11n为给出上面的检验,主要采用的方法是平方和为给出上面的检验,主要采用的方法是平方和分解。即分解。即n假设数据总的差异用总离差平方和假设数据总的差异用总离差平方和 分解为分解为二个部分二个部分:一部分是由于因素一部分是由于因素 A引起的差异引起的差异,即效应平方和即效应平方和 ;另一部分则由随机误差所另一部分则由随机误
6、差所引起的差异,引起的差异,即误差平方和即误差平方和 。现在学习的是第11页,共155页12现在学习的是第12页,共155页13证明:现在学习的是第13页,共155页14现在学习的是第14页,共155页15现在学习的是第15页,共155页16现在学习的是第16页,共155页17现在学习的是第17页,共155页18定理9.1.1现在学习的是第18页,共155页19方差来源平方和自由度均方F比因素Ar-1误差n-r总和n-1单因素试验方差分析表单因素试验方差分析表现在学习的是第19页,共155页20现在学习的是第20页,共155页21例例1 设设有有5种种治治疗疗荨荨麻麻疹疹的的药药,要要比比较较
7、它它们们的的疗疗效效。假假设设将将30个个病病人人分分成成5组组,每每组组6人人,令令同同组组病病人人使使用用一一种种药药,并并记记录录病病人人从从使使用用药药物物开开始始到到痊痊愈愈所所需需时时间间,得得到到下下面面的的记记录录:(=0.05)现在学习的是第21页,共155页22药物类型治愈所需天数x15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6现在学习的是第22页,共155页23这里药物是因子,共有这里药物是因子,共有5 5个水平,这是个水平,这是一个单因素方差分析问题,要检验的假一个单因素方差分析问题,要检验的假
8、设是设是“所有药物的效果都没有差别所有药物的效果都没有差别”。现在学习的是第23页,共155页24现在学习的是第24页,共155页25方差来源 平方和 自由度均方F比因素A36.46749.1173.90误差58.500252.334总和94.96729现在学习的是第25页,共155页26未知参数的估计未知参数的估计现在学习的是第26页,共155页27现在学习的是第27页,共155页28现在学习的是第28页,共155页29现在学习的是第29页,共155页30在在Excel上实现方差分析上实现方差分析n先加载先加载数据分析数据分析 这个模块这个模块,方法如下方法如下:n在在excel工作表中点击
9、主菜单中工作表中点击主菜单中“工具工具”点击下拉式菜点击下拉式菜单中单中“加载宏加载宏”就会出现一个就会出现一个“加载宏加载宏”的框的框.n 在在“分析工具库分析工具库”前的框内打勾点击前的框内打勾点击“确定确定”.这时这时候再点击下拉式菜单会新出现候再点击下拉式菜单会新出现“数据分析数据分析”.然后就可然后就可以进行统计分析了以进行统计分析了.现在学习的是第30页,共155页31以下面的例子来说明用以下面的例子来说明用Excel进行方差分进行方差分析的方法析的方法:n保险公司某一险种在四个不同地区一年的保险公司某一险种在四个不同地区一年的索赔额情况记录如表所示索赔额情况记录如表所示.试判断在
10、四个试判断在四个不同地区索赔额有无显著的差异不同地区索赔额有无显著的差异?现在学习的是第31页,共155页32保险索赔记录地区索赔额(万元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.60现在学习的是第32页,共155页33n在在Excel工作表中输入上面的数据点击主菜单中工作表中输入上面的数据点击主菜单中“工具工具”点击下拉式菜单中点击下拉式菜单中“数据分析数据分析”就会就会出现一个出现一个“数据分析数据分析”的框的框
11、.n 点击菜单中点击菜单中“方差分析方差分析:单因素方差分析单因素方差分析”点击点击“确定确定”,出现出现“方差分析方差分析:单因素方差分析单因素方差分析”框框.现在学习的是第33页,共155页34n在在“输入区域输入区域”中标定你已经输入的数据的位置中标定你已经输入的数据的位置根据你输入数据分组情况根据你输入数据分组情况(是按行分或按列分是按行分或按列分)确确定分组定分组.n选定方差分析中选定方差分析中F检验的显著水平选定输出结果检验的显著水平选定输出结果的位置点击的位置点击“确定确定”.n 在你指定的区域中出现如下方差分析表在你指定的区域中出现如下方差分析表:现在学习的是第34页,共155
12、页35方差来源平方和自由度均方F比P-valueF crit组间0.049230.01642.16590.1208 3.0491 组内0.1666220.0076总计0.215825方差分析表方差分析表现在学习的是第35页,共155页36根据根据Excel给出的方差分析表给出的方差分析表,假设假设H0的判别有二的判别有二种方法种方法:现在学习的是第36页,共155页37现在学习的是第37页,共155页38现在学习的是第38页,共155页39方差分析的前提现在学习的是第39页,共155页40n方差分析和其它统计推断一样方差分析和其它统计推断一样,样本的独立性样本的独立性对方差分析是非常重要的对方
13、差分析是非常重要的,在实际应用中会经常在实际应用中会经常遇到非随机样本的情况遇到非随机样本的情况,n这时使用方差分析得出的结论不可靠这时使用方差分析得出的结论不可靠.因此因此,在在安排试验或采集数据的过程中安排试验或采集数据的过程中,一定要注意样本一定要注意样本的独立性问题的独立性问题.现在学习的是第40页,共155页41n在实际中在实际中,没有一个总体真正服从正态分布的没有一个总体真正服从正态分布的,而而方差分析却依赖于正态性的假设方差分析却依赖于正态性的假设.不过由经验可知不过由经验可知,方差分析方差分析F检验对正态性的假设并不是非常敏感检验对正态性的假设并不是非常敏感,n即即,实际所得到
14、的数据实际所得到的数据,若没有异常值和偏性若没有异常值和偏性,或或者说者说,数据显示的分布比较对称的话数据显示的分布比较对称的话,即使样本即使样本容量比较小容量比较小(如每个水平下的样本容量仅为如每个水平下的样本容量仅为5左右左右),方差分析的结果仍是值得依赖的方差分析的结果仍是值得依赖的.现在学习的是第41页,共155页42n方差齐性对于方差分析是非常重要的方差齐性对于方差分析是非常重要的,因此在方因此在方差分析之前往往要进行方差齐性的诊断差分析之前往往要进行方差齐性的诊断,检验检验方差齐性假设通常采用方差齐性假设通常采用Barlett检验检验.n不过,也可采用如下的经验准则不过,也可采用如
15、下的经验准则:当最大样本标当最大样本标准差不超过最小样本标准差的两倍时准差不超过最小样本标准差的两倍时,方差分析方差分析F检验结果近似正确检验结果近似正确.现在学习的是第42页,共155页43例检验a,b两种药物的抗癌效果,要做动物试验。作法是:将患有某种癌的白鼠随机地分成三组。第一组:注射a物质,第二组:注射b物质,第三组:不做处理。经过一段时间观察后,得到寿命数据。在试验中,考虑白鼠的性别有可能对其寿命有显著的影响。将“性别”作为另一个因素“双因素试验双因素试验”。因素A:药物,三个水平;因素B:性别,二个水平;两个因素共有236种组合。2 双因素方差分析双因素方差分析现在学习的是第43页
16、,共155页44(一)无交互作用的双因素方差分析 因素B因素A现在学习的是第44页,共155页45现在学习的是第45页,共155页46分别检验假设现在学习的是第46页,共155页47现在学习的是第47页,共155页48现在学习的是第48页,共155页49现在学习的是第49页,共155页50现在学习的是第50页,共155页51双因素无重复试验的方差分析表方差来源平方和自由度均方F比因素A因素B误差总和现在学习的是第51页,共155页52例 假定对3个小麦品种和3块试验地块进行区组设计试验,得到如下的数据:表小麦品种区组试验数据小麦品种(A)试验地块(B)总和B1B2B3A125827924277
17、9A2302314336952A3321318327966总和8819119052697现在学习的是第52页,共155页53双因素无重复试验的方差分析表方差来源平方和自由度均方F比F值=0.05因素A7232.666723616.3333 12.506.94因素B168.0000284.0000 0.296.94误差1157.33334289.3333总和8558.00008现在学习的是第53页,共155页54在这个问题中我们所关心的是因素A的效应,由方差分析表知,原假设不成立,即认为小麦品种的产量之间有显著差异。在这里,品种3的单产最高,而品种1的产量最低,因此可以断定品种3明显地优于品种1
18、。现在学习的是第54页,共155页55(二)有交互作用的双因素方差分析 因素B因素A现在学习的是第55页,共155页56现在学习的是第56页,共155页57现在学习的是第57页,共155页58分别检验假设:分别检验假设:现在学习的是第58页,共155页59现在学习的是第59页,共155页60现在学习的是第60页,共155页61现在学习的是第61页,共155页62现在学习的是第62页,共155页63现在学习的是第63页,共155页64双因素试验的方差分析表方差来源平方和自由度均方F比因素A因素B交互作用误差总和现在学习的是第64页,共155页65例 为了比较3种松树在4个不同的地区的生长情况有无
19、差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到的数据列表如下。松树数据表松树种类地区1234123,15,26,13,2125,20,21,16,1821,17,16,24,2714,17,19,20,24228,22,25,19,2630,26,26,20,2819,24,19,25,2917,21,18,26,23318,10,12,22,1315,21,22,14,1223,25,19,13,2218,12,23,22,19现在学习的是第65页,共155页66输出各单元总和及因素水平总和:松树数据的总和表单元总和B1B2B3B4水平总和A19810010594397A21
20、20130116105471A3758410294355水平总和2933143232931223现在学习的是第66页,共155页67方差来源平方和自由度均方F比F值=0.05因素A344.93332172.46679.453.19因素B46.0500315.35000.842.80交互作用113.6000618.93331.042.30误差875.60004818.2417总和1380.183359双因素方差分析表现在学习的是第67页,共155页683 一元线性回归分析一元线性回归分析一、确定性关系一、确定性关系:当当自自变变量量给给定定一一个个值值时时,就就确确定定应应变变量量的的值值与与之
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 第九

限制150内