《数理统计CH6方差分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《数理统计CH6方差分析ppt课件.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计CH6方差分析ppt课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望 按p 决策规则,检验两总体两总体均值差假设犯第一类错误的概率不大于,即:两总体两总体均值差假设6 方差分析(1)两独立正态总体均值相等检验 犯第一类错误的概率11/13/20222王玉顺:数理统计06_方差分析6 方差分析 按p 决策规则,检验两总体两总体均值差假设不犯第一类错误的概率不小于1-1-,即:(1)两独立正态总体均值相等检验 犯第一类错误的概率11/13/20223王玉顺
2、:数理统计06_方差分析 三个三个独立正态总体均值相等假设等价于三个均值差假设同时成立:6 方差分析(2)三个独立正态总体均值相等检验 犯第一类错误的概率11/13/20224王玉顺:数理统计06_方差分析 每个均值差t检验犯第一类错误的概率记作,三个独立正态总体均值相等检验犯第一类错误的概率记作p,若按 决策,则p值仍是不大于 吗?6 方差分析(2)三个独立正态总体均值相等检验 犯第一类错误的概率11/13/20225王玉顺:数理统计06_方差分析 三个独立正态总体均值相等检验,犯第一类错误的概率等于三个均值差原假设至少一个被错误否定的概率,即:P(否定H0|H0真)=P(H0被错误否定)=
3、P(H01,H02,H03至少一个被错误否定)=P(H01,H02,H03恰好一个被错误否定)+P(H01,H02,H03恰好两个被错误否定)+P(H01,H02,H03三个均被错误否定)6 方差分析(2)三个独立正态总体均值相等检验 犯第一类错误的概率11/13/20226王玉顺:数理统计06_方差分析做三次均值差t检验被视作三次独立重复的贝努利试验,每一次试验犯第一类错误的概率为,不犯第一类错误的概率为1-,则6 方差分析(2)三个独立正态总体均值相等检验 犯第一类错误的概率11/13/20227王玉顺:数理统计06_方差分析 应用二项式定理,三个独立正态总体均值相等检验犯第一类错误的概率
4、计算如下:6 方差分析(2)三个独立正态总体均值相等检验 犯第一类错误的概率按决策11/13/20228王玉顺:数理统计06_方差分析 同理,a个独立正态总体均值相等假设等价于m个均值差假设同时成立:6 方差分析(3)多个独立正态总体均值相等检验 犯第一类错误的概率11/13/20229王玉顺:数理统计06_方差分析 应用二项式定理,a个独立正态总体均值相等检验犯第一类错误的概率如下:6 方差分析(3)多个独立正态总体均值相等检验 犯第一类错误的概率按决策11/13/202210王玉顺:数理统计06_方差分析 换一个思路,a个独立正态总体均值相等检验犯第一类错误的概率计算如下:6 方差分析(3
5、)多个独立正态总体均值相等检验 犯第一类错误的概率11/13/202211王玉顺:数理统计06_方差分析对于a个独立正态总体的均值相等假设若采用m次均值差t检验,且每次的检验水平定为,则犯第一类错误的最大概率p是:6 方差分析(3)多个独立正态总体均值相等检验 犯第一类错误的概率11/13/202212王玉顺:数理统计06_方差分析6 方差分析(3)多个独立正态总体均值相等检验 犯第一类错误的概率amp0.05330.14260.05460.26490.055100.40130.056150.53670.057210.659411/13/202213王玉顺:数理统计06_方差分析 对于多个独立
6、正态总体,如果我们仅仅关心全部均值是否相同全部均值是否相同或至少一个均值显著与众不同这样的问题,则采用均值差t检验法完成问题的检验存在三个缺限:(1)检验次数较多,效率低;(2)每次检验的t统计量仅仅利用一对样本的信息;(3)检验的均值个数愈多,犯第一类错误的概率愈大。因此,解决问题需要另辟蹊径。6 方差分析(3)多个独立正态总体均值相等检验 犯第一类错误的概率11/13/202214王玉顺:数理统计06_方差分析6 方差分析(4)方差分析法背景1923年,在英国一个农业试验站工作的统计学家 R.A.Fisher发明F分布创立了著名的方差分析(ANOVA)。方差分析首先应用于农业生产并取得丰硕
7、的成果,尔后在其它领域亦得到广泛应用,现已成为统计学的核心方法。经“特别设计”的试验所产生的数据才能采用方差分析,因此数据是有“模式”的。11/13/202215王玉顺:数理统计06_方差分析6 方差分析MSA代表因素效应,MSE代表误差效应,两者之比MSA/MSE遵从F分布,其值愈大H0下发生抽样观测事件FMSA/MSE的概率p就愈小,H0就愈不可能成立。在方差相同条件下按p 决策规则对多个独立正态总体的均值是否相同做F检验,称作方差分析。Analysis of VarianceANOVA(5)什么是方差分析?方差分析检验多总体均值相等假设11/13/202216王玉顺:数理统计06_方差分
8、析6.1 单向分组数据方差分析 方差分析原理 单向分组数据6.2 两向分组数据方差分析 有重复两向分组数据 无重复两向分组数据本章内容本章内容6 方差分析11/13/202217王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析One way analysis of variance6 方差分析11/13/202218王玉顺:数理统计06_方差分析机器机器机器0.2360.2380.2480.2450.2430.2570.2530.2550.2540.2610.2580.2640.2590.2670.262三台机器所加工铝合金板厚度的抽样检测数据问题:检验各机器加工铝合金板厚度的一致性
9、6.1 单向分组数据方差分析(1)案例资料11/13/202219王玉顺:数理统计06_方差分析Levels of AA1A2AaResponsesx11x21xn1,1x12x22xn2,2x1ax2axna,a正态性假设:各个总体均服从正态分布方差齐性假设:各个总体方差相同独立性假设:各个总体的样本相互独立数据模式:方差齐性正态多总体独立样本因素、水平和响应6.1 单向分组数据方差分析(2)数据模式Group or Population11/13/202220王玉顺:数理统计06_方差分析一个一个变量在多个多个水平下分别独立重复试验称作单向分组试验,单向分组试验,属复合随机试验复合随机试验
10、;一个一个变量一个一个水平的试验可获得一个单总体样本,即一个单纯随机试验的样本;单向分组试验获得的全部观测属于多总体样本,合称为单向分组数据单向分组数据,“单向”是指样本数据由一个变量一个变量的不同水平分划归组;数据模式由试验模式或抽样模式决定,故三者在应用上含义相同。6.1 单向分组数据方差分析(2)数据模式试验模式抽样模式数据模式11/13/202221王玉顺:数理统计06_方差分析The statistical model is:(3)单向分组数据统计模型6.1 单向分组数据方差分析11/13/202222王玉顺:数理统计06_方差分析(3)单向分组数据统计模型6.1 单向分组数据方差分
11、析推论效应总和等于011/13/202223王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析(3)单向分组数据统计模型推论样本均值的概率分布11/13/202224王玉顺:数理统计06_方差分析(4)单向分组数据统计假设两种统计假设等价6.1 单向分组数据方差分析关于多个独立正态总体均值的假设:关于多个独立正态总体效应的假设:11/13/202225王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析Let be the hypothesized common mean under H0.We are interested in whether all the groups(p
12、opulations)have exactly the same true means.(H0:所有总体均值相等)The alternative is that some of the groups(populations)differ from the others in their means.(H1:某些总体均值与其余总体不同)If H0 holds,that is,all groups have the same mean and variance.(4)单向分组数据统计假设统计假设的含义11/13/202226王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析(5)效应的分解
13、和估计响应差值xij-被理解为第j水平第i试验的总效应,它是因素第j水平的效应与该水平上第i试验的误差效应之线性叠加:效应分解式11/13/202227王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析一个处理的效应=误差效应+因素效应(5)效应的分解和估计11/13/202228王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析(6)Partition of Sums of Squares 平方和分解11/13/202229王玉顺:数理统计06_方差分析+=+SST=SSESSACorrected Total Sum of SquaresModel Sum of Square
14、sError Sum of SquaresSST measures variability of the overall mean6.1 单向分组数据方差分析(6)Partition of Sums of Squares 平方和分解11/13/202230王玉顺:数理统计06_方差分析(7)计算校正总平方和SST及自由度Corrected Total Sums of Squares6.1 单向分组数据方差分析SST的的算法11/13/202231王玉顺:数理统计06_方差分析(8)讨论SST及总和均方MST6.1 单向分组数据方差分析11/13/202232王玉顺:数理统计06_方差分析Err
15、or Sum of Squares6.1 单向分组数据方差分析(9)计算误差平方和SSE及自由度SSE的的算法11/13/202233王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析(10)讨论SSE及误差均方MSESSE是a个样本方差的加权和11/13/202234王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析误差均方MSE本质上是样本的合并方差,即a个样本的加权平均方差(10)讨论SSE及误差均方MSE11/13/202235王玉顺:数理统计06_方差分析无论H0是否成立MSE总是2的无偏估计6.1 单向分组数据方差分析(10)讨论SSE及误差均方MSE11/13/2
16、02236王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析SSE/2无条件服从自由度dfE=n-a的卡方分布(10)讨论SSE及误差均方MSE11/13/202237王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析(11)计算因素A平方和SSA及自由度SSA的的算法11/13/202238王玉顺:数理统计06_方差分析6.1 单向分组数据方差分析(12)讨论SSA及因素均方MSA因素A平方和SSAModel Sum of Squares11/13/202239王玉顺:数理统计06_方差分析因素A平方和的期望6.1 单向分组数据方差分析(12)讨论SSA及因素均方MSA11/
17、13/202240王玉顺:数理统计06_方差分析因素A平方和的期望6.1 单向分组数据方差分析(12)讨论SSA及因素均方MSA11/13/202241王玉顺:数理统计06_方差分析均方MSA的期望6.1 单向分组数据方差分析H0下均方MSA是2的无偏估计(12)讨论SSA及因素均方MSA11/13/202242王玉顺:数理统计06_方差分析SSA的分布6.1 单向分组数据方差分析H0下SSA/2服从自由度dfA=a-1的卡方分布,证明参见cochran定理(12)讨论SSA及因素均方MSA11/13/202243王玉顺:数理统计06_方差分析MSA/MSE的期望6.1 单向分组数据方差分析(
18、13)均方比MSA/MSE及其分布条件期望11/13/202244王玉顺:数理统计06_方差分析Now we have two estimates of s s2,within and between means.An F-test can be used to determine if the two statistics are equal.The F-statistic is written as:6.1 单向分组数据方差分析MSA/MSE的分布根据F分布定义,H0下均方比MSA/MSE服从F分布,故H0下MSA/MSE是F统计量(13)均方比MSA/MSE及其分布11/13/20224
19、5王玉顺:数理统计06_方差分析If H0 holds,the computed F-statistics should be close to 1.If H1 holds,the computed F-statistic should be much greater than 1.We use the appropriate critical value from the F-table to help make this decision.Hence,the F-test is really a test of equality of means under the assumption
20、of normal populations and homogeneous variances.6.1 单向分组数据方差分析MSA/MSE的特性(13)均方比MSA/MSE及其分布11/13/202246王玉顺:数理统计06_方差分析问题归结为均方比的右方F检验决策规则:p否定H0p接受H0(14)F-test method6.1 单向分组数据方差分析11/13/202247王玉顺:数理统计06_方差分析SourceSSdfMSF valuePrFFactor AErrorSSASSEa1naSSA/(a1)SSE/(n a)MSA/MSEpTotalSST n1单向分组数据方差分析表验算平方
21、和与自由度 计算抽样观测概率p6.1 单向分组数据方差分析(14)F-test methodp值决策右方F检验法11/13/202248王玉顺:数理统计06_方差分析SourceSSdfMSF valueF(dfA,dfE)Factor AErrorSSASSEa1naSSA/(a1)SSE/(n a)MSA/MSETotalSST n1单向分组数据方差分析表验算平方和与自由度导出拒绝域WF6.1 单向分组数据方差分析(14)F-test method拒绝域决策右方F检验法11/13/202249王玉顺:数理统计06_方差分析(15)平方和算法汇总组和平方总平方和总和计算平方和及自由度6.1
22、单向分组数据方差分析11/13/202250王玉顺:数理统计06_方差分析机器机器机器0.2360.2380.2480.2450.2430.2570.2530.2550.2540.2610.2580.2640.2590.2670.262n=151.211.281.31T=3.80.29282 0.32768 0.34322A=0.963720.292918 0.32772 0.343274 R=0.963912(16)方差分析案例一数据预处理的表格算法6.1 单向分组数据方差分析11/13/202251王玉顺:数理统计06_方差分析dfE=n-a=15-3=12dfA=a-1=3-1=2dfT
23、=n-1=15-1=14CR=T2/n=3.82/15=0.962667SST=R-CR=0.963912-0.962667=0.001245SSE=R-A=0.963912-0.963720=0.000192SSA=A-CR=0.96372-0962667=0.0010536.1 单向分组数据方差分析(16)方差分析案例一11/13/202252王玉顺:数理统计06_方差分析SourceSSdfMSF valuePrFFactor AError0.0010530.0001922120.00052650.00001632.911.3452E-5Total0.001245 14三台机器加工铝合金
24、板厚度的方差分析表6.1 单向分组数据方差分析(16)方差分析案例一p值决策法11/13/202253王玉顺:数理统计06_方差分析 因p=1.3452E-55.0E-5,故可在0.05水平上亦可在0.00005水平上否定零假设H0。方差分析结果表明,0.05水平上或0.00005水平上认定三种机器加工出的铝合金板厚度存在显著或极其显著的差异。6.1 单向分组数据方差分析(16)方差分析案例一p值决策法决策结论11/13/202254王玉顺:数理统计06_方差分析SourceSSdfMSF valueF0.05(2,12)Factor AError0.0010530.0001922120.00
25、052650.00001632.913.8853Total0.001245 14三台机器加工铝合金板厚度的方差分析表6.1 单向分组数据方差分析(16)方差分析案例一拒绝域决策法11/13/202255王玉顺:数理统计06_方差分析 因MSA/MSE=32.913.8853,故在0.05水平上否定零假设H0。方差分析结果表明,0.05水平上认定三种机器加工出的铝合金板厚度存在显著差异。6.1 单向分组数据方差分析(16)方差分析案例一拒绝域决策法决策结论11/13/202256王玉顺:数理统计06_方差分析案例 四种计算器电路响应时间的抽样检测类型类型类型类型19222018152021332
26、7401615182617182219问题:各类型电路的响应时间是否相同?6.1 单向分组数据方差分析案例资料(17)方差分析案例二11/13/202257王玉顺:数理统计06_方差分析类型类型 类型 类型192220181520213327401615182617182219n=18941419259T=3861767.2 3976.2 1692.8 1160.3A=8596.51794425917701169R=8992数据的表格算法6.1 单向分组数据方差分析(17)方差分析案例二11/13/202258王玉顺:数理统计06_方差分析dfE=n-a=18-4=14dfA=a-1=4-1=
27、3dfT=n-1=18-1=17CR=T2/n=3862/18=8277.5556SST=R-CR=8992-8277.5556=714.4444SSE=R-A=8992-8596.5=395.5SSA=A-CR=8596.5-8277.5556=318.9444计算平方和及自由度6.1 单向分组数据方差分析(17)方差分析案例二11/13/202259王玉顺:数理统计06_方差分析四种计算器电路响应时间的方差分析表SourceSSdfMSF valuePrFFactor AError318.9444395.5314106.314828.253.76340.0359Total714.4444 176.1 单向分组数据方差分析(17)方差分析案例二p值决策法11/13/202260王玉顺:数理统计06_方差分析 因p=0.03593.3439,故0.05水平上否定零假设H0。方差分析结果表明,四种计算器电路的响应时间存在显著差异。决策结论6.1 单向分组数据方差分析(17)方差分析案例二拒绝域决策法11/13/202263王玉顺:数理统计06_方差分析结束结束11/13/202264王玉顺:数理统计06_方差分析
限制150内