《方差分析基本原理》PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《方差分析基本原理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《方差分析基本原理》PPT课件.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第二章第二章 方差分析基本原理方差分析基本原理 第一节第一节 方差分析基本原理方差分析基本原理方差分析的基本原理方差分析的基本原理一、模型构造一、模型构造表表 次数次数 水平水平 12jr总平均总平均A1y11y12y1jy1rA2y21y22y2jy2rAiyi1yi2yijyirAaya1ya2yajyar单因素等重复实验的典型数据单因素等重复实验的典型数据我们我们 的兴趣在于检验处理均值的等式;也就是的兴趣在于检验处理均值的等式;也就是至少有一对(至少有一对(i,,j)二、偏差的构造二、偏差的构造为了检验零假设为了检验零假设H0,首先讨论单因素等重复试验的各种偏差,首先讨论单因素等重复
2、试验的各种偏差,有三种偏差:总偏差、条件偏差、试验偏差有三种偏差:总偏差、条件偏差、试验偏差总偏差总偏差条件偏差条件偏差它是由它是由A的不同水平引起的,的不同水平引起的,也也 称组间平方和称组间平方和试验偏差试验偏差它是由各水平内的偏差引它是由各水平内的偏差引起的,也起的,也 称组内平方和称组内平方和利用偏差平方和来作为数据变异性的一个度量,直观看,这是合理的利用偏差平方和来作为数据变异性的一个度量,直观看,这是合理的。但。但在同样在同样 的波动程度下,测定数据越多,偏差平方和就越大,因此仅用偏差的波动程度下,测定数据越多,偏差平方和就越大,因此仅用偏差平方和来反映变异显然不够,还应当考虑测定
3、数据个数的贡献,即要考虑平方和来反映变异显然不够,还应当考虑测定数据个数的贡献,即要考虑测定相对偏差平方和测定相对偏差平方和离均差平方和的分解离均差平方和的分解组间变异组间变异总变异总变异组内变异组内变异 相对偏差平方和相对偏差平方和=偏差平方和偏差平方和偏差平方和的自由度偏差平方和的自由度通常,随机变数的自由度是由数据个数通常,随机变数的自由度是由数据个数n以及数据所受的线性约束方程以及数据所受的线性约束方程个数个数 m所决定的。即当所决定的。即当n个随机变数个随机变数x1,x2,xn,受到且仅受到,受到且仅受到m个独立方程约束时,则这个独立方程约束时,则这 n个数据的平方和的自由度为个数据
4、的平方和的自由度为n-m。所以,总平方和的自由度为:所以,总平方和的自由度为:因素偏差平方和的自由度为:因素偏差平方和的自由度为:误差偏差平方和的自由度为:误差偏差平方和的自由度为:因素均方差因素均方差误差均方差误差均方差随机变量的自由度是由数据个数随机变量的自由度是由数据个数n及数据所受的线性约束方程个数及数据所受的线性约束方程个数 m所决定的。所决定的。当当n个随机变量个随机变量 x1,x2,xn 受到且受到受到且受到m个独立方程约束时,个独立方程约束时,则这则这n 个数据的平方和个数据的平方和 的自由度为的自由度为n-m。a11x1+a12x2 +a1nxn=0a21x1+a22 x2
5、+a2nxn=0 am1x1+am2 x2+amnxn=0 方程组的系数矩阵为方程组的系数矩阵为m举例举例:假定样本有三个数据:假定样本有三个数据:x1=2;x2=4;x3=9,则则当当 确定后,确定后,x1,x2,x3只有两个数值可以自由取值,只有两个数值可以自由取值,比如:比如:x1=6;x2=7,那那 x3 则必然取则必然取 2,而不能取其他值而不能取其他值令令 (i=1,2,n)则:则:由此来看平方和由此来看平方和 的自由度,的自由度,其中:其中:当当 xi 满足关系:满足关系:也即也即 时,数据时,数据 满足且满足下面一个关系式:满足且满足下面一个关系式:因为:因为:可见:可见:平方
6、和平方和 仅受到仅受到 式约束式约束所以平方和所以平方和 的自由度为数据的自由度为数据 的个数的个数 n减去约束方程个数减去约束方程个数1。结论结论:若一组随机变数若一组随机变数 的平均数为的平均数为 则平方和则平方和 的自由度为的自由度为n-1 总平方和总平方和ST的自由度的自由度数据数据 yij共共N=ar个个,它们仅受到它们仅受到 的约束的约束因此其自由度为因此其自由度为 因素因素A偏差平方和偏差平方和SA的自由度的自由度因此其自由度为因此其自由度为a个数据个数据 与与 有关系有关系 误差平方和误差平方和Se的自由度的自由度所以所以,误差平方和误差平方和Se的自由度为数据的自由度为数据y
7、ij的个数的个数ar减去约束方程个数减去约束方程个数 a因此其自由度为因此其自由度为三个自由度有如下关系三个自由度有如下关系假设有假设有a个独立的样本:个独立的样本:Y1:y11 y12 y1j y1rY2:y21 y22 y2j y2r Ya:ya1 ya2 yaj yar 它们分别来自具有它们分别来自具有相同方差相同方差 的的a个个正态总体正态总体:、如果原假设成立的话,如果原假设成立的话,H0:那么就意味着这那么就意味着这 a个正态总体不但方差相同,均值也相等。从这个正态总体不但方差相同,均值也相等。从这a个个完全相同的正态总体中各抽取一个容量为完全相同的正态总体中各抽取一个容量为r的样
8、本,就相当于从一个的样本,就相当于从一个正态总体正态总体 中分别抽取了中分别抽取了a个样本个样本 由数理统计无偏估计理论,由数理统计无偏估计理论,1.抽自正态总体抽自正态总体 的样本的样本 x1,x2,xr无偏方差无偏方差是总体方差是总体方差 的无偏估计,也即的无偏估计,也即结论结论2.来自同一正态总体来自同一正态总体 的的a个容量为个容量为r的样本均值的样本均值 服从于正态分布服从于正态分布 根据以上根据以上1、2两点知识,我们知道:若两点知识,我们知道:若Y1,Y2,,Ya是来自正是来自正态总体态总体 的的a个样本,则个样本,则a 个样本的均值个样本的均值y1,y2,,ya也就服从正态总体
9、也就服从正态总体 。又注意到。又注意到y1,y2,,ya的均值为的均值为 进而又有进而又有y1,y2,,ya的无偏方差的无偏方差 ,是正态总体,是正态总体 的方差的方差 的无偏估计的无偏估计亦即亦即上式括号中上式括号中 恰是因素均方差恰是因素均方差 结论:在原假设结论:在原假设 H0 成立的前提下,统计量成立的前提下,统计量 是总体是总体 的无偏估计量的无偏估计量子样子样 的无偏方差的无偏方差 是是 的的无偏估计无偏估计 即即 不难证明,误差均方差不难证明,误差均方差 也是总体方差也是总体方差 的无偏估的无偏估计量,事实上由计量,事实上由 ,及,及 均值为均值为 yi上式两边关于上式两边关于i
10、求和,得求和,得亦即亦即括号中便是括号中便是结论:误差均方差是总体方差结论:误差均方差是总体方差 的无偏估计的无偏估计三、三、F统计量的构造统计量的构造由以上分析知,在原假设成立的前提下,由以上分析知,在原假设成立的前提下,因素均方差因素均方差误差均方差误差均方差这清楚地表明,检验处理均值之间有没有差异,这一假设可以代之以这清楚地表明,检验处理均值之间有没有差异,这一假设可以代之以比较因素比较因素均方差和误差均方差来实现。均方差和误差均方差来实现。很接近于很接近于1如果因素均方差比误差均方差大得很多,即如果因素均方差比误差均方差大得很多,即 F 值比值比“1”大得多,大得多,则与原假设相矛盾。
11、则与原假设相矛盾。四、四、F 统计量的分布统计量的分布关于数理统计中关于数理统计中 分布的定义可知:当分布的定义可知:当 是来是来自正态总体自正态总体 的一个子样时,有的一个子样时,有那么如果当原假设那么如果当原假设 是正确的,由是正确的,由 分布的定义及性质,就有分布的定义及性质,就有 分布具有可加性分布具有可加性,+若若 ,且独立且独立,则则因此因此由于由于综上结论,由综上结论,由F分布定义可知:分布定义可知:设随机变量设随机变量Y与与Z相互独立相互独立,且且Y和和Z分别服从自由度分别服从自由度为为m和和n 的的 分布分布,则随机变量则随机变量X有如下表达式有如下表达式:则称则称X服从第一
12、自由度为服从第一自由度为m,第二自由度为第二自由度为n 的的F分布分布,记为记为XF(m,n)F F F(1,10)1,10)(5,10)(5,10)(10,10(10,10)由此得由此得:四、四、F统计量的检验统计量的检验对于给定的检验显著性水平对于给定的检验显著性水平a,FFa=a当一次检验中给出现当一次检验中给出现 FFa。这一小概率事件时这一小概率事件时,有理有理由拒绝原假设由拒绝原假设H0,即否定不同条件下的总体即否定不同条件下的总体,其均值完其均值完全相同的假设全相同的假设,认为因素的效应显著认为因素的效应显著,不同条件下的均不同条件下的均值有明显不同。反之若值有明显不同。反之若
13、FFa,接受原假设,接受原假设H0,即认即认为不同条件下的总体为不同条件下的总体,其均值没有明显的变化,认为因其均值没有明显的变化,认为因素的效应不够显著。素的效应不够显著。方差分析是一种检验同方差的若干个正态总体的均值是方差分析是一种检验同方差的若干个正态总体的均值是否相等的统计分析方法。同时也可说明属性变量对数值否相等的统计分析方法。同时也可说明属性变量对数值型数据产生显著影响的统计分析方法型数据产生显著影响的统计分析方法.五、偏差平方和的简化计算五、偏差平方和的简化计算总偏差总偏差令令则则条件偏差条件偏差同理实验偏差同理实验偏差则则若等重复实验若等重复实验vv【2.12.1】:测试一种合
14、成纤维的抗拉强度测试一种合成纤维的抗拉强度工程师根据以往的经验知道,纤维的抗拉强度受棉花在纤维中所占的比工程师根据以往的经验知道,纤维的抗拉强度受棉花在纤维中所占的比例大小影响例大小影响,若已知含棉量在若已知含棉量在10%-40%之间为允许取值范围之间为允许取值范围,因此工程因此工程师决定检验棉花百分率为五个水平的样本师决定检验棉花百分率为五个水平的样本,分别是分别是15%,20%,25%,30%,35%,对每个水平进行五次实验。测试结果如下对每个水平进行五次实验。测试结果如下:实验号实验号棉花百分率(棉花百分率(%)12345平均值平均值1577151199.820121712181815.
15、425141818191917.630192522192321.63571011151110.815.04抗拉强度实验数据抗拉强度实验数据(ib/in2)五个水平含棉量其所得抗拉强度实验数据五个水平含棉量其所得抗拉强度实验数据(ib/in2)是否存在显著差异是否存在显著差异?棉花含棉花含棉量方差分析结论棉量方差分析结论.xls查查:Fa得得:FFa否定:否定:H0,肯定,肯定 H1,即:含棉量对即:含棉量对抗拉强度产生显著影响抗拉强度产生显著影响当时当时 第二节第二节 对于方差分析的几点说明对于方差分析的几点说明一、方差分析的一、方差分析的 基本假定条件基本假定条件基本假定:基本假定:检测方差
16、齐性检测方差齐性的基本方法的基本方法残差图:残差图:残差直方图、残差的残差直方图、残差的 正态概率图正态概率图齐性检验齐性检验:巴特莱法、极差比值法、平均极差法巴特莱法、极差比值法、平均极差法 levene检测检测1.正态性正态性:子样来自子样来自a个正态总体个正态总体2.方差齐性方差齐性:a个正态总体方差相等个正态总体方差相等,即即:巴特莱法巴特莱法当随机样本来自独立的正太总体时,统计量当随机样本来自独立的正太总体时,统计量 抽样分布渐近于自由度为抽样分布渐近于自由度为a-1的卡方分布的卡方分布S2PS2iSi是第是第i个总体的样本方差个总体的样本方差,ri 为样本容量为样本容量(或实验重复
17、数)或实验重复数)当所有样本方差相等时,当所有样本方差相等时,q=0,当样本方差有较大差异时,当样本方差有较大差异时,q较大。因此当较大。因此当 的值太大时,否定的值太大时,否定H0;即当;即当否定否定H0为误差均方差为误差均方差实例分析实例分析已知已知:检验统计量是检验统计量是:取显著水平取显著水平 a=0.05肯定肯定H0假设假设,即以即以95%的概率保证认为五个方差相的概率保证认为五个方差相同同极差比值法极差比值法步骤步骤:1 首先对每种实验条件下的重复数据求极差首先对每种实验条件下的重复数据求极差Ri(i=1,2,n)从从 各极差各极差Ri 中确定最大极差中确定最大极差R max与最小
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析基本原理 方差分析 基本原理 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内