《华南农业大学精品课程申报.ppt》由会员分享,可在线阅读,更多相关《华南农业大学精品课程申报.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 在工农业生产和科研活动中,我们经常遇到这在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,然后对测试结对产量有显著影响,就要先做试验,然后对测试结果进行分析,作出判断。方差分析就是分析测试结果进行分析,作出判断。方差分析就是分析测试结果的一种方法。果的一种方法。引引 言言基基 本本 概概 念念 试验试验指标指标
2、试验结果。试验结果。可控可控因素因素在影响试验结果的众多因素中,可人为在影响试验结果的众多因素中,可人为 控制的因素。控制的因素。水平水平可控因素所处的各种各种不同的状态。每个可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。水平又称为试验的一个处理。单因素试验单因素试验如果在一项试验中只有一个因素改变,如果在一项试验中只有一个因素改变,其它的可控因素不变,则该类试验称为其它的可控因素不变,则该类试验称为 单因素试验。单因素试验。引例引例 例例1(灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯(灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中
3、作随机抽样,测量其使用寿丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下:命(单位:小时),数据如下:灯泡灯泡寿命寿命灯丝灯丝12345678甲甲1600 1610 1650 1680 1700 1720 1800乙乙1580 1640 1640 1700 1750丙丙1460 1550 1600 1620 1640 1740 1660 1820丁丁1510 1520 1530 1570 1680 1600灯泡的使用寿命灯泡的使用寿命试验指标试验指标 灯丝的配料方案灯丝的配料方案试验因素试验因素(唯一的一个)(唯一的一个)四种配料方案(甲乙丙丁)四种配料方案(甲
4、乙丙丁)四个水平四个水平 因此,本例是一个因此,本例是一个四水平的单因素试验四水平的单因素试验。引引 例例 用用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为分别表示四种灯泡的使用寿命,即为四个总体。假设四个总体。假设X1,X2,X3,X4相互独立,且服从方差相互独立,且服从方差相同的正态分布,即相同的正态分布,即XiN(i,2)()(i=1,2,3,4)本例问题归结为检验假设本例问题归结为检验假设 H0:1=2=3=4 是否成立是否成立 我们的目的是通过试验数据来判断因素我们的目的是通过试验数据来判断因素 A 的不的不同水平对试验指标是否有影响。同水平对试验指标是否有影响。设设 A
5、表示欲考察的因素,它的表示欲考察的因素,它的 个不同水平,对个不同水平,对应的指标视作应的指标视作 个总体个总体 每个水平下每个水平下,我我们作若干次重复试验:们作若干次重复试验:(可等重复也可不(可等重复也可不等重复),同一水平的等重复),同一水平的 个结果,就是这个总体个结果,就是这个总体 的一个样本:的一个样本:单因素试验的方差分析单因素试验的方差分析因此,因此,相互独立,且与相互独立,且与 同分布。同分布。单因素试验资料表单因素试验资料表其中诸其中诸 可以不一样,可以不一样,水平水平重复重复 1.ni(水平组内平均值)(水平组内平均值)(总平均值)(总平均值)试验结果试验结果 纵向个体
6、间的差异称为纵向个体间的差异称为随机误差(组内差异),随机误差(组内差异),由试验造由试验造成;横向个体间的差异称为成;横向个体间的差异称为系统误差(组间差异),系统误差(组间差异),由因素的由因素的不同水平造成。不同水平造成。品种品种重复重复123例:五个水稻品种单位产量的观测值例:五个水稻品种单位产量的观测值P165 由于同一水平下重复试验的个体差异是随机误差,由于同一水平下重复试验的个体差异是随机误差,所以设:所以设:其中其中 为试验误差,相互独立且服从正态分布为试验误差,相互独立且服从正态分布线性统计模型线性统计模型 单因素试验的方差分析的数学模型单因素试验的方差分析的数学模型具有具有
7、方差齐性。方差齐性。相互独立,从而各子样也相互独立。相互独立,从而各子样也相互独立。首先,我们作如下假设:首先,我们作如下假设:即即 令令 (其中(其中 )称为)称为一般平均值一般平均值。称为因素称为因素A的的第第 个水平个水平 的效应的效应。则则线性统计模型线性统计模型变成变成于是检验假设:于是检验假设:等价于检验假设:等价于检验假设:显然有:显然有:整个试验的均值整个试验的均值 考察统计量考察统计量经恒等变形,可分解为:经恒等变形,可分解为:其中其中组间平方和(系组间平方和(系统离差平方和)统离差平方和)反映的是各水平平均值偏离总平均值的偏离程度。反映的是各水平平均值偏离总平均值的偏离程度
8、。如果如果H0 成立,则成立,则SSA 较小。较小。若若H0成立,则成立,则总离差平方和总离差平方和 见书见书P168 其中其中 组内平方和组内平方和误差平方和误差平方和这里这里反映的是重复试验种随机误差的大小。反映的是重复试验种随机误差的大小。表示水平表示水平Ai的随机误差;的随机误差;表示整个试验的随机误差表示整个试验的随机误差若假设若假设 成立,则成立,则 由由P106定理定理5.1可推得:可推得:将将 的自由度分别记作的自由度分别记作则则(记(记 ,称作均方和),称作均方和)(各子样同分布)(各子样同分布)则则(记(记 ,称作均方和),称作均方和)对给定的检验水平对给定的检验水平 ,由
9、,由得得H0 的拒绝域为:的拒绝域为:F 单侧检验单侧检验 结论:结论:方差分析方差分析实质上实质上是假设检验是假设检验,从分析离差,从分析离差平方和入手,找到平方和入手,找到F统计量统计量,对对同方差同方差的多个正态总体的多个正态总体的均值是否相等进行假设检验的均值是否相等进行假设检验。单因素试验中两个水。单因素试验中两个水平的均值检验可用第七章的平的均值检验可用第七章的T检验法。检验法。思考:为什么此处只做单侧检验?思考:为什么此处只做单侧检验?(1)若若 ,则称因素的,则称因素的差异极显著差异极显著(极有极有统计意统计意义),或称因素义),或称因素A的影响的影响高度显著高度显著,这时作标
10、记,这时作标记 ;约约 定定 (2)若)若 ,则称因素的,则称因素的差异显著差异显著(差异(差异有有统计意义),或称因素统计意义),或称因素A的的影响显著影响显著,作标记,作标记 ;(3)若)若 ,则称因素,则称因素A有一定影响有一定影响,作,作标记标记();(4)若)若 ,则称因素,则称因素A无显著影响(差异无显著影响(差异无无统计意义)。统计意义)。注意注意:在方差分析表中,习惯于作如下规定:在方差分析表中,习惯于作如下规定:单因素试验方差分析表单因素试验方差分析表方差来源方差来源组间组间组内组内总和总和平方和平方和 自由度自由度均方和均方和F 值值F 值临介值值临介值简便计算公式:简便计
11、算公式:其中其中同一水平同一水平下观测值下观测值之和之和 所以观测所以观测值之和值之和 例例2 P195 2 以以 A、B、C 三种饲料喂猪,得一个月后每猪三种饲料喂猪,得一个月后每猪所增体重(单位:所增体重(单位:500g)于下表,试作方差分析。)于下表,试作方差分析。饲料饲料ABC增重增重51 40 43 4823 25 2623 28解解:解:解:不同的饲料对猪的体重的影响不同的饲料对猪的体重的影响极有统计意义极有统计意义。列方差分析表列方差分析表方差来源方差来源组间组间组内组内总和总和平方和平方和 自由度自由度均方和均方和F 值值F 值临介值值临介值例例2的上机实现步骤的上机实现步骤1、输入原始数据列,并存到、输入原始数据列,并存到A,B,C列;列;各水平数据放同一列各水平数据放同一列各水平数据放在不同列各水平数据放在不同列2、选择、选择StatANOVAone-way(unstacked)不同的饲料对猪的体重的影响极有统计意义。不同的饲料对猪的体重的影响极有统计意义。定理定理 在单因素方差分析模型中,有在单因素方差分析模型中,有 如果如果H0不成立不成立,则,则 所以,所以,即即H0不成立不成立时,时,有大于有大于1的趋势。的趋势。所以所以H0为真时的小概率事件应取在为真时的小概率事件应取在F值较大的一侧。值较大的一侧。
限制150内