《SAS-统计软件课件--第七章-嵌套-裂区方差分析解析.ppt》由会员分享,可在线阅读,更多相关《SAS-统计软件课件--第七章-嵌套-裂区方差分析解析.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 嵌套设计又被称为巢式设计(嵌套设计又被称为巢式设计(nested design)、系统分组设计、系统分组设计(hierarchal classification) 或组内又或组内又分亚组的设计。分亚组的设计。 根据因素数的不同,嵌套设计根据因素数的不同,嵌套设计可分为二级嵌套(二因素)、三级可分为二级嵌套(二因素)、三级嵌套(三因素)等套设计。嵌套(三因素)等套设计。 一、嵌套设计的方差分析 将全部将全部k个因素按主次排列,依次个因素按主次排列,依次称为称为1级,级,2级级 k级因素,再将总离级因素,再将总离差平和及自由度进行分解,其基本思想差平和及自由度进行分解,其基本思想与一般方差分析相
2、同。与一般方差分析相同。 所不同的是分解法有明显的区别,所不同的是分解法有明显的区别,它侧重于主要因素,并且,第它侧重于主要因素,并且,第i级因素级因素的显著与否,是用第的显著与否,是用第i级与第级与第i+1级因素级因素的均方分别做为分子和分母来构造的均方分别做为分子和分母来构造F统统计量,并以计量,并以F检验为其理论根据的。检验为其理论根据的。嵌套设计的方差分析(1)情形一情形一 受试对象本身具有按其隶属关系进行受试对象本身具有按其隶属关系进行分组再分组的各种因素。分组再分组的各种因素。(2)情形二情形二 受试对象本身并非具有分组再分组的受试对象本身并非具有分组再分组的各种分组因素,而是各之
3、间在专业上有主各种分组因素,而是各之间在专业上有主次之分。区分嵌套设计与析因设计的关键次之分。区分嵌套设计与析因设计的关键是看因素之间的地位是否平等,因素的地是看因素之间的地位是否平等,因素的地位平等则属于析因设计,不平等则属于嵌位平等则属于析因设计,不平等则属于嵌套设计。套设计。 嵌套设计应用例例1(嵌套关系)(嵌套关系):选取某种植物选取某种植物3个品种个品种(A) 的植株的植株,在每一株内选取在每一株内选取2片叶子片叶子(B) ,用取样,用取样器从每一片叶子上选取同样大小的两块(重复器从每一片叶子上选取同样大小的两块(重复)进行检测。)进行检测。 不能把不能把B因素的因素的2个水平简单地
4、看作是与个水平简单地看作是与A因素因素3个水平的全面组合,而是分别嵌套在个水平的全面组合,而是分别嵌套在A1、A2、A3三个水平之下,相当于三个水平之下,相当于B因素有因素有6个个水平,但它们所产生的离差平方和中又包含了水平,但它们所产生的离差平方和中又包含了A因素的作用,一般来说,因素的作用,一般来说, 用它作为度量用它作为度量A因因素作用大小的误差项,是严格考核素作用大小的误差项,是严格考核A因素的一因素的一种措施。种措施。 嵌套设计举例1例例2(因素分主次)(因素分主次):为了研究某种抗菌药为了研究某种抗菌药的效果,考虑的效果,考虑3个因素对小白鼠进行试验。因个因素对小白鼠进行试验。因素
5、素A可分为可分为A1(对照组不用抗菌药对照组不用抗菌药)、A2(试验组试验组用抗菌药用抗菌药);因素;因素B(小白鼠代次小白鼠代次)可分为可分为B1(第第1代代)、B2(第第2代代)、B3(第第3代代);因素;因素C(性别性别)可分可分为为C1(雄性雄性)、C2(雌性雌性)。让第。让第1代小白鼠被这种代小白鼠被这种细菌感染,按雌雄分别统计对照组和试验组小细菌感染,按雌雄分别统计对照组和试验组小白鼠的存活率,对于第白鼠的存活率,对于第2代、第代、第2代重复上面的代重复上面的试验,试验, 观测小白鼠存活率。由专业知识观测小白鼠存活率。由专业知识得知:得知:3因素的主次顺序为因素的主次顺序为ABC。
6、 嵌套设计举例2二级嵌套的方差分析表二级嵌套的方差分析表 嵌套设计分析表变异来源变异来源自由度自由度平方和平方和均方均方F值值ProbFAdf1=a-1SS1=Q1-CMS1=SS1/df1MS1/MS2 B(A)df2=a(b-1)SS2=Q2-Q1MS2=SS2/df2MS2/MSe Edfe=(n-1)abSSe=W-Q2MSe=SSe/dfe 总和总和dfT=nab-1SSt=W-C A因素有因素有a个水平,个水平,B因素有因素有b个水平,重复个水平,重复n次,总样本含量次,总样本含量为为nab,全部数据之总和为全部数据之总和为T,全部数据之平方和为全部数据之平方和为W,校正数校正数为
7、为C=T2/nab,Qi为系统分组分到第为系统分组分到第i级因素时,各小组数据之级因素时,各小组数据之和的平方均值的和。和的平方均值的和。 W= C= Q1= Q2= 2ijkxnabT2nb12.iTn12. ijT注意:注意: 由于在嵌套设计中,两个因素之间由于在嵌套设计中,两个因素之间不能自由交错地组成各种处理组合,因不能自由交错地组成各种处理组合,因而,不能考察因素之间地交互作用。所而,不能考察因素之间地交互作用。所以,凡是交互作用比较重要的试验,都以,凡是交互作用比较重要的试验,都不应采用这种设计。不应采用这种设计。 嵌套设计注意事项 进行嵌套设计的方差分析的过程:进行嵌套设计的方差
8、分析的过程:nested、anova或或GLM,1、过程过程nested过过程更简单一些,但它受数据中读取分组变程更简单一些,但它受数据中读取分组变量先后顺序的影响很大,应先用量先后顺序的影响很大,应先用Sort过程过程按因素重要程度进行排序整理;按因素重要程度进行排序整理;2、过程、过程anova或或GLM不需要排序整理,且容易进不需要排序整理,且容易进行均值比较。行均值比较。 平衡资料用过程平衡资料用过程nested、anova或或GLM三种过程做结果是一样的;若不是平衡资三种过程做结果是一样的;若不是平衡资料,须用过程料,须用过程GLM。 嵌套设计分析的sas实现例例1的的SAS程序程序
9、Data Nested; Input plant $ leaf wt ;Cards;a 1 12.1 a 1 12.1 b 1 14.4 b 1 14.4 c 1 23.1 c 1 23.4a 2 12.8 a 2 12.8 b 2 14.7 b 2 14.5 c 2 28.1 c 2 28.8;例1Sas程序过程步过程步 NestedProc Sort;By plant leaf;Run;Proc Nested;Class plant leaf;Var wt;Run;例1Sas程序过程步过程步 Anova/GLMProc Anova;Class plant leaf ;Model wt =
10、plant leaf(plant);Test H = plant E = leaf(plant);Means plant / Duncan E = leaf(plant);Run;例1Sas程序 裂区设计与两因素随机区组设计近似,但是裂区设计与两因素随机区组设计近似,但是两者不一样的。两者不一样的。 不同点之一是后者在每一区组内不同点之一是后者在每一区组内A、B两因两因素的素的ab次处理是完全随机化的。而裂区设计的次处理是完全随机化的。而裂区设计的每一区组内每一区组内A因素先分为因素先分为a个处理,在每一处理个处理,在每一处理内内B因素再分为因素再分为b个处理。随机化过程只能在个处理。随机化过
11、程只能在A因素的因素的a个处理和个处理和B因素的因素的b个处理之间进行。个处理之间进行。由由A因素所划分的因素所划分的A个部分称为主区或整区,每个部分称为主区或整区,每一主区再划分的一主区再划分的b个部分称为裂区或副区。个部分称为裂区或副区。二、裂区设计的方差分析 不同点之二是方差分析计算时不同点之二是方差分析计算时F值时误差值时误差项的选择,裂区设计方差分析时有两个误差项项的选择,裂区设计方差分析时有两个误差项,区组和整区是同一个误差,而裂区和交互作,区组和整区是同一个误差,而裂区和交互作用则用另一个误差项,而二因素随机区组设计用则用另一个误差项,而二因素随机区组设计方差分析时用一个误差项。
12、方差分析时用一个误差项。 裂区设计的方差分析 进行裂区试验设计时首先要分清主要因子进行裂区试验设计时首先要分清主要因子和次要因子,主要因子是想要获得较高精确度和次要因子,主要因子是想要获得较高精确度的因子,次要因子是精确度可以低些的因子。的因子,次要因子是精确度可以低些的因子。 主要因子的各个水平随机安排在裂区,次主要因子的各个水平随机安排在裂区,次要因子的各个水平随机安排在整区,只有这样要因子的各个水平随机安排在整区,只有这样,主要因子的各水平的重复数才会大大的多于,主要因子的各水平的重复数才会大大的多于次要因子的各个水平的重复数,才能获得较高次要因子的各个水平的重复数,才能获得较高的精确度
13、。的精确度。 裂区设计的原则适用范围:适用范围:复因子试验中,两个因子要求的精确度复因子试验中,两个因子要求的精确度不一时,可用裂区设计。不一时,可用裂区设计。各个因子的各个水平需要的面积大小不各个因子的各个水平需要的面积大小不一时,亦可用裂区设计。一时,亦可用裂区设计。在原有的试验的基础上,临时加入一个在原有的试验的基础上,临时加入一个研究因子时,可用裂区设计。研究因子时,可用裂区设计。适用范围 优点:优点: 某个因子可获得较高的精确度。某个因子可获得较高的精确度。能利用原有的试验地及试验材料,进行深能利用原有的试验地及试验材料,进行深一步的研究。一步的研究。缺点:缺点:资料的统计分析比较复
14、杂,不易掌握。资料的统计分析比较复杂,不易掌握。次要因子的精确度较低。次要因子的精确度较低。 优缺点 以两个因素的裂区设计进行方差分析:设有以两个因素的裂区设计进行方差分析:设有A、B两个试验因素,两个试验因素,A因素有因素有a个水平,安排个水平,安排在整区,在整区,B因素有因素有b个水平,安排在裂区,整个水平,安排在裂区,整个试验有个试验有n个重复区组。个重复区组。 总变异分解为整区部分和裂区部分,整区总变异分解为整区部分和裂区部分,整区部分总平方和(部分总平方和(SS1)可分解为区组平方和(可分解为区组平方和(SSr)、)、A因素水平间平方和(因素水平间平方和(SSA)和整区误和整区误差平
15、方和(差平方和(SSeA););裂区部分分解为裂区部分分解为B因素水因素水平间平方和(平间平方和(SSB)、)、交互作用交互作用AxB平方和(平方和(SSAB)和裂区误差平方和(和裂区误差平方和(SSeB)。)。 平方和分解 平方和分解 变异来源自由度平方和均方F值Prob整区部分 Blockdfr=n-1SSrMSr= SSr /dfrMSr / MSeA Adfa=a-1SSAMSA= SSA /dfaMSA / MSeA EAdfea=(n-1)(a-1)SSeA=SSI- SSr SSAMSeA= SSeA /dfea 裂区部分 BdfB=b-1SSBMSB= SSB /dfBMSB
16、/ MSeB AxBdfAB=(a-1)(b-1)SSAB=SSK-SSA-SSBMSAB=SSAB /dfABMSAB/ MSeB EBdfeB=a(b-1)(n-1)SSeB=SST-SSB-SSABMSeB= SSeB / dfeB 总和dfT=nab-1SST=W-C 注:全部数据之总和为T,全部数据之平和为W,校正数为C=T2/nab,Tj、Tm、Tl、Tml、Tjm分别为各区组、A各水平、B各水平、A和B各水平组合、区组n和A各水平组合的总和数。 SSI= SSr= SSA= SSB= SSk= b1najmCT12ab1njjCT12nb1ammCT12na1bllCT12n1a
17、bmlCT12例题例题1 江苏某地在不整地和整地(江苏某地在不整地和整地(A)的基础上,)的基础上,比较对照、猪牛粪、绿肥、堆肥和草塘泥等五种施比较对照、猪牛粪、绿肥、堆肥和草塘泥等五种施肥(肥(B1-B5),对早稻产量的影响,采用裂区设计),对早稻产量的影响,采用裂区设计,整区处理为不整地(,整区处理为不整地(A1)和整地(和整地(A2),),裂区处裂区处理为施用不同农家肥,设理为施用不同农家肥,设4个重复区组,试作分析。个重复区组,试作分析。 裂区设计举例B2B4B5B1B4B5B1B2B3B3B3B5B5B4B1B2B4B3B2B1B1B3B3B2B5B4B2B1B4B5B4B2B1B3
18、B3B1B5B4B2B5区组区组 I II III IVI II III IV A1 A2 A2 A1 A2 A1 A1 A2 A1 A2 A2 A1 A2 A1 A1 A2试验数据见下表:试验数据见下表:kg/667.7 裂区设计举例裂区处理裂区处理IIIIIIIVA1A2A1A2A1A2A1A2不施肥不施肥B1B1176445192445192448304524猪牛粪猪牛粪B2B2352592256504246520388500绿绿 肥肥B3B3416604325604406640486650堆堆 肥肥B4B4280548240485320584320524草塘泥草塘泥B5B5405640
19、444565366660456616Data split;Do block = 1 to 4; Do a = 1 to 2; Do b = 1 to 5; Input yield ; Output; End; End;End;裂区设计SAS分析编程Cards;176 352 416 280 405 445 592 604 548 640192 256 325 240 444 445 504 604 485 565192 246 406 320 366 448 520 640 584 660304 388 486 320 456 524 500 650 524 616; 裂区设计SAS分析Pro
20、c Anova; Class block a b; Model yield = block a b block*a a*b; Test h = block a e = block*a ; Means a /Duncan e = block*a ; Means b /Duncan;Run; 裂区设计SAS分析方差分析结果:方差分析结果:Source DF Anova SS Mean Square F Value Pr FBLOCK 3 25355.60 8451.8667 6.15 0.0030 A 1 512569.60 512569.600 372.89 0.0001 B 4 184557.
21、65 46139.4125 33.57 0.0001BLOCK*A 3 11490.40 3830.1333 2.79 0.0625A*B 4 3251.15 812.7875 0.59 0.6722Tests of Hypotheses using the Anova MS for BLOCK*A as an error termSource DF Anova SS Mean Square F Value Pr FBLOCK 3 25355.60 8451.8667 2.21 0.2662 A 1 512569.60 512569.60 133.83 0.0014裂区设计SAS分析多重比较(
22、多重比较(Duncan法):法):Alpha= 0.05Duncan Grouping Mean N AA 554.90 20 2 B 328.50 20 1Duncan Grouping Mean N BA 519.00 8 5A 516.38 8 3B 419.75 8 2B 412.63 8 4C 340.75 8 1裂区设计SAS分析裂区设计SAS分析菜单分析表明分析表明:施用整地:施用整地A2对早稻有极显著的增对早稻有极显著的增产效果,其中草塘泥产效果,其中草塘泥B5和绿肥和绿肥B3显著的优于显著的优于猪牛粪猪牛粪B2和堆肥和堆肥B4,猪牛粪猪牛粪B2和堆肥和堆肥B4又显又显著地高于
23、不施肥著地高于不施肥B1。 点菜单进行裂区设计的方差分析点菜单进行裂区设计的方差分析 应用运用通用线性模型(应用运用通用线性模型(GLM)进行裂进行裂区设计的方差分析,选择区设计的方差分析,选择Tests选项卡的误差选项卡的误差项项Error。 注意:点菜单时均值比较不方便。注意:点菜单时均值比较不方便。进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲
24、扇、凉席,不论男女老忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热怎么这么热”,于是三,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑强子,别跑了,快来我给你扇扇了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,。孩子们才不听这一套,跑个没完,直到累
25、气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你你看热的,跑什么?看热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅道,袅
限制150内