常用试验设计分析方法.ppt
第六章 常用的试验设计及统计分析常用的试验设计仅研究主效应的实验设计:1.完全随机设计(Completelyrandomizeddesign)2.随机区组(配伍组)设计(Randomizedblockdesign)3.交叉设计(Cross-overdesign)4.拉丁方设计(Latinsquaredesign)考虑交互作用的实验设计1.析因设计(Factorialdesign)2.正交设计(Orthogonaldesign)误差项变动的实验设计1.嵌套设计(Nesteddesign)2.裂区设计(split-plotdesign)3.重复测量设计(RepeatedMeasureDesign)第一节 仅研究主效应的实验设计一、完全随机设计:将受试对象随机地分配到各个处理组的设计。随机分组方法:1.编号,确定分组方案2.产生随机数字(随机数字表,或电脑),排序3.按方案分组(如较少10个随机数为A,中间10个数为B,较大10个随机数为C)编号123456789102930随机数12418272729141326524297 8分组BACCCCABCACCAABEBDEACCADEBDCAECBD例:用五种肥料处理棉花,试验重复4次,试验设计见下图,最终棉花产量资料见completerandom.sav。试比较五种处理对棉花产量的影响是否有差异。给出两两比较的p值直接给出分组信息方差齐性检验绘平均值图P0.05,方差齐各处理间差异显著棉花产量肥料5732.2917a肥料41473.9583b肥料31750.0000b肥料21799.4792b肥料11993.7500b各处理间棉花产量差异显著性(S-N-K)处理1和处理4之间棉花产量差异显著(LSD)(F=12.823,d.f.=1,15,p=0.018)或(F1,15=12.823,p=0.018)随机区组设计(randomizedblockdesign),又称配伍组设计。是单因素设计的方差分析,使用的却是多因素方差分析的方法。实验设计中常按影响试验结果的非处理因素(如窝别等)配成区组(block),再将区组内的受试对象随机分配到各组。这种设计方法统计检验效能较高。缺点是比较麻烦。二、随机区组设计 随机分组方法(每个单位组内随机):1.将同窝大白鼠为一个区组(block),并编号;2.给每个大白鼠一个随机数;3.按规定分组:规定随机数小者分到甲组,中等分到乙组,大者分到丙组.4个区组大白鼠按随机区组设计随机区组设计分组区组号1234小白鼠123456789101112随机数683526009953936128527005序号321132321231分配结果丙乙 甲甲丙乙丙乙甲乙丙甲A3F3B3F1C1D1E3D3C3B1E1A1C4F4A4D2B2F2B4D4E4E2C2A2随机区组设计:6种肥料以4种方法处理棉花,试验安排据地形划分4个区,最终棉花产量资料见randomblock.sav。试比较6种处理对棉花产量的影响是否有差异。GLMUnivarivate给出Yield=Intercept+treat+block参数估计值方差齐性检验绘残差图当存在协变量时,按协变量为均数的情况计算固定变量的边际均数。方差齐性检验无法输出。这是因为两个因素的各水平交叉。如果要检查方差齐性,每个单元格内至少要有3个数据点。多因素的方差分析各组变异的齐性检验不是很重要。aaabababbObservedvspredicted线性越强越好残差越分散越好将block作为随机变量(Randomfactor)模型不同(分别做treat和block的模型)结果不变,但随机变量Block不能作两两比较。如果不考虑Block的影响,只作one-wayANOVA呢?为什么one-wayANOVA没有检测到差异显著性呢?三、交叉设计:平行组试验:受试者被随机分到两个研究小组(治疗组A或治疗组B中的一个)中,。然后比较二个组的结果。(t-test,one-wayANOVA)交叉设计:选择受试人群,分配他们到不同治疗组,组A或组B。当两组治疗一段时间后,受试者进入一个清洗期,然后用药反过来。接受B治疗的组将接受A治疗,反之亦然。在这种形式中,每个受试者成为他或她自身的对照。这个方法提供了最好的对照,也就是说每个受试者将会是其自己的对照。例:12种高血压病人采用A、B两种方案治疗,随机让6人先以A法治疗,经过一定清洗期后再以B法治疗;另外6人先以B法治疗,后以A法治疗;记录血压下降值。结果见下表。数据见crossover.sav。试分析两种方案的疗效有无差别。阶段病人编号123456789101112IBBABAAAABBBA3.07 1.33 4.41.87 3.23.73 4.13 1.07 1.07 2.27 3.47 2.4IIAABABBBBAAAB2.81.47 3.73 3.62.67 1.62.67 1.73 1.47 1.87 3.47 1.73由于patient被看作是从一个总体中抽样得到的,所以作为随机变量。WarningsPosthoctestsarenotperformedfor治疗方案becausetherearefewerthanthreegroups.如果对只有两个水平的变量,选择Posthoc,则不会给出结果。主要因素和误差项的平方和和自由度分别给出处理A和处理B之间疗效差异不显著(F=4.599,d.f.=1,10,p=0.058)四、拉丁方设计 拉丁方设计是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次。在拉丁方设计中,试验处理数=横行区组数=直列区组数=试验处理的重复数。一、拉丁方简介(一)拉丁方以n 个拉丁字母A,B,C,为元素,列出一个n阶方阵,若这n个拉丁方字母在这n 阶方阵的每一行、每一列都出现、且只出现一次,则称该n阶方阵为nn阶拉丁方。例如:例如:A B B A B A A B 为为22阶拉丁方,阶拉丁方,22阶拉丁方只有这两个。阶拉丁方只有这两个。A B C B C A C A B 为为33阶拉丁方。阶拉丁方。(二)常用拉丁方最常用的有33,44,55,66阶拉丁方。下面列出部分标准型拉丁方,供进行拉丁方设计时选用。二、拉丁方设计方法二、拉丁方设计方法 下面结合具体例子说明拉丁方设计方法。为了研究5种不同温度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡群和产蛋期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组设置,以便控制这两个方面的系统误差。拉丁方设计步骤如下:(一)选择拉丁方先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。此例因试验因素为温度,处理数为5;将鸡群作为直列区组因素,直列区组数为5;将产蛋期作为横行区组因素,横行区组数亦为5。本例选取前面列出的第2个55标准型拉丁方,即:A B C D EA B C D EB A D E CB A D E CC E B A DC E B A DD C E B AD C E B AE D A C BE D A C B(二)随机排列(二)随机排列 在选定拉丁方之后,若是非标准型,则可直接由拉丁方中的字母获得试验设计。若是标准型拉丁方,还应按下列要求对直列、横行和试验处理的顺序进行随机排列。55标准型拉丁方:先随机选择4个标准型拉丁方中的一个;然后将所有的直列、横行及处理都随机排列。下面对选定的55标准型拉丁方进行随机排列。先从随机数字表任意一行/列开始,向右连续抄录3个5位数,抄录时舍去“0”、“6以上的数”和重复出现的数。如得到的3个五位数字为:13542,41523,34521。然后将上面选定的55拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。1、直直列列随随机机 将将拉拉丁丁方方的的各各直直列列顺顺序序按按13542顺序重排。顺序重排。2、横行随机、横行随机 再再 将直列重排后的拉丁方将直列重排后的拉丁方的各横行按的各横行按41523顺序重排。顺序重排。3、把5种不同温度按第三个5位数34521顺序排列即:A=3,B=4,C=5,D=2,E=1,从而得出55拉丁方设计,如表所示。括号内的数字表示温度的编号,由表可以看出,第一鸡群在第个产蛋期用第2种温度,第二鸡群在第个产蛋期用第1种温度,等等。试验应严格按设计实施。试验结果如表所示。四、拉丁方设计的优缺点四、拉丁方设计的优缺点 (一)拉丁方设计的主要优点(一)拉丁方设计的主要优点 1、精确性高拉丁方设计在不增加试验单位的情况下,比随机区组设计多设置了一个区组因素,能将横行和直列两个区组间的变异从试验误差中分离出来,因而试验误差比随机区组设计小,试验的精确性比随机区组设计高。2、试验结果的分析简便(二)拉丁方设计的主要缺点1.横行区组数、直列区组数、试验处理数与试验处理的重复数必须相等,所以处理数受到一定限制。2.若处理数少,则重复数也少,估计试验误差的自由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列区组数也多,导致试验工作量大,且同一单位组内试验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的试验。在采用4个以下处理的拉丁方设计时,为了使估计误差的自由度不少于12,可采用“复拉丁方设计”,即同一个拉丁方试验重复进行数次,并将试验数据合并分析,以增加误差项的自由度。例:下面的表是家兔在不同部位注射某种药物后所生疱疹的大小。家兔共有六只,其编号为、III、。注射部位有六处,其代号为A、B、C、D、E、F,注射次序用1、2、3、4、5、6来表示。该表的读法是,第一次注射时1号兔在部位B处注射,所生疱疹大小为7.5平均厘米;号兔在部位E处注射,所生疱疹大小为8.5平方厘米;余类推。这里我们看到,这个资料是按家兔编号、注射部位、注射次序三个标志来分组的。试分析三种因素是否对疱疹大小有影响。拉丁方设计方差分析.sav在只考虑主效应的试验设计分析中,不显著的因素最好不要从模型中排除。也可以显示不同兔子注射不同药物的皮疹面积的平均值。自己做一下。1.完全随机设计的ANOVA所关心的问题:一个处理因素不同处理水平间的均数有无差异?设立单位组(区组)的目的是控制混杂因素。使混杂因素在各处理水平间达到均衡,提高检验效率。2.随机区组设计的ANOVA第二节考虑交互作用的实验设计不考虑交互作用的实验设计:1.析因设计(factorial design)1.两个或以上处理因素的各处理水平间的均数有无差异?即主效应有无统计学意义?2.两个或以上处理因素之间有无交互作用?交互作用(Interaction):某一因素不同水平的均数随着另一因素不同水平的均数改变而改变。没有交互作用的模型。不同的蛇毒浓度与瘤株的种类没有交互作用,所以这四条线几乎是平行的。从该图可以看出,两个因子效应综合效应是简单的加法。实例实例1 1:甲乙两药治疗高胆固醇血症的疗效(胆固:甲乙两药治疗高胆固醇血症的疗效(胆固醇降低值醇降低值mgmg),问),问甲乙两药是否有降低胆固甲乙两药是否有降低胆固醇的作用(醇的作用(主效应主效应)?)?两种药间有无两种药间有无交互作用交互作用完全随机的两因素完全随机的两因素2222析因设计析因设计析因设计的实例实例2:小鼠种别A、体重B和性别C对皮内移植SRS瘤细胞生长特征影响的结果(肿瘤体积cm3)问A、B、C各自的主效应如何?三者间有无交互作用?完全随机的三因素完全随机的三因素222222析因设计析因设计实例实例3 3:研究小鼠在不同注射剂量和不同注射频次下:研究小鼠在不同注射剂量和不同注射频次下药剂药剂ACTHACTH对尿总酸度的影响。问对尿总酸度的影响。问AA、B B各自的各自的主效主效应应如何?如何?二者间有无二者间有无交互作用交互作用?随机区组的两因素随机区组的两因素3232析因设计析因设计2.析因设计的特点析因设计的特点p2个或以上(处理)因素(factor)(分类变量);p每个因素有2个或以上水平(level);p每一组合涉及全部因素,每一因素只有一个水平参与;p几个因素的组合中至少有2个或以上的观察值;p观测值为定量数据(需满足随机、独立、正态、等方差的ANOVA条件)。3.两因素析因设计方差分析中的多重比较当双向方差分析拒绝无效假设时,需要进一步确定哪些水平间的效应差异存在统计学意义。当交互作用无统计学意义时,可直接对处理因素各水平的平均值进行比较。当交互作用有统计学意义时,必须用两因素各水平组合下的平均值进行比较。例:在治疗肝癌的药物研究中,为了提高治疗药物在靶器官肝脏的浓度,降低在非靶器官如心脏的浓度,行232析因设计,即设置3个因素,第一个因素有2个水平,第二个因素有3个水平,第三个因素有2个水平。将60只小鼠随机分为12组,观察指标为组织中丝裂霉素的浓度,结果见表。试做析因分析。“析因设计方差分析.sav”Model:Fullfactorial当两因素有交互作用时,则各因素的主效应有无统计学意义没有适用价值。要比较各因素内各水平有无统计学意义,需要用lmatrix语句。先建立只含需要比较因素的模型,past,在syntaxeditor中再加/lmatrix变量名水平1vs水平3time10-1.等语句。UNIANOVAconsBYtime/METHOD=SSTYPE(3)/INTERCEPT=INCLUDE/CRITERIA=ALPHA(.05)/DESIGN=time/lmatrixtime15minvs60mintime10-1.给你的输出结果(表格)一个合适的名字 二、正交设计 (一一)正交设计的基本概念正交设计的基本概念 正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。例如,影响某品种鸡的生产性能有3个因素:A因素是饲料配方,设A1、A2、A33个水平;B因素是光照,设B1、B2、B33个水平;C因素是温度,设C1、C2、C33个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能的组合有27种。如果试验方案包含各因素的全部水平组合,即进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。这是全面试验的优点。但全面试验包含的水平组合数较多,工作量大,由于受试验场地、试验动物、经费等限制而难于实施。若试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。3 因因 素素 3 水水 平平 的的 全全 面试验水平组合数为面试验水平组合数为33=27,4 因素因素3水平的全面试验水平组合数为水平的全面试验水平组合数为34=81,5因素因素3水平的全面试验水平组合数为水平的全面试验水平组合数为35=243,这在动物试验中是不可能做到的。,这在动物试验中是不可能做到的。(二二)正交设计的基本原理正交设计的基本原理正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。上图中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:(1)A1B1C1(2)A2B1C2(3)A3B1C3(4)A1B2C2(5)A2B2C3(6)A3B2C1(7)A1B3C3(8)A2B3C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。对于A、B、C3个因素来说,是在27个全面试验点中选择9个试验点,仅是全面试验的三分之一。从图中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。二、正交表及其特性二、正交表及其特性L8(27)正交表,其中“L”代表正交表;L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合);括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素。常用的正交表已由数学工作者制定出来,供进行正交设计时选用。2水平正交表除L8(27)外,还有L4(23)、L16(215)等;3水平正交表有L9(34)、L27(213)等(SPSSDataOrthogonal)。若在一项试验中有s个因素,每个因素各有q水平,用正交试验安排试验,则至少要作q2个试验,正交设计在挑选代表点时有两个特点:均匀分散,整齐可比。“均匀分散”使试验点有代表性;“整齐可比”便于试验数据的分析。为了保证“整齐可比”的特点,正交设计必须至少要求做q2次试验。(二二)正交表的特性正交表的特性 任何一张正交表都有如下两个特性:1、任一列中,不同数字出现的次数相等例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次。2、任两列中,同一横行所组成的数字对出现的次数相等例如L8(27)中(1,1),(1,2),(2,1),(2,2)各出现两次;L9(34)中(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。(三三)正交表的类别正交表的类别 1、相同水平正交表各列中出现的最大数字相同的正交表称为相同水平正交表。如L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。2、混合水平正交表各列中出现的最大数字不完全相同的正交表称为混合水平正交表。如L8(424)表中有一列最大数字为4,有4列最大数字为2。也就是说该表可以安排一个4水平因 素 和 4个 2水 平 因 素。再 如 L16(4423),L16(4212)等都混合水平正交表。正交设计资料的分析例:为研究由7种化学成分组成的最佳配方,以获取某物质的有效成分最高提取率,拟考虑每种成分有3种不同浓度水平供配方选择,共设计27个水平组合。试进行正交设计。L27(37)DataOrthogonaldesigngenerate设7种化学成分3种浓度替代现有工作数据文件1n个水平,自动填充27个水平组合如果把A定义为7个水平,B定义为3个水平,不限制最少例数,则产生一个3x7的随机区组设计。正交设计资料的方差分析例:应用正交设计形成由7种成分3个不同浓度组合的27种配方,每种配方进行一次提取实验,获得某物资的有效成分提取率()。试分析之。(正交设计方差分析.sav)根据研究需要,引入两两交互作用药物与浓度之间没有交互作用。a、b、c三种成分对有效成分的提取率贡献比较大。第三节误差项变动的实验设计一、嵌套设计:在嵌套设计中,各试验因素的影响有主次之分,次要因素的各个水平是嵌套在主要因素的水平下的,因而在统计时不能分析交互作用。有两种情况:1.最终实验条件是各因素水平的全面组合,只是专业上有主次之分。平方和用typeI计算。2.最终实验条件并非是各因素水平的全面组合,而是主要因素不同水平下次要因素有不同水平。比如有两种药物,A药物的浓度是50、100、200,而B药物的浓度是100、200、300.某单位研究3种饲料的营养价值,先将12只大白鼠随机分为3组,每组喂一种饲料,于10、11、12、13周分别测量体重增加量,数据文件见nested.sav。试分析3种饲料的营养价值是否有差异。分析模型设计好后,paste,对语句进行编辑。UNIANOVAweightBYsiliaoweekmouse/RANDOM=mouse/METHOD=SSTYPE(3)/INTERCEPT=INCLUDE/CRITERIA=ALPHA(.05)/DESIGN=siliaoweekmouse.UNIANOVAweightBYsiliaoweekmouse/RANDOM=mouse/METHOD=SSTYPE(3)/INTERCEPT=INCLUDE/CRITERIA=ALPHA(.05)/DESIGN=siliaoweekmouse(siliao).Mouse是采用的二级单位误差。更改前输出结果Mouse为随机变量时的方差。Mouse误差项的方差。更改后输出结果Mouse受限于siliao下的二级误差。各变量误差项的方差。二、裂区设计(split-plot design)资料的方差分析裂区设计资料的特点一级单位(大区间,主区)品种、密度二级单位(小区内,即裂区)氮肥施用量、氮肥运筹方式(朱新开等,氮素对不同类型专用小麦营养和加工品质调控效应,中国农业科学2003,36:640645)。两因素裂区设计资料的方差分析方法先按随机区组析因设计的方法分析因素A(品种/密度)、区组(氮肥施用量)的主效应及其交互作用。(只考虑一级单位(大区,主区)然后,考虑二级单位(氮肥运筹方式,因素B)的主效应及A、B间交互作用。也可以将大区作为重复测量进行分析。王继安,王金阁,大豆叶面积垂直分布对产量及农艺性状的影响,东北农业大学学报,2000,31:1419。重复测量(repeatedmeasure)是指对同一研究对象的某一观察指标在不同场合(occasion,时间点)进行的多次测量。三、重复测量资料的方差分析实例举例1每一根线代表1只兔子实例举例2每一根线代表1位病人重复测量设计的优缺点优点:每一个体作为自身的对照,克服了个体间的变异。分析时可更好地集中于处理效应。因重复测量设计的每一个体作为自身的对照,所以研究所需的个体相对较少,因此更加经济。缺点:滞留效应(Carry-overeffect)前面的处理效应有可能滞留到下一次的处理.潜隐效应(Latenteffect)前面的处理效应有可能激活原本以前不活跃的效应.学习效应(Learningeffect)由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高。重复测量资料方差分析对协方差阵的要求重复测量资料方差分析的条件:1.正态性处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布;2.方差齐性相互比较的各处理水平的总体方差相等,即具有方差齐同3.各时间点组成的协方差阵(covariancematrix)具有球形性(sphericity)特征。若球形性质得不到满足,则方差分析的F值是有偏的,这会造成过多的拒绝本来是真的无效假设(即增加了I型错误)。在数据集anxiety2.sav中判断:anxiety和tension对实验结果(即trial1trial4)有无影响;四次试验间有无差异;试验次数和两个变量有无交互作用。anxity2.sav和anxiety.sav实际上是同一个数据,但根据不同的分析目的采用了不同的数据排列方式。如果采用anxiety.sav进行分析,我们可以分析四次试验间有无差异的问题,但对另一个问题就无能为力了,因为用普通的方差分析模型,anxitey和tension的影响被合并到了subject中,根本就无法分解出来进行分析。这时,我们就只能求助于重复测量的方差分析模型。在菜单中选择AnalyzeGeneralLinealmodelRepeatedmeasures,系统首先会弹出一个重复测量因子定义对话框如下:因为是重复测量的模型,应变量被重复测量了几次,分别存放在几个变量中,所以我们这里要自行定义应变量。默认的名称为factor1,我们将其改为trail,下面的因素等级数填入4(因一共测量了四次)。单击Add钮,则该变量被加入,我们就完成了模型设置的第一步:应变量名称和测量次数定义。单击define,开始进行下一个步骤:具体重复测量变量定义及模型设置,对话框如下:没有应变量框,而是改为了组内效应框。trial有四次测量,此处就给出了四个空让填入相应代表四次测量的变量,选中trial1trial4,将其选入;然后选择自变量(这里又将其称为了betweensubjectsfactor),将剩下的三个都选入即可。由于不需要检验anxity与tension的交互作用对试验次数有无交互作用,所以要在model中作相应设置,把3维交互作用删除。针对所检验的结果变量trial,以及他和另两个引入模型的自变量间的交互作用是否存在统计学意义,采用的是四种多元检验方法。一般他们的结果都是相同的,如果不同,一般以HotellingsTrace方法的结果为准。可见在所用的模型中,trial的四次测量间的确是存在着统计学差异的,但它和另两个变量间的交互作用无统计学意义。球形检验,因为重复测量的方差分析模型要求所检验的应变量服从球形分布。只要看到近似卡方为9.383,自由度为5,P值为0.097就可以了。因此trial是勉强服从球形分布的,可以进行重复测量的方差分析。方差分析的方法对组内因素进行了检验。第一种为球形分布假设成立时的结果,就是我们所要看的。如果该假设不成立,则根据不同的情况可能看下面三种检验结果之一,或放弃该检验方法。各次重复测量间变化趋势的模型分析,这里要求检验没有统计学意义,否则说明变化趋势不服从该曲线。以trial为例,对Linear的检验P值小于千分之一,Quadratic的P值略大于0.05。只有Cubic的P值在0.5附近,因此最佳的拟合曲线应为Cubic(三次方曲线);但由于一共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上的知识,最终的拟和曲线应为Quadratic(二次方曲线)。每次试验结构平均值的方差分析。确认一下几次测量间的变化趋势。用plots子菜单作出模型估计的四次测量均数值图。SPSS上机练习常用的试验设计编编 号号123456789102930随机数随机数124 182727 2914 1326524 297 8分组分组BACCCCABCACCAvar0001更名为“id”:输入130。computerandom1=RV.UNIFORM(1,100),OK!Datasortcaserandom1ascending,OK!var0002group:最小的10个random11中间的10个random12最大的10个random13再产生一个随机数:data=RV.NORMAL(10,5),测验一下各组(Group)之间data是否有差异?random1呢?练习1:用SPSS产生一个因素3个水平,10次重复的完全随机设计练习2:研究多效唑对水仙植株高度的影响,设置A、B、C、D四个浓度,以清水为对照记为E,每小区100株,重复5次,采用完全随机设计,小区排列及测得株高(厘米)如图表所示,试作方差分析。完全随机设计排列和小区株高(厘米)A 35 C 28 A 33 D 22 E 40 B 29 D 24 E 38 B 30 C 24 C 25 E 42 D 22 A 32 A 30 A 37 E 35 C 30 D 21 B 31 E 41 B 33 D 20 B 34 C 27 练习3 用SPSS产生一个12只大白鼠按随机区组设计随机区组设计分组的方案单位组号1234小白鼠123456789101112随机数683526009953936128527005序 号321132321231 分配结果丙乙 甲甲丙乙丙乙甲乙丙甲var0001更名为“id”:输入112。var0002更名为block:id=13,1;id=46,2;id=78,3;id=1012,4computerandom1=RV.UNIFORM(1,100),OK!var0003更名为treatment:每个block中random1最小的1个1;random1中间的1个2;最大的1个3。测验一下各处理(treatment)和各组(block)之间random1的差异。练习4:在武昌地区进行马铃薯播种期试验,从立春开始每隔半月播种一次,共播四次,小区面积14m2,重复四次,采用随机区组(block)设计,其田间排列和各小区产量(kg)如表所示,试比较各区组(field)和各播种期(term)的产量是否相同。惊蛰 39.0 立春 43.0 雨水 44.0 春分 40.0 春分 34.0 雨水 42.0 惊蛰 41.5 立春 50.0 雨水 42.0 春分 34.5 立春 47.5 惊蛰 45.5 立春 39.6 惊蛰 39.5 春分 39.5 雨水 45.0 练习5:为研究5个剂量的甲状腺提取液对豚鼠甲状腺重的影响,考虑到鼠的种系和体重对观测指标可能有一定的影响,设计试验时,最好将这个重要的非处理因素一并安排。根据专业知识得知,这3个因素之间的交互作用可忽略不计,请选用合适的试验设计方案,并对所收集的定量资料进行统计分析。5个剂量的甲状腺提取液对豚鼠甲状腺重的影响情况甲状腺提取液的剂量(字母)与甲状腺重(g/200g体重)种系体重:1C65E85A57B49D792E82B63D77C70A463A73D68C51E76B524D92C67B63A41E685B81A56E99D75C66注:具体剂量分别为A(273),B(308),C(319),D(391),E(410)。拉丁方设计也可以将dose作水平轴,weight作分线图(每条线代表一个体重组);如果将rat置入“separateplot”栏,将按不同老鼠种类给出5个plot。练习6:甜菜有6种品种,2个收获期,为了考查品种和收获期对甜菜的产量有无显著的影响,研究者将收获期看作1级单位中的处理因素,用它的不同水平作拉丁方设计,即在2级单位中考虑了1个2级处理因素(品种),另外考虑2个重要的非处理因素,不妨设为REP和COL(这2个因素可理解为耕种或管理方法、施肥种类或数量等),甜菜的产量用y表示,设计和试验资料如下表所示,试作分析。收获期、品种、REP、COL因素对甜菜产量影响的试验结果收获期REP品种与甜菜产量(y:单位)(Harvest)COL:12345611319.1618.3519.6118.6218.2418.52618.1219.5417.6318.7118.7519.93118.1520.2618.5420.1319.6219.24219.1318.8118.7520.2418.6618.55417.5118.1218.7618.2520.4318.56517.7417.8317.4217.0617.6117.621316.2617.0518.1116.6217.7416.32616.0215.3416.0317.1116.5517.63116.5518.1616.7416.2316.7217.34217.5316.0116.4518.0416.6616.15415.7116.1216.7616.3517.8316.26518.3416.6316.4217.6617.1116.5复拉丁方设计练习练习7:观察观察A、B两药联合应用在产两药联合应用在产妇分娩时的镇痛时间(妇分娩时的镇痛时间(min)完全随机的两因素完全随机的两因素3333析因设计析因设计Model:FullfactorialA、B两药没有交互作用,正式分析时去掉交互作用Model:Maineffects:A、B练习练习8:为了研究不同氧浓度(因素A)和不同抗癌药(因素B)以及用放射性3H-胸腺嘧啶(简称3H-TdR)掺入对人红白血病细胞K562的抑制效果,因素A分为A1(含氧3%)、A2(含氧20%),因素B分为B1(表阿霉素),B2(自制中药),B3(132Ge),B4(B1+B3),B5(B1+B2),B6(B2+B3),B7(B1+B2+B3)。进行了27析因设计并收集到试验数据如下,试分析A、B因素对K562抑制的效果。A、B两因素伴随3H-TdR掺入对K562细胞抑制情况的试验结果重复相对抑制值A:氧浓度试验编号B(药物):B1B2B3B4B5B6B7A1(含氧3%)10.310.460.290.490.720.450.1920.180.390.180.510.490.420.2030.120.400.120.620.550.440.1840.130.340.130.530.370.420.17A2(含氧20%)10.290.650.870.741.091.040.8120.270.840.390.780.730.631.0130.290.450.571.450.811.181.1840.280.630.641.410.771.450.94注:相对抑制值越大,表明抑制能力越强。练习练习练习练习9 9:多元的情形(先检测所有的交互作用,如果没有3维交互作用,只保留主效应和所有的二维交互作用,最后把没意义的交互作用也从模型中去掉)在某项试验研究中,考察了个试验因素A和B,A(样品)分为A1(肺泡支气管灌洗液),A2(肺匀浆);B(处理组别)分为B1(对照组),B2(急性缺氧组),B3(间断缺氧5天组),B4(间断缺氧15天组)。从每只家兔的A1,A2种样品中分别测得5种磷脂的相对含量,试验数据如下表所示,试进行双因素多元析因设计资料的方差分析。A1A2Y1Y2Y3Y4Y5Y1Y2Y3Y4Y5B11.7662.9419.9712.542.791.9135.337.1317.238.421.4338.119.49.4431.622.4431.3536.4719.899.841.3863.3812.538.9813.732.0737.6536.3317.76.25B26.912.3154.1812.9239.620.743.8815.6332.96.892.0964.2213.748.5411.421.0646.1221.8525.875.092.8370.7310.558.577.320.9464.1217.8514.192.89B31.4950.7331.6414.893.21.4950.7431.6312.933.21.0166.9743.5721.695.090.7348.7131.5415.343.691.5452.2224.5717.64.271.5452.2224.5717.44.27B46.0356.546.714.6216.111.6382.665.577.292.843.7334.245.17.344.320.7855.8636.954.61.815.5847.8911.0315.4820.010.9340.7249.835.652.87练习练习10:含区组因素的析因设计 有人研究猪食用不同饲料对体重增加量的影响。A(大豆粉+不同含量的蛋白质):A1(加14%蛋白质)、A2(加12%蛋白质);B(玉米中己氨酸的含量):B1(含0.6%己氨酸)、B2(缺乏己氨酸),共有4只同的饲料配方。用24头猪做此试验,以猪的初始体重为区组因素,按上述方法把24头猪分成6个配伍组,使每组的4头猪随机地被分配到4种饲料组中去,设计和资料见表,试作分析。2种饲料对同期内猪体重增加量的影响配伍组平均日增重量(斤)SA1(B1B2)A2(B1B2)11.381.521.221.1121.091.480.871.0331.081.451.130.9741.091.221.000.9751.401.271.341.0961.471.531.160.99不能研究三维的交互作用,但可以研究A*B交互作用(为什么?)Block作为随机变量练习11:为比较人乳腺癌细胞(MCF-7)及其经基因修饰后的细胞(TMCF-7)的活性,用MTT法进行测定,观测指标为细胞中线粒体内琥珀酸脱氢酶的活性,用光密度值(即OD值)来反映,OD值越大,说明细胞增殖活性越强,其设计与资