常用试验设计分析方法.ppt
《常用试验设计分析方法.ppt》由会员分享,可在线阅读,更多相关《常用试验设计分析方法.ppt(140页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 常用的试验设计及统计分析常用的试验设计仅研究主效应的实验设计:1.完全随机设计(Completelyrandomizeddesign)2.随机区组(配伍组)设计(Randomizedblockdesign)3.交叉设计(Cross-overdesign)4.拉丁方设计(Latinsquaredesign)考虑交互作用的实验设计1.析因设计(Factorialdesign)2.正交设计(Orthogonaldesign)误差项变动的实验设计1.嵌套设计(Nesteddesign)2.裂区设计(split-plotdesign)3.重复测量设计(RepeatedMeasureDesign)
2、第一节 仅研究主效应的实验设计一、完全随机设计:将受试对象随机地分配到各个处理组的设计。随机分组方法:1.编号,确定分组方案2.产生随机数字(随机数字表,或电脑),排序3.按方案分组(如较少10个随机数为A,中间10个数为B,较大10个随机数为C)编号123456789102930随机数12418272729141326524297 8分组BACCCCABCACCAABEBDEACCADEBDCAECBD例:用五种肥料处理棉花,试验重复4次,试验设计见下图,最终棉花产量资料见completerandom.sav。试比较五种处理对棉花产量的影响是否有差异。给出两两比较的p值直接给出分组信息方差齐
3、性检验绘平均值图P0.05,方差齐各处理间差异显著棉花产量肥料5732.2917a肥料41473.9583b肥料31750.0000b肥料21799.4792b肥料11993.7500b各处理间棉花产量差异显著性(S-N-K)处理1和处理4之间棉花产量差异显著(LSD)(F=12.823,d.f.=1,15,p=0.018)或(F1,15=12.823,p=0.018)随机区组设计(randomizedblockdesign),又称配伍组设计。是单因素设计的方差分析,使用的却是多因素方差分析的方法。实验设计中常按影响试验结果的非处理因素(如窝别等)配成区组(block),再将区组内的受试对象随
4、机分配到各组。这种设计方法统计检验效能较高。缺点是比较麻烦。二、随机区组设计 随机分组方法(每个单位组内随机):1.将同窝大白鼠为一个区组(block),并编号;2.给每个大白鼠一个随机数;3.按规定分组:规定随机数小者分到甲组,中等分到乙组,大者分到丙组.4个区组大白鼠按随机区组设计随机区组设计分组区组号1234小白鼠123456789101112随机数683526009953936128527005序号321132321231分配结果丙乙 甲甲丙乙丙乙甲乙丙甲A3F3B3F1C1D1E3D3C3B1E1A1C4F4A4D2B2F2B4D4E4E2C2A2随机区组设计:6种肥料以4种方法处理
5、棉花,试验安排据地形划分4个区,最终棉花产量资料见randomblock.sav。试比较6种处理对棉花产量的影响是否有差异。GLMUnivarivate给出Yield=Intercept+treat+block参数估计值方差齐性检验绘残差图当存在协变量时,按协变量为均数的情况计算固定变量的边际均数。方差齐性检验无法输出。这是因为两个因素的各水平交叉。如果要检查方差齐性,每个单元格内至少要有3个数据点。多因素的方差分析各组变异的齐性检验不是很重要。aaabababbObservedvspredicted线性越强越好残差越分散越好将block作为随机变量(Randomfactor)模型不同(分别做
6、treat和block的模型)结果不变,但随机变量Block不能作两两比较。如果不考虑Block的影响,只作one-wayANOVA呢?为什么one-wayANOVA没有检测到差异显著性呢?三、交叉设计:平行组试验:受试者被随机分到两个研究小组(治疗组A或治疗组B中的一个)中,。然后比较二个组的结果。(t-test,one-wayANOVA)交叉设计:选择受试人群,分配他们到不同治疗组,组A或组B。当两组治疗一段时间后,受试者进入一个清洗期,然后用药反过来。接受B治疗的组将接受A治疗,反之亦然。在这种形式中,每个受试者成为他或她自身的对照。这个方法提供了最好的对照,也就是说每个受试者将会是其自
7、己的对照。例:12种高血压病人采用A、B两种方案治疗,随机让6人先以A法治疗,经过一定清洗期后再以B法治疗;另外6人先以B法治疗,后以A法治疗;记录血压下降值。结果见下表。数据见crossover.sav。试分析两种方案的疗效有无差别。阶段病人编号123456789101112IBBABAAAABBBA3.07 1.33 4.41.87 3.23.73 4.13 1.07 1.07 2.27 3.47 2.4IIAABABBBBAAAB2.81.47 3.73 3.62.67 1.62.67 1.73 1.47 1.87 3.47 1.73由于patient被看作是从一个总体中抽样得到的,所以
8、作为随机变量。WarningsPosthoctestsarenotperformedfor治疗方案becausetherearefewerthanthreegroups.如果对只有两个水平的变量,选择Posthoc,则不会给出结果。主要因素和误差项的平方和和自由度分别给出处理A和处理B之间疗效差异不显著(F=4.599,d.f.=1,10,p=0.058)四、拉丁方设计 拉丁方设计是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成区组的设计。在拉丁方设计中,每一行或每一列都成为一个完全区组,而每一处理在每一行或每一列都只出现一次。在拉丁方设计中,试验处理数=横行区组数=直列区组数=
9、试验处理的重复数。一、拉丁方简介(一)拉丁方以n 个拉丁字母A,B,C,为元素,列出一个n阶方阵,若这n个拉丁方字母在这n 阶方阵的每一行、每一列都出现、且只出现一次,则称该n阶方阵为nn阶拉丁方。例如:例如:A B B A B A A B 为为22阶拉丁方,阶拉丁方,22阶拉丁方只有这两个。阶拉丁方只有这两个。A B C B C A C A B 为为33阶拉丁方。阶拉丁方。(二)常用拉丁方最常用的有33,44,55,66阶拉丁方。下面列出部分标准型拉丁方,供进行拉丁方设计时选用。二、拉丁方设计方法二、拉丁方设计方法 下面结合具体例子说明拉丁方设计方法。为了研究5种不同温度对蛋鸡产蛋量的影响,
10、将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,由于各鸡群和产蛋期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组设置,以便控制这两个方面的系统误差。拉丁方设计步骤如下:(一)选择拉丁方先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。此例因试验因素为温度,处理数为5;将鸡群作为直列区组因素,直列区组数为5;将产蛋期作为横行区组因素,横行区组数亦为5。本例选取前面列出的第2个55标准型拉丁方,即:A B C D EA B C D EB A D E CB A D E CC E B A DC E B A DD C E B AD C E B
11、AE D A C BE D A C B(二)随机排列(二)随机排列 在选定拉丁方之后,若是非标准型,则可直接由拉丁方中的字母获得试验设计。若是标准型拉丁方,还应按下列要求对直列、横行和试验处理的顺序进行随机排列。55标准型拉丁方:先随机选择4个标准型拉丁方中的一个;然后将所有的直列、横行及处理都随机排列。下面对选定的55标准型拉丁方进行随机排列。先从随机数字表任意一行/列开始,向右连续抄录3个5位数,抄录时舍去“0”、“6以上的数”和重复出现的数。如得到的3个五位数字为:13542,41523,34521。然后将上面选定的55拉丁方的直列、横行及处理按这3个五位数的顺序重新随机排列。1、直直列
12、列随随机机 将将拉拉丁丁方方的的各各直直列列顺顺序序按按13542顺序重排。顺序重排。2、横行随机、横行随机 再再 将直列重排后的拉丁方将直列重排后的拉丁方的各横行按的各横行按41523顺序重排。顺序重排。3、把5种不同温度按第三个5位数34521顺序排列即:A=3,B=4,C=5,D=2,E=1,从而得出55拉丁方设计,如表所示。括号内的数字表示温度的编号,由表可以看出,第一鸡群在第个产蛋期用第2种温度,第二鸡群在第个产蛋期用第1种温度,等等。试验应严格按设计实施。试验结果如表所示。四、拉丁方设计的优缺点四、拉丁方设计的优缺点 (一)拉丁方设计的主要优点(一)拉丁方设计的主要优点 1、精确性
13、高拉丁方设计在不增加试验单位的情况下,比随机区组设计多设置了一个区组因素,能将横行和直列两个区组间的变异从试验误差中分离出来,因而试验误差比随机区组设计小,试验的精确性比随机区组设计高。2、试验结果的分析简便(二)拉丁方设计的主要缺点1.横行区组数、直列区组数、试验处理数与试验处理的重复数必须相等,所以处理数受到一定限制。2.若处理数少,则重复数也少,估计试验误差的自由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列区组数也多,导致试验工作量大,且同一单位组内试验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的试验。在采用4个以下处理的拉丁方设计时,为了使估计误
14、差的自由度不少于12,可采用“复拉丁方设计”,即同一个拉丁方试验重复进行数次,并将试验数据合并分析,以增加误差项的自由度。例:下面的表是家兔在不同部位注射某种药物后所生疱疹的大小。家兔共有六只,其编号为、III、。注射部位有六处,其代号为A、B、C、D、E、F,注射次序用1、2、3、4、5、6来表示。该表的读法是,第一次注射时1号兔在部位B处注射,所生疱疹大小为7.5平均厘米;号兔在部位E处注射,所生疱疹大小为8.5平方厘米;余类推。这里我们看到,这个资料是按家兔编号、注射部位、注射次序三个标志来分组的。试分析三种因素是否对疱疹大小有影响。拉丁方设计方差分析.sav在只考虑主效应的试验设计分析
15、中,不显著的因素最好不要从模型中排除。也可以显示不同兔子注射不同药物的皮疹面积的平均值。自己做一下。1.完全随机设计的ANOVA所关心的问题:一个处理因素不同处理水平间的均数有无差异?设立单位组(区组)的目的是控制混杂因素。使混杂因素在各处理水平间达到均衡,提高检验效率。2.随机区组设计的ANOVA第二节考虑交互作用的实验设计不考虑交互作用的实验设计:1.析因设计(factorial design)1.两个或以上处理因素的各处理水平间的均数有无差异?即主效应有无统计学意义?2.两个或以上处理因素之间有无交互作用?交互作用(Interaction):某一因素不同水平的均数随着另一因素不同水平的均
16、数改变而改变。没有交互作用的模型。不同的蛇毒浓度与瘤株的种类没有交互作用,所以这四条线几乎是平行的。从该图可以看出,两个因子效应综合效应是简单的加法。实例实例1 1:甲乙两药治疗高胆固醇血症的疗效(胆固:甲乙两药治疗高胆固醇血症的疗效(胆固醇降低值醇降低值mgmg),问),问甲乙两药是否有降低胆固甲乙两药是否有降低胆固醇的作用(醇的作用(主效应主效应)?)?两种药间有无两种药间有无交互作用交互作用完全随机的两因素完全随机的两因素2222析因设计析因设计析因设计的实例实例2:小鼠种别A、体重B和性别C对皮内移植SRS瘤细胞生长特征影响的结果(肿瘤体积cm3)问A、B、C各自的主效应如何?三者间有
17、无交互作用?完全随机的三因素完全随机的三因素222222析因设计析因设计实例实例3 3:研究小鼠在不同注射剂量和不同注射频次下:研究小鼠在不同注射剂量和不同注射频次下药剂药剂ACTHACTH对尿总酸度的影响。问对尿总酸度的影响。问AA、B B各自的各自的主效主效应应如何?如何?二者间有无二者间有无交互作用交互作用?随机区组的两因素随机区组的两因素3232析因设计析因设计2.析因设计的特点析因设计的特点p2个或以上(处理)因素(factor)(分类变量);p每个因素有2个或以上水平(level);p每一组合涉及全部因素,每一因素只有一个水平参与;p几个因素的组合中至少有2个或以上的观察值;p观测
18、值为定量数据(需满足随机、独立、正态、等方差的ANOVA条件)。3.两因素析因设计方差分析中的多重比较当双向方差分析拒绝无效假设时,需要进一步确定哪些水平间的效应差异存在统计学意义。当交互作用无统计学意义时,可直接对处理因素各水平的平均值进行比较。当交互作用有统计学意义时,必须用两因素各水平组合下的平均值进行比较。例:在治疗肝癌的药物研究中,为了提高治疗药物在靶器官肝脏的浓度,降低在非靶器官如心脏的浓度,行232析因设计,即设置3个因素,第一个因素有2个水平,第二个因素有3个水平,第三个因素有2个水平。将60只小鼠随机分为12组,观察指标为组织中丝裂霉素的浓度,结果见表。试做析因分析。“析因设
19、计方差分析.sav”Model:Fullfactorial当两因素有交互作用时,则各因素的主效应有无统计学意义没有适用价值。要比较各因素内各水平有无统计学意义,需要用lmatrix语句。先建立只含需要比较因素的模型,past,在syntaxeditor中再加/lmatrix变量名水平1vs水平3time10-1.等语句。UNIANOVAconsBYtime/METHOD=SSTYPE(3)/INTERCEPT=INCLUDE/CRITERIA=ALPHA(.05)/DESIGN=time/lmatrixtime15minvs60mintime10-1.给你的输出结果(表格)一个合适的名字 二、
20、正交设计 (一一)正交设计的基本概念正交设计的基本概念 正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。例如,影响某品种鸡的生产性能有3个因素:A因素是饲料配方,设A1、A2、A33个水平;B因素是光照,设B1、B2、B33个水平;C因素是温度,设C1、C2、C33个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能的组合有27种。如果试验方案包含各因素的全部水平组合,即进行全面试验,可以分析各因素的效应,交互作用,也可选出最优水平组合。这是全面
21、试验的优点。但全面试验包含的水平组合数较多,工作量大,由于受试验场地、试验动物、经费等限制而难于实施。若试验的主要目的是寻求最优水平组合,则可利用正交设计来安排试验。如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。3 因因 素素 3 水水 平平 的的 全全 面试验水平组合数为面试验水平组合数为33=27,4 因素因素3水平的全面试验水平组合数为水平的全面试验水平组合数为34=81,5因素因素3水平的全面试验水平组合数为水平的全面试验水平组合数为35=243,这在动物试
22、验中是不可能做到的。,这在动物试验中是不可能做到的。(二二)正交设计的基本原理正交设计的基本原理正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。上图中标有试验号的九个“()”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:(1)A1B1C1(2)A2B1C2(3)A3B1C3(4)A1B2C2(5)A2B2C3(6)A3B2C1(7)A1B3C3(8)A2B3C1(9)A3B3C2上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。对于A、B、C3个因素来说,是在27个全面试验点中选择9个试验点,仅是
23、全面试验的三分之一。从图中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。二、正交表及其特性二、正交表及其特性L8(27)正交表,其中“L”代表正交表;L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合);括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素。常用的正交表已由数学工作者制定出来,供进行正交设计时选用。2水平正交表除L8(27)外,还有L4(2
24、3)、L16(215)等;3水平正交表有L9(34)、L27(213)等(SPSSDataOrthogonal)。若在一项试验中有s个因素,每个因素各有q水平,用正交试验安排试验,则至少要作q2个试验,正交设计在挑选代表点时有两个特点:均匀分散,整齐可比。“均匀分散”使试验点有代表性;“整齐可比”便于试验数据的分析。为了保证“整齐可比”的特点,正交设计必须至少要求做q2次试验。(二二)正交表的特性正交表的特性 任何一张正交表都有如下两个特性:1、任一列中,不同数字出现的次数相等例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次。2、任两列中
25、,同一横行所组成的数字对出现的次数相等例如L8(27)中(1,1),(1,2),(2,1),(2,2)各出现两次;L9(34)中(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。(三三)正交表的类别正交表的类别 1、相同水平正交表各列中出现的最大数字相同的正交表称为相同水平正交表。如L4(23)、L8(27)、L12(211)等各列中最大数字为2,称为两水平正交表;L9(34)、L27(313)等各列中最大数字为3,称为3水平正交表。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 试验 设计 分析 方法
限制150内