《水稻地方品种月亮谷与稻瘟病菌的互作转录组分析.ppt》由会员分享,可在线阅读,更多相关《水稻地方品种月亮谷与稻瘟病菌的互作转录组分析.ppt(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试验设计与方差分析试验设计与方差分析12 单因素试验设计单因素试验设计全分组试验设计全分组试验设计:完全随机排列设计完全随机排列设计;随随机区组设计机区组设计;拉丁方设计拉丁方设计。不全分组试验设计不全分组试验设计:分格设计分格设计完全随机排列设计完全随机排列设计(Completely Randomized Design,CRD)4种处理方法下(处理A,B,C,D),进行5次重复的CRD田间试验设计。1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1.确定所需试验点总数确定所需试验点总数n,n由试验处理方法由试验处理方法的数量和试验重复次数
2、决定。的数量和试验重复次数决定。2.随机分配处理方法到各个试验点随机分配处理方法到各个试验点用计算机产生用计算机产生20个随机数,分别对应个随机数,分别对应1-20号田。号田。随机数表法选择20个随机数后,按选择顺序编排序号随机数随机数 序号序号随机数随机数 序号序号9371918111492772129083243133614494149535704157496549161807957179518157180189571194271022620随机数表法选择20个随机数,按大小顺序排序随机数随机数 序号序号大小顺序大小顺序 随机数随机数 序号序号大小顺序大小顺序937117918111614
3、9227721214908315243136636147494149953519704151274961354916101807495717209518181571830189157119114271082262053.将选定的随机数按从小到大排列顺序将选定的随机数按从小到大排列顺序。4.将按大小排序后的随机数进行分组,即将将按大小排序后的随机数进行分组,即将第三步中排列好的第三步中排列好的n个数分为个数分为t组,每组中含组,每组中含有有r个数。个数。将选择的将选择的20个随机数按选择顺序进行分组个随机数按选择顺序进行分组组别组别 各组内的田块顺序号各组内的田块顺序号1172157192134
4、18183161469124102031151 B2 A3 D4 B5 D6 C7 A8 B9 C10 D11 D12 C13 B14 C15 A16 C17 A18 B19 A20 D5.数据分析试验重复因子水平 1 2 3 4 5 平均数Ax11x12x13x14x15Bx21x22x23x24x25Cx31x31x32x33x34Dx41x41x42x43x44(总平均)方差来源自由度平方和(SS)均方(MS)F值处理效应 t-1SS处理效应SS处理效应/t-1MS处理效应/MS误差试验误差tr-tSS误差SS误差/tr-t总和(r)(t)-1SS总案例分析案例分析通过田间试验判别通过田
5、间试验判别6种不同化学杀虫剂对某地种不同化学杀虫剂对某地区水稻灰飞虱和水稻主要蛀茎害虫的防控效果区水稻灰飞虱和水稻主要蛀茎害虫的防控效果(Gomez 和和 Gomez,1984)。)。基本情况:针对以水稻灰飞虱为代表的主要水基本情况:针对以水稻灰飞虱为代表的主要水稻蛀茎害虫的化学防治措施,选用稻蛀茎害虫的化学防治措施,选用6种不同化种不同化学杀虫剂(或不同剂量)在一代成虫扩散高峰学杀虫剂(或不同剂量)在一代成虫扩散高峰期和第期和第2、3代若虫盛孵高峰期,进行集中歼灭,代若虫盛孵高峰期,进行集中歼灭,以控制害虫直接为害和传毒。在水稻收获期,以控制害虫直接为害和传毒。在水稻收获期,调查各试验点平均
6、水稻产量来反映不同杀虫剂调查各试验点平均水稻产量来反映不同杀虫剂(或不同剂量)对害虫的化学防控效果。(或不同剂量)对害虫的化学防控效果。单因子试验的一般概述 在一个试验中只考察一个因子A及其r个水平A1,A2,Ar在水平Ai下重复mi次试验,总试验次数n=m1+m2+mr记yij是第i个水平下的第j次重复试验的结果,这里i 水平号,j 重复号经过随机化后,所得的n个试验结果列于下表:单因子试验的数据单因子试验的数据单因子试验的三项基本假定单因子试验的三项基本假定 1.正态性正态性。在水平i下的数据yi1,yi2,yimi是来自正态总体的一个样本,i=1,2,r2.方差齐性方差齐性。r个正态总体
7、的方差相等,即3.随机性随机性。所有数据yij都相互独立 单因子试验所涉及的多个正态总体 单因子试验的统计模型单因子试验的统计模型 其中 是因子A的第i个水平下第j次试验结果;是因子A的第i个水平的均值,是待估参数;是因子A的第i个水平下第j次试验误差,它们是相互独立同分布的随机变量由此可知:单因子试验的三项基本假定用到试验数据yij上去,可得到如下统计模型:单因子方差分析单因子方差分析总平方和的分解公式总平方和的分解公式总平方和的分解公式总平方和的分解公式各平方和的计算各平方和的计算均方和均方和F检验检验方差分析表方差分析表单因素方差分析的实现单因素方差分析的实现Excel 数据统计分析R
8、函数 aov()?aovaov(formula,data=NULL,projections=FALSE,qr=TRUE,contrasts=NULL,.)例 利用四种不同配方A1,A2,A3,A4生产出来的钾肥,请采用适当的试验方法检测其对TR杂交稻产量的影响(不考虑其他因素)。若试验实施后,测得不同配方下TR杂交稻的产量如下表所示,问:四种配方的钾肥对TR杂交稻的产量是否有显著性差异?配方配方产量产量(kg)A11600161016501680170017001780A215001640140017001750A316401550160016201640160017401800A415101
9、5201530157016401600例例 以以multcomp包中的包中的cholesterol数据集为例,数据集为例,检验检验5种治疗法降低胆固醇效果间是否有显著性差种治疗法降低胆固醇效果间是否有显著性差异?异?cholesterol数据集包含了数据集包含了5种治疗方法,其中种治疗方法,其中前三种的药物相同,治疗方法不同,分别是前三种的药物相同,治疗方法不同,分别是20mg一天一天1次,次,10mg一天一天2次,次,5mg一天一天4次,剩下为次,剩下为另外两种药物另外两种药物drugD,drugE.如何获取和查看数据?如何获取和查看数据?方差分析和作图?方差分析和作图?均值多重比较?均值多
10、重比较?随机区组设计(随机区组设计(Randomized Complete Block Design,RCB)第一步,区组划分(第一步,区组划分(Blocking)。)。先将试验区划分为相同面积的几个区组,每先将试验区划分为相同面积的几个区组,每一区组内所包含的田块数由试验中预先设定一区组内所包含的田块数由试验中预先设定的处理数决定,并且各田块的面积相同。因的处理数决定,并且各田块的面积相同。因此,此,“区组区组”可理解为是在某一小区域内的可理解为是在某一小区域内的“田块组田块组”,且每一,且每一“区组区组”内所包含的田内所包含的田块数和面积都是相同的。块数和面积都是相同的。第二步,每一区组内
11、随机分配全部处理方法。第二步,每一区组内随机分配全部处理方法。6种处理方法(处理种处理方法(处理A,B,C,D,E,F)下,进行)下,进行4次重次重复的复的RCB田间试验田间试验。1.假设本例中可预测有一个主要影响因素存假设本例中可预测有一个主要影响因素存在,且沿着水平方向呈一定的梯度变化,在,且沿着水平方向呈一定的梯度变化,同时试验田不受呈垂直梯度变化影响因素同时试验田不受呈垂直梯度变化影响因素的影响的影响。将区组划分为长方形,且垂直于将区组划分为长方形,且垂直于影响因素的梯度变化方向依次排列。试验影响因素的梯度变化方向依次排列。试验田划分为田划分为4个等面积的区组。个等面积的区组。2.将每
12、个区组平均划分为将每个区组平均划分为t个田块。本例中共个田块。本例中共含有含有6种处理方法,故将每个区组内划分为种处理方法,故将每个区组内划分为等面积的等面积的6个田块个田块。梯度变化方向梯度变化方向1234梯度变化方向梯度变化方向12341 C 4 E 2 D 5 B 3 F 6 A 1 A 4 C 2 E 5 D 3 F 6 B 1 F 4 A 2 D 5 B 3 C 6 E 1 E 4 A 2 C 5 F 3 D 6 B 方差来源自由度(d.f.)平方和(SS)均方(MS)F值重复效应(r-1)SS重复(SS重复)/(r-1)(MS重复)/(MS误差)处理效应(t-1)SS处理效应(SS
13、处理效应)/(t-1)(MS处理效应)/(MS误差)试验误差(t-1)(r-1)(SS误差)(SS误差)/(t-1)(r-1)总和(tr-1)SS总案例分析案例分析通过田间试验判别通过田间试验判别6种不同化学杀虫剂对某地种不同化学杀虫剂对某地区水稻灰飞虱和水稻主要蛀茎害虫的防控效果区水稻灰飞虱和水稻主要蛀茎害虫的防控效果(Gomez 和和 Gomez,1984)。)。基本情况:针对以水稻灰飞虱为代表的主要水基本情况:针对以水稻灰飞虱为代表的主要水稻蛀茎害虫的化学防治措施,选用稻蛀茎害虫的化学防治措施,选用6种不同化种不同化学杀虫剂(或不同剂量)在一代成虫扩散高峰学杀虫剂(或不同剂量)在一代成虫
14、扩散高峰期和第期和第2、3代若虫盛孵高峰期,进行集中歼灭,代若虫盛孵高峰期,进行集中歼灭,以控制害虫直接为害和传毒。在水稻收获期,以控制害虫直接为害和传毒。在水稻收获期,调查各试验点平均水稻产量来反映不同杀虫剂调查各试验点平均水稻产量来反映不同杀虫剂(或不同剂量)对害虫的化学防控效果。(或不同剂量)对害虫的化学防控效果。随机化完全区组设计的数据随机化完全区组设计的数据 随机化完全区组设计的统计模型随机化完全区组设计的统计模型 参数估计 总平方和分解公式平方和的性质随机化完全区组设计的方差分析表 例4 考察4种不同品种的种子和3种不同施肥量。假设作物品种与施肥量间无交互作用,设计相应试验分析作物
15、品种和施肥量对产量有无影响。假设经试验后得到作物产量如下表所示,试分析作物品种和施肥量对产量有无显著性影响。N1N2N3V1325292316V2317310318V3310320318V4330370365例5 研究树种和地理位置对松树生长的试验。分别对4个地区的3种同龄松树直径进行测量后如下表所示,因素A 表示树种,因素B表示地区,每种水平组合重复测量5次。理论经验认为树种和地理位置间存在交互作用。试对以下结果进行方差分析,并判别不同因素对松树生长的影响。B1B2B3B4A123201620A228261926A318211922A125171921A230241826A315252323
16、 Y=c(23,25,21,14,15,20,17,11,26,21,16,19,13,16,24,20,21,18,27,24,28,30,19,17,22,26,24,21,25,26,19,18,19,20,25,26,26,28,29,23,18,15,23,18,10,21,25,12,12,22,19,23,22,14,13,22,13,12,22,19)拉丁方设计(拉丁方设计(Latin Square Design,LS)拉丁方设计(拉丁方设计(LS)就可以解决同时出现两个)就可以解决同时出现两个方向梯度变化因素的田间试验方向梯度变化因素的田间试验。1.将试验区域分为横、纵若干行
17、和列,且横、将试验区域分为横、纵若干行和列,且横、纵的试验点数相同。纵的试验点数相同。LS方法中行组和列组的方法中行组和列组的划分等同于划分等同于RBC设计中按两个梯度变化方向设计中按两个梯度变化方向相互垂直的影响因素划分出的两个区组相互垂直的影响因素划分出的两个区组,并且行列互为重复实验组。并且行列互为重复实验组。2.按照随机化原则排列全部处理方法在每行、按照随机化原则排列全部处理方法在每行、列中的顺序列中的顺序。LS设计是设计是RBC设计的一种特殊情况,是研究具设计的一种特殊情况,是研究具有两个不同变化方向影响因素的有两个不同变化方向影响因素的RBC设计设计。一般情况下,我们将试验处理方法
18、外,明显影一般情况下,我们将试验处理方法外,明显影响研究对象且变化方向相互垂直的两个因素作响研究对象且变化方向相互垂直的两个因素作为为LS分组依据。分组依据。如研究一定区域内昆虫迁移方向和土壤肥力变如研究一定区域内昆虫迁移方向和土壤肥力变化都是影响作物产量的重要因素(两个因素间化都是影响作物产量的重要因素(两个因素间无相互作用关系),并且两个因素的变化方向无相互作用关系),并且两个因素的变化方向刚好相互垂直,就可采用刚好相互垂直,就可采用LS设计。随时间变化设计。随时间变化进行重复的进行重复的RBC试验中,可将不同时间点最为试验中,可将不同时间点最为一个分组依据,采用一个分组依据,采用LS方法
19、进行设计和分析。方法进行设计和分析。含含5种处理方法(处理种处理方法(处理A,B,C,D,E)的)的LS试验设计试验设计1.选择一个选择一个55的的LS设计表设计表。2.保证每行、每列都包含一组完整的处理方法保证每行、每列都包含一组完整的处理方法,选择适当的正方形田块作为试验区,并等选择适当的正方形田块作为试验区,并等距离划分为距离划分为5行行5列,列,共共25个试验点。个试验点。ABCDEBAECDCDAEBDEBACECDBA3.按照随机数按照随机数法法将原将原LS设计表中每一行、列的设计表中每一行、列的位置顺序重新排列。位置顺序重新排列。123451BAECD2AEDBC3CDBEA4D
20、BCAE5ECADB方差来源自由度(d.f.)平方和(SS)均方(MS)F值行效应(n-1)SS行(SS行)/(n-1)(MS行)/(MS误差)列效应(n-1)SS列(SS列)/(n-1)(MS列)/(MS误差)处理效应(n-1)SS处理效应(SS处理效应)/(n-1)(MS处理效应)/(MS误差)试验误差(n-1)(n-2)SS误差(SS误差)/(n-1)(n-1)总和n2-1SS总多因子随机实验数据的方差分析案例分析案例分析通过田间试验,检验通过田间试验,检验4个甘薯品种(个甘薯品种(A,B,C,D)抗病(甘薯瘟)能力是否存在显著性差)抗病(甘薯瘟)能力是否存在显著性差异,如果存在差异,以
21、原有品种异,如果存在差异,以原有品种B作为对照作为对照组,选择一个抗病能力更强的品种进行大组,选择一个抗病能力更强的品种进行大面积推广面积推广。平衡分格设计(平衡分格设计(Balanced Lattice design,BL)BL设计一般用于试验处理方法较多的试验设计一般用于试验处理方法较多的试验。1.实验水平实验水平总数总数 ,区组数,区组数k=2.试验重复数试验重复数r=t+1 若含有若含有25种处理方法的种处理方法的BL试验,应设置试验,应设置5个个区组,并进行区组,并进行6次重复;含有次重复;含有36种处理方法种处理方法的的BL试验,应设置试验,应设置6个区组个区组 9种处理方法的试验
22、为例说明种处理方法的试验为例说明BL设计基本步骤设计基本步骤选选3个试验区组个试验区组,每区组内含每区组内含3个试验点个试验点,共设共设4个重复区组个重复区组。重复1重复2重复3重复4区组1区组2区组3选择一个选择一个BL基本设计表基本设计表区组序号处理方法序号重复1重复2重复3重复4112314715916824562582672493789369348357对以上对以上33 BL试验处理基本设计表分别进试验处理基本设计表分别进行行3次随机排列次随机排列(随机排列重复、区组和(随机排列重复、区组和试验点)试验点),保证每次随机排列间相互独立。,保证每次随机排列间相互独立。双因素实验设计双因素
23、实验设计双因素随机区组试验设计双因素随机区组试验设计双因素裂区设计(双因素裂区设计(Split-Plot Design,SPD)交互作用双因素随机区组试验设计双因素随机区组试验设计客观条件保持一致的前提下,研究客观条件保持一致的前提下,研究5种氮肥种氮肥管理方法对管理方法对3种不同品种水稻产量的影响,种不同品种水稻产量的影响,试验进行试验进行4次重复次重复。品种氮肥施用量(kg/ha)N0N1N2N3N4V1V1 N0V1 N1V1 N2V1 N3V1 N4V2V2 N0V2 N1V2 N2V2 N3V2 N4V3V3 N0V3 N1V3 N2V3 N3V3 N4用随机数表法相互独立地随机分配
24、用随机数表法相互独立地随机分配15种处种处理方法到每一个区组内理方法到每一个区组内。1234V3 N2V3 N0V2 N4V2 N1V1 N3V1 N4V3 N4V3 N1V2 N0V1 N1V1N2V1 N0V2 N3V3 N3V2 N2V3 N2V3 N0V2 N4V2 N1V1 N3V1 N4V3 N4V3 N1V2 N0V1 N1V1N2V1 N0V2 N3V3 N3V2 N2V3 N2V3 N0V2 N4V2 N1V1 N3V1 N4V3 N4V3 N1V2 N0V1 N1V1N2V1 N0V2 N3V3 N3V2 N2V3 N2V3 N0V2 N4V2 N1V1 N3V1 N4V3
25、 N4V3 N1V2 N0V1 N1V1N2V1 N0V2 N3V3 N3V2 N2双因素试验中总离差平方和可按照两步骤分解SS总=SS处理方法+SS试验误差,SS处理方法=SS因子1+SS因子2+SS因子1因子2方差来源方差来源自由度(自由度(d.f.)平方和(平方和(SS)均方(均方(MS)F值值重复效应重复效应(r-1)SS重复效应重复效应SS重复效应重复效应/(r-1)(MS重复重复效应效应)/(MS误差误差)处理效应处理效应(ab-1)SS处理效应处理效应SS处理效应处理效应/(ab-1)(MS处理处理效应效应)/(MS误差误差)因素因素A效应效应(a-1)SSASSA/(a-1)(
26、MSA)/(MS误差误差)因素因素B效应效应(b-1)SSBSSB/(b-1)(MSB)/(MS误差误差)A AB效应效应(a-1)()(b-1)SSA ABSSA AB/(a-1)(b-1)(MSA AB)/(MS误差误差)试验误差试验误差(r-1)(a-1)(b-1)SS误差误差SS误差误差/(r-1)(a-1)(b-1)总和总和(rab-1)SS总总r表示试验重复次数,a表示因子A包含的水平数,b表示因子B包含的水平数,ab表示处理方法总数。双因素裂区设计(双因素裂区设计(Split-Plot Design,SPD)1.将试验区分为将试验区分为“主田块主田块”随机分配因素随机分配因素A2
27、.“主田块主田块”上上分割分割“次田块次田块”随机分配因素随机分配因素B 故故SP设计中每设计中每一一主田块就是一个区组,次田块主田块就是一个区组,次田块是区组内的不同处理方法,主次田块相结合就是区组内的不同处理方法,主次田块相结合就是双因素试验中的所有处理水平。是双因素试验中的所有处理水平。衡量主田块因子效应的精度会降低,衡量主田块因子效应的精度会降低,衡量次田块因子效应的精度会提高衡量次田块因子效应的精度会提高。主主/次田块因子选择标准次田块因子选择标准1.因子效应精度因子效应精度:更关注的因子:更关注的因子=次田块因子次田块因子2.因子效应大小因子效应大小:若两个因子所受关注度相当,:若
28、两个因子所受关注度相当,则引起较小差异因子则引起较小差异因子=次田块因子次田块因子3.农田的客观要求农田的客观要求:影响面积较大,影响范围影响面积较大,影响范围较广较广的因子的因子=主主田块因子田块因子 研究研究4个品种水稻在个品种水稻在6种氮肥管理方法下产种氮肥管理方法下产量是否有显著性差异,试验进行量是否有显著性差异,试验进行3次重复次重复。(本例中侧重于水稻品种选择,故将水稻品种设为次田块因素,氮肥施用量设为主田块因素。)1.根据试验重复次数将试验区域划分为3个区组(主田块),每一区组内划分6个等面积的带状田块。123456重复1123456重复2123456重复3随机分配6种处理方法到
29、3个试验区组内。431652重复1165243重复2614532重复3每一次田块内等面积划分为4个田块。随机分配4种处理方法到18个次田块。N213414231243231443213214重复1132441233412124314233241重复2421334123241132423411423重复34 3 1 6 5 2 1 6 5 2 4 3 6 1 4 5 3 2VVVV方差来源方差来源自由度(自由度(d.f.)平方和(平方和(SS)均方(均方(MS)F值值重复效应重复效应r-1=2主田块主田块 处理效应处理效应a-1=5主田块主田块 试验误差试验误差(r-1)(a-1)=10次田块次
30、田块 处理效应处理效应b-1=3交互效应交互效应(a-1)(b-1)=15次田块次田块 试验误差试验误差a(r-1)(b-1)=36总和总和rab-1=71多因子试验与正交设计多因子试验与正交设计多因子试验问题多因子试验问题在实际问题中,影响指标的因子往往有很多个,要考察它们就要涉及多因子的试验设计问题。如果有10个因子对指标有影响,每个因子取2个水平进行比较,有210=1024个不同组合每个因子取3个水平进行比较,有310=59049个不同组合正交表符号 Ln(qP)L 正交表代号;n 表的行数,不同条件的实验个数;q 因子水平数;p 表的列数,因子数。正交表三水平正交表:“9”表示表的行数
31、,即试验要做9个不同条件的试验不同条件的试验;“4”表示表的列数,即试验最多可安排4个因子因子;“3”表示表的主体只有3个不同的数字,试验时每个因子应取3个不同水平不同水平。(1)每列中不同的数字重复次数相同每列中不同的数字重复次数相同。在表L9(34)中,每列有3个不同数字:1,2,3,每一个各出现3次。在表L8(27)中,每列有2个不同数字:1,2,每一个各出现4次。(2)将任意两列的同行数字看成一个数对,那么一切可能数对重将任意两列的同行数字看成一个数对,那么一切可能数对重复次数相同复次数相同。表L9(34)中,任意两列有9种可能的数对:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一对各出现一次。在表L8(27)中,任意两列有4种可能的数对:(1,1),(1,2),(2,1),(2,2),每一对各出现二次。无交互作用情况下的正交设计例 1 为提高某种化学产品的转化率,考虑三个因素(反应温度、反应时间和用碱量),各个因素选取三个水平,如何用正交表安排实验得到较好方案?如做全面实验,共需要?次实验?若选用正交表进行实验,可以选择哪种正交表?数据的方差分析 有交互作用情况下的正交设计数据的方差分析
限制150内