DPS应用试验统计分析.pptx
《DPS应用试验统计分析.pptx》由会员分享,可在线阅读,更多相关《DPS应用试验统计分析.pptx(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、科学试验,由于受环境随机因素的干扰,使试验结果往往含有随机影响的成分。对试验结果中处理因素主效应、因素间互作效应及试验误差等变异来源的分析,是生物统计学的重要内容。第1页/共63页一、方差分析方差分析是科学试验中的常用工具,是生物统计分析的核心内容之一。在科学试验中,试验结果往往是变化的,这种变化大体上由两类因素引起。一类是受随机因素影响而产生的波动。这类影响在试验中常常是不能控制的,因而是不可避免的。另一类是人为控制因素的影响使试验结果产生变化。当这类因素对试验结果有显著影响时,必然会明显地改变试验结果,并同随机因素的影响一起出现。反之,当这类因素对试验结果无显著影响时,则相应的变化就不会明
2、显表现出来,从而使试验结果的变化基本上归结于随机因素的影响。科学试验的目的常常是为了判断这类受人们控制的因素对试验结果的影响是否确实存在。方差分析正是通过对试验结果数据变动的分析,对上述问题作出判断的有效工具。因为它可以将随机变动和非随机变动从混杂状态下分离开来,帮助我们发现起主导作用的变异来源,从而抓住主要矛盾或关键因素并采取有效措施。第2页/共63页(一)数据转换方差分析是以各数据来自独立、正态、等方差这一条件为前提,当正态、等方差的条件不满足时,应将原始数据进行转换以满足正态、等方差条件后再作方差分析。DPS 系统提供了4 种数据转换的常用手段。平方根转换:多适用于那些计数的数据资料分析
3、;对数转换:可用于百分率以及计数数据;反正弦平方根转换:常用于百分率数据的情形;倒数转换:常用于标准差和平均数成比例增长的一类数据。第3页/共63页(二)试验数据编辑整理格式1单因素方差分析数据编辑格式按处理次序,一行一个处理,行内依次输入该处理的各个区组(重复)的观察或测定值。处理重 复Ax11x12x13.x1mBx21x22x23.x2mC.Dxa1xa2xa3.xam第4页/共63页(二)试验数据编辑整理格式2 二因素试验方差分析数据编辑格式将数据按因素A、B 处理顺序在编辑器中输入。先输入A 因素的各处理后再输B 因素的处理,然后依次输入各处理中的重复。对于系统(巢式)设计和裂区设计
4、,也以类似形式编辑、排列试验结果数据。在巢式设计中,以A 因素作为处理组,B 因素作为亚组对待;在裂区试验中,以 A 因素作为主区,B 因素作为裂区对待。第5页/共63页(二)试验数据编辑整理格式2 二因素试验方差分析数据编辑格式A因素B因素重 复(观察值)11x111x112x113.x11m2x121x122x123.x12m.21x211x212x213.x21m2x221x222x223.x22m.1xa11xa12xa13.xa1m2xa21xa22xa23.xa2m.第6页/共63页(二)试验数据编辑整理格式3 多因素试验方差分析数据编辑格式观察数据按因素处理(因子)A、处理B,处
5、理K 以及区组(如果有重复的话)的顺序输入,即输入A 因素的各处理水平后再输B 因素的各一个处理水平,如果有重复的话,在一个处理中依次输入各处理中的重复观测值。若有两个因子,其A 因子有K 个处理,B 因子有L 个处理,各个处理重复N 次。其资料输入顺序为两因素试验的扩展。第7页/共63页(三)方差分析结果解释在进行试验结果的分析之前,我们必须在思想上牢记:要尽量地利用你对问题的非统计学知识。因为实验者在各自的领域内通常有独到的实践经验、受过正规的科学训练、具有高深的知识,这些都可用来分析因素和响应变量之间的关系,这在解释分析结果时是极其有用的,是统计学无法替代的。在进行方差分析结果解释时要点
6、如下:显著水平p值:方差分析表中,显著水平p值是推断试验处理间差异程度的指标。只有当显著水平p0.05时,一般才认为各个处理间确实存在着差异。区组效应分析:如区组间显著水平p0.05时,该试验还可靠吗?答案是肯定的。因为所以采用随机区组试验设计来安排试验,实质上是为了剔除,确切一点来说是分离因土壤、肥力、地势地貌等可能会导致的非人为处理差异。区组间显著水平p0.05时只说明这类差异确实存在,并且已从试验结果中分离出来。因此它不影响试验处理结果的解释。当然,区组间显著水平p0.05,说明试验条件更均衡些,非人为因素对试验结果的影响更小些。第8页/共63页(三)方差分析结果解释多重比较:一般来说,
7、只有当方差分析表中的显著水平p0.05时才能进一步作多重比较分析。多重比较可进一步检验各个处理间两两之间的差异。在进行多重比较时,必须注意各个处理之间是否存在互作,当交互作用项显著时,简单地分析各个处理间的差异并不是很好的做法。这时,一个因素(例如,A)的均值间的比较可能由于AB交互作用而模糊不清。对这一情况的一种做法是将因素B固定在一特定水平上,在此水平上对因素A的均值进行多重比较。当交互作用显著时,多重比较的另一个做法是比较所有ab个单元的均值,以便确定哪一些有显著性差异。在这一分析中,单元均值间的差异既包含了交互作用效应的,又包含了所有主效应的。多重比较结果:在DPS中,各个处理凡后面具
8、有相同字母者,表示它们之间的差异不显著;否则差异显著。第9页/共63页(四)单因素完全随机设计如:对以下四个小麦材料单株粒重资料(范濂,1983)进行方差分析及差异显著性测定。输入待分析资料定义成数据块进入主菜单,选择“试验统计完全随机设计单因素试验统计分析”,按回车键执行该选项功能。这时系统将会提示用户选择数据转换方式,如此时直接回车表示不转换。选择数据转换方式后回车,系统将立即给出分析结果第10页/共63页(五)单因素随机区组设计例如,小麦品比试验资料按随机区组试验设计所获得的产量(张全德等,1985)进行方差分析。将输入的待分析资料定义成数据块,然后进入主菜单,选择“试验统计随机区组设计
9、单因素试验统计分析”,按回车键执行该选项功能。这时系统将会提示用户选择数据转换方式,如此时直接回车表示不转换。选择数据转换方式后回车,系统将立即给出分析结果第11页/共63页(六)系统分组(巢式)设计系统分组(巢式)设计,即试验单向分组,每组分若干个亚组,每个亚组内又有若干个观测值。例:为研究一批玉米自交系的遗传参数,随机抽得21 个自交系,并以其中7 个为父本,每个皆随机地与3 个母本自交系杂交,共配成21 个组合。每一组合在田间种3 个小区,共63 个小区,完全随机区组排列。收获时考查了各个组合的数量形状。现试以每穗行数的结果(莫惠栋,1984)进行方差分析。定义数据块,然后进入主菜单,选
10、择“试验统计完全随机设计系统分组(巢式)设计分析”项,按回车后系统给出提示,输入处理组数(7),回车,系统将立即给出分析结果第12页/共63页(七)二因素(组内无重复)完全随机设计例如,在5 种不同温度下研究一种微生物的生长和温度的关系,于接种后不同天数测量其生长速度,获得一批观测数据(马育华,1982)。现以温度为类,接种后天数为组进行方差分析。将所输入数据定义成数据块,再进入主菜单,选择“试验设计完全随机设计分析二因素无重复试验设计分析”。按回车键执行该选项功能,按系统提示选择数据转换方式,如不转换就直接回车。执行选项功能后系统将立即给出分析结果第13页/共63页(八)二因素完全随机设计例
11、如,现有一组土壤、肥料试验数据,A 因素为3 种肥料处理,B 因素为3种土壤处理,每组合3 次重复。试根据试验结果(小麦产量)进行方差分析。定义数据块。菜单下“试验设计完全随机设计分析二因素有重复试验设计分析”。按系统提示输入因素处理数和因素处理数,然后再按提示选择数据转换方式,进行运算分析并输出结果。第14页/共63页(九)二因素随机区组设计同(八):重复=区组执行“试验设计方差分析二因素完全随机区组设计”功能项第15页/共63页(十)多因素随机 区组设计现有一试验结果,其中A 因素2 个处理水平,B 因素2 个处理水平,C 因素2 个处理水平,D 因素5 个处理水平,9 个重复。分析时,按
12、提示输入各个处理及重复的个数(如下图):第16页/共63页(十一)裂区试验设计首先将整个试验区分成几个大区,在每个大区内安排比较容易表现出差异的因素的几种处理,它们常称为主处理,然后在主处理所在各区内引进第二类因素的各个处理,它们称为副处理。实践中,某些因为需要占用较大范围,而另一些则需较小范围即可,通常需要占大范围的因素恰恰是容易表现出差异的因素。裂区设计在这种情形下是很适用的。第17页/共63页(十一)裂区试验设计1两因素裂区设计例如(右图)进入主菜单,选择执行“双因素裂区设计分析”功能项。第18页/共63页(十一)裂区试验设计2三因素裂区试验设计三因素裂区试验,根据试验设计的不同可分为2
13、 种类型:第一种是在主区安排两个处理因素,副区安排一个处理因素(AB+C);第二种是在主区安排一个处理因素,裂区安排两个处理因素(A+BC)。这类试验设计及其统计分析较为复杂,但如试验有这种需要,则往往一个试验可以解决较多的实际问题,故亦颇有用处。第19页/共63页(十一)裂区试验设计2.1 主区两因素、裂区一个因素(AB+C)试验统计分析某作物病害防治试验,主区为作物播种期和种子药剂处理,播种分3个时期:A1,A2,A3;种子药剂处理分2个水平:B1,B2;裂区为作物收获期,分3个水平:C1,C2,C3。定义成数据块后,执行主区两因素、副区一因素的AB+C裂区试验统计分析。在分析过程中,系统
14、会提示输入主处理1的水平个数、主处理2的水平个数及副区处理水平数第20页/共63页(十一)裂区试验设计2.2 主区一因素、裂区两因素试验(A+BC 型)统计分析同(AB+C型)定义成数据块后,应执行主区一因素、副区两因素的A+BC 型裂区试验统计分析。在分析过程中,系统会提示输入主处理 的水平个数及副区处理1、副区处理2 的水平个数第21页/共63页(十一)裂区试验设计3裂裂区试验统计分析例如,在前面的3 因素裂区实验中,药剂不是种子处理,而是出苗后喷洒施药,这时的试验设计可按裂裂区方式进行:主区为播种期,分3个水平:A1,A2,A3;裂区为施药处理,分2 个水平:B1,B2;再裂区为作物收获
15、期,分3个水平:C1,C2,C3。因裂区试验设计较为复杂,在DPS下,只需在工作表中按主区、裂区、裂裂区的顺序,将各个处理因素的各个水平编辑输入,然后用鼠标选中(上图)。再执行“试验设计三因素裂裂区设计”,系统弹出输入区组数目对话框。输入区组数后,点“OK”,即可得到裂裂区试验设计方案。第22页/共63页二、一般线性模型(GLM)试验设计的种类多种多样,应用前面介绍的根据变异来源将总平方和进行分解的各种类型的方差分析技术,只适用于平衡数据,即方差分析模型中每个子类的观察数据个数(也称次级样本容量)相等的情况。实际上,在科学试验中,试验者起初设计的一个完整试验,可能因为在试验过程中出现一些不可预
16、见、难以避免的因素,导致在结果中失去了一些观察值,最后得到的是不完整、非平衡的试验数据。另外,我们可能为一些特殊目的,有意设计一些不平衡的试验。如某些处理组合的试验做起来花费较大或更为困难,因此,在这些单元中可能会少做一些重复;而另外一些处理组合对试验者来说有更大的兴趣,因为这些组合有可能是一些新的或从未研究过的状况,试验者会计划在那些组合上多做几次重复。这样,每个处理的样本数量多少不同时,一般称为非平衡数据。第23页/共63页二、一般线性模型(GLM)面对非平衡数据方面的问题,Goodnight 在20 世纪70 年代提出了一种将方差分析模型作为线性回归模型进行处理的新方法。他将试验数据先拟
17、合线性回归模型,再用一般的回归显著性检验方法检验主效应和交互作用效应的平方和的一般线性模型(general linear model,GLM)采用一般线性模型技术,不仅能对各种各样的有平衡试验数据的试验设计进行方差分析,解决了试验设计数据处理技术通用化的问题;而且还能对各种试验设计,当试验结果里面各个处理(或水平)的数据不相等、非平衡的情况下进行方差分析。GLM 模型功能很强,可用于各种类型的方差分析。第24页/共63页二、一般线性模型(GLM)DPS 对试验数据进行分析前,先编辑定义数据矩阵,数据矩阵的左边放试验设计处理因子(定性变量),最右边输入试验结果。如果有定量变量(协变量),定量变量
18、放在因变量的左边、定性变量的右边,一行一个样本(试验处理组合)。然后将各个处理因子和试验结果一起定义成数据矩阵。定义数据矩阵后,在主菜单上选择“试验统计”“一般线性模型(GLM)”。此时系统会显示下图所示的方差分析模型参数选择界面。第25页/共63页方差变异来源项列表,用方差变异来源项列表,用A A,B B,大写字母分大写字母分别表示所定义的数据块中的第别表示所定义的数据块中的第1 1,第,第2 2,列试列试验因子,如果有协变量,协变量分别以验因子,如果有协变量,协变量分别以x x1 1,x x2 2,表示。在这里,可选取或剔除方差模型中表示。在这里,可选取或剔除方差模型中的变异来源。的变异来
19、源。左边窗口中,选择需要分析的变异来源项目,左边窗口中,选择需要分析的变异来源项目,点击点击 按钮,加载到右边窗口中。点击按钮,加载到右边窗口中。点击按钮,按钮,会把所有的变异来源加载到右边窗口中。会把所有的变异来源加载到右边窗口中。对于选择进来的变异来源项目,双击鼠标可指定该对于选择进来的变异来源项目,双击鼠标可指定该项目的方差分析的误差项。双击后会在上部的编辑项目的方差分析的误差项。双击后会在上部的编辑框中出现该变异来源的名称,后面跟有分隔符框中出现该变异来源的名称,后面跟有分隔符“/”,这时双击其它项目,系统将会把这些项目加载到,这时双击其它项目,系统将会把这些项目加载到后面作为误差项,
20、误差项的组成可以是多个误差的后面作为误差项,误差项的组成可以是多个误差的和。和。如指定某一变异来源项目再右击鼠标,则会弹出菜如指定某一变异来源项目再右击鼠标,则会弹出菜单。这时可对该变异来源项目进行操作。单。这时可对该变异来源项目进行操作。在用户界面右边,是一些统计分析的选择项:在用户界面右边,是一些统计分析的选择项:平方和分解类型的选择:系统缺省设置平方和分解类型的选择:系统缺省设置是是III III 型平方和分解方式,可根据需要进型平方和分解方式,可根据需要进行选择。行选择。定性变量编码方法:方差分析时定性变定性变量编码方法:方差分析时定性变量编码方法应采用第二项,即效应编码。量编码方法应
21、采用第二项,即效应编码。如进行数量化理论如进行数量化理论I I分析,则选择第一项适分析,则选择第一项适宜些。宜些。多重比较方法:这里共提供了多重比较方法:这里共提供了6 6 种,可种,可根据需要来选取,缺省的设置是根据需要来选取,缺省的设置是TukeyTukey方法。方法。作为参照的类别:在方差分析里不重要,作为参照的类别:在方差分析里不重要,可不必管它。只是有时在作数量化理论可不必管它。只是有时在作数量化理论I I分分析,可根据专业的要求来设置,以便于回析,可根据专业的要求来设置,以便于回归系数的解释。归系数的解释。输出回归方程:当模型主要任务是因子输出回归方程:当模型主要任务是因子量化,建
22、立定量的回归模型时,需要输出量化,建立定量的回归模型时,需要输出回归方程。回归方程。在上面各个项目设置完后,点击在上面各个项目设置完后,点击“确定确定”按钮,按钮,便可实施统计计算。如进行一般的单因素方差便可实施统计计算。如进行一般的单因素方差分析,或随机区组方差分析,或一般的析因设分析,或随机区组方差分析,或一般的析因设计方差分析,左边的菜单选择项可不考虑。计方差分析,左边的菜单选择项可不考虑。第26页/共63页(一)一般方差分析的GLM 模型一般方差分析问题,即试验误差固定、整个模型只要一个误差项固定效应模型的GLM模型分析。这类试验设计有完全随机设计、随机区组设计、拉丁方设计、正交拉丁方
23、设计、不完全区组设计、析因设计、混杂设计、分式设计及正交设计等。应用GLM于这类设计的方差分析,相对较简单,即只需要将待分析的项目(变异来源)根据需要选入即可。GLM模型,用于单因素、二因素的完全随机设计、随机区组设计的方差分析,主要是针对有缺失数据,即非平衡数据情形。平衡数据可用前面介绍的各种方差分析方法,既直观又省事。第27页/共63页例例:某工程师研究在一装配操作中:某工程师研究在一装配操作中5 5种照明水平对产生次品的种照明水平对产生次品的影响。因为在该试验中,时间也许是一个影响因素,她决定影响。因为在该试验中,时间也许是一个影响因素,她决定进行进行5 5个区组试验,每个区组是一星期的
24、一天。同时,该试验个区组试验,每个区组是一星期的一天。同时,该试验含有含有5 5个工作站,这些站也可能是变异的潜在来源。该工程师个工作站,这些站也可能是变异的潜在来源。该工程师决定采用尤顿方设计,它具有决定采用尤顿方设计,它具有5 5天、天、5 5个工作站和个工作站和5 5个照明强度个照明强度处理。处理。该试验的各个处理在该试验的各个处理在DPSDPS电子表格中整理格式如右图阴影部分。电子表格中整理格式如右图阴影部分。分析时只需要将分析时只需要将A A、B B和和C C这这3 3个主效应选入即可,个主效应选入即可,即从可供分析的变异来源的选择框中选择即从可供分析的变异来源的选择框中选择A A,
25、B B和和C(C(分别代表天、工作站和照明处理分别代表天、工作站和照明处理)并加载到右边并加载到右边框中;多重比较采用缺省的框中;多重比较采用缺省的TukeyTukey方法。点击确定方法。点击确定按钮按钮第28页/共63页(一)一般方差分析的GLM 模型方差分析结果表明:日期和工作站之间差异不显著,照明处理间差异极显著。并从结果可以看出照明处理在调整后的各个水平间的差异。第29页/共63页(二)混合效应模型方差分析当处理因子都是随机因子,相应的方差分析模型就称为随机效应模型;若既有选择型因子,又有随机型因子时,则称混合效应模型。混合模型的方差分析、平方和的分解和固定模型相同,但无效假设和F 统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DPS 应用 试验 统计分析
限制150内