实验设计概述讲稿.ppt
实验设计概述第一页,讲稿共三十七页哦Writing scientific paperAll measurements were replicated three times;mean values&standard deviations were reported for each case.Analyses of variance (ANOVA)and Tukeys test were performed on SPSS to evaluate the significance of differences among mean values.第二页,讲稿共三十七页哦第一章 试验设计概述n主要内容:n试验设计方法的发展过程n试验设计的重要意义n试验设计的定义及类型n试验设计的要素与原则n试验设计与统计分析在食品科学研究中的作用n常用的统计分析软件第三页,讲稿共三十七页哦一、试验设计方法的发展过程n始于20世纪20年代,至今已有80多年的历史。其发展分三个阶段:n第一阶段:早期的方差分析法(20世纪20年代由英国生物统计学家、数学家费希尔(R.A.Fisher,1890-1962)提出)应用于农业、生物学、遗传学等方面,取得了巨大的成功,开创了一门新的应用技术学科。n第二阶段:传统的正交试验设计法(1949 年日本的田口玄一创造)n第三阶段:稳健(robust)设计针对产品的质量管理,消除误差因素来提高产品的性能。第四页,讲稿共三十七页哦试验设计在中国的发展n20世纪50年代开始研究,晚了30年,但有创新,编出了一套适用的正交表,简化了试验程序和试验结果分析方法,创立里简单易学、行之有效的正交试验设计法;n华罗庚:1964年以后的20多年间,在国内积极倡导优选法(黄金分割法),使试验设计的概念得到普及;n数学家王元和方开泰:1978年首先提出均匀设计(Uniform Design),考虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验点获得更多的信息。中国独创,世界范围内应用!第五页,讲稿共三十七页哦二、试验设计的重要意义n以例说明:以例说明:例例1、例例2n试验设计方法是数理统计学的应用方法之一;试验设计方法是数理统计学的应用方法之一;n试验安排得好且分析得当,就能以较少的试验次数、较短的试验试验安排得好且分析得当,就能以较少的试验次数、较短的试验时间、较低的费用而得到较满意的试验结果,节省人力、物力、时间、较低的费用而得到较满意的试验结果,节省人力、物力、财力。财力。n二战后,日本工业高速发展的奥秘之一二战后,日本工业高速发展的奥秘之一试验设计。试验设计。n大学生掌握试验设计方法具有必要性和紧迫性,是工程专业大学生掌握试验设计方法具有必要性和紧迫性,是工程专业未来竞争的关键因素。未来竞争的关键因素。第六页,讲稿共三十七页哦例1 微生物培养条件的优化 影响某一酵母菌生长产酒精的因素有:温度、pH、溶解氧(摇床速度)、培养基配方等4个因素,以酒精的产率作为衡量指标。n假设:温度有25、30、35等3个水平;npH 有5、7、9等3个水平;n摇床速度有 120、160、200r/min 3个水平;n培养基有 1号、2号、3号3个配方;n那么请找出此菌生长的最优条件,使发酵产品产率最高,并对试验结果进行分析、验证。试验设计要素第七页,讲稿共三十七页哦例2 试验数据的统计分析n研究一种试剂是否能提高酵母发酵产酒精的能力,将试验分为两组,一组加入该试剂、另一组不加入该试剂,每组接种6瓶,测得48小时后酒精产率如表1-1所示。要求检验此试剂是否能提高酒精产率(%)。第八页,讲稿共三十七页哦表1-1 试剂对酒精产率的影响加入试剂1010.5129.61411.4不加试剂9.8101212.411.58第九页,讲稿共三十七页哦试验数据的处理在科学试验中的作用n1、通过误差分析,可以评判试验数据的可靠性;、通过误差分析,可以评判试验数据的可靠性;n2、确定影响试验结果的因素主次,从而可以抓住主要矛盾,提、确定影响试验结果的因素主次,从而可以抓住主要矛盾,提高试验效率;高试验效率;n3、可以确定试验因素与试验结果之间存在的近似函数关系,并、可以确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;能对试验结果进行预测和优化;n4、试验因素对试验结果的影响规律,为控制试验提供思路;、试验因素对试验结果的影响规律,为控制试验提供思路;n5、确定最优试验方案或配方。、确定最优试验方案或配方。第十页,讲稿共三十七页哦三、试验设计的定义及类型n定义1:试验设计(design of experiments,DOE)也称实验设计,就是对试验进行科学合理的安排,以达到最好的试验效果。一个好的试验应包括三个方面:n1)试验的设计。首先要明确试验目的,确定要考察的因素以及它们的变动范围,然后根据试验目的制定出合理的试验方案。n2)试验的实施n3)试验结果的分析。对试验所得数据进行分析,判定所考察的因素中哪些是主要的,从而确定出最好的试验条件,即最优方案。第十一页,讲稿共三十七页哦试验设计的类型n1、演示试验、演示试验n2、验证试验、验证试验n3、比较试验、比较试验(comparative experiments)n4、优化试验、优化试验(optimizition experiments)单因素优化试验、多因素优化试验、正交试验设计、均匀试单因素优化试验、多因素优化试验、正交试验设计、均匀试验设计和稳健性优化试验。验设计和稳健性优化试验。n 5、探索性试验、探索性试验第十二页,讲稿共三十七页哦四、试验设计的要素与原则n1、试验设计的有关基本概念n定义定义2 试验因素(factor)简称为因素或因子,是试验的设计者希望考察的试验条件。因素的取值称为水平(level).n定义定义3 按照因素的给定水平对试验对象所作的操作称为处理(treatment),接受处理的试验对象称为试验单元。n定义定义4 衡量试验结果好坏程度的指标成为试验指标,也称为响应变量(response variable).第十三页,讲稿共三十七页哦2、试验设计的三要素n1)试验因素)试验因素 依靠专业知识或筛选试验选取合适的依靠专业知识或筛选试验选取合适的 因素和水平因素和水平 选择数量因素,少选品质因素选择数量因素,少选品质因素 注意安全性注意安全性第十四页,讲稿共三十七页哦n2)试验单元)试验单元 接受试验处理的对象或单元,需要依照统计学原理,同接受试验处理的对象或单元,需要依照统计学原理,同时考虑到生理和伦理问题。时考虑到生理和伦理问题。n3)试验效应(指标的选取)试验效应(指标的选取)选用定量指标,不用定性指标选用定量指标,不用定性指标 选用客观性强的指标,少用主观指标选用客观性强的指标,少用主观指标2、试验设计的三要素第十五页,讲稿共三十七页哦3、试验设计的四个原则随机化原则、重复原则、对照原则、区组原则n1)随机化原则)随机化原则n定义定义5 随机化是指每个处理以概率均等的原则,随机地选择试验随机化是指每个处理以概率均等的原则,随机地选择试验单元。单元。n违背随机化原则,不论是有意或无意,都会影响试验结果的正确性,违背随机化原则,不论是有意或无意,都会影响试验结果的正确性,给试验结果带来偏差。给试验结果带来偏差。第十六页,讲稿共三十七页哦n2)重复原则)重复原则 独立重复试验:相同的试验条件下对不同的试验单元做多次试验独立重复试验:相同的试验条件下对不同的试验单元做多次试验。重复测量:在相同的处理条件下对同一样品做多次重复试验,以消重复测量:在相同的处理条件下对同一样品做多次重复试验,以消除操作方法产生的误差。除操作方法产生的误差。3、试验设计的四个原则第十七页,讲稿共三十七页哦n3)对照原则)对照原则 空白对照空白对照 安慰剂对照安慰剂对照 试验条件对照试验条件对照 标准对照标准对照 历史或中外对照历史或中外对照n对照组在试验中是一种处理,在统计分析中作为试验因素的一个对照组在试验中是一种处理,在统计分析中作为试验因素的一个水平。水平。3、试验设计的四个原则第十八页,讲稿共三十七页哦n4)区组原则)区组原则n定义定义6 人为划分的时间、空间、设备等试验条件称为人为划分的时间、空间、设备等试验条件称为区组区组。n区组因素是影响试验指标的因素,但不是试验者所要考察的区组因素是影响试验指标的因素,但不是试验者所要考察的因素,也称为非处理因素。但是四个原则的核心,贯穿在其因素,也称为非处理因素。但是四个原则的核心,贯穿在其他三个原则之中,相辅相成、相互补充。他三个原则之中,相辅相成、相互补充。3、试验设计的四个原则第十九页,讲稿共三十七页哦平衡设计n平衡设计:试验的各处理和各区组内的试验次数都相同时成为平衡设计:试验的各处理和各区组内的试验次数都相同时成为平衡设计。平衡设计是试验设计的一个基本思想,有利于试验平衡设计。平衡设计是试验设计的一个基本思想,有利于试验设计的统计分析。设计的统计分析。第二十页,讲稿共三十七页哦五、试验设计与统计分析在食品科学研究中的作用 n为了推动食品科学的发展,常常要进行科学研究为了推动食品科学的发展,常常要进行科学研究。进行科学研究。进行科学研究离不开调查或试验离不开调查或试验。进行调查或试验必须解决两个问题:进行调查或试验必须解决两个问题:1)如何合理地进行调查或试验设计)如何合理地进行调查或试验设计;2)如何科学地整理、分析所收集的具有变异的数据资料)如何科学地整理、分析所收集的具有变异的数据资料,揭示出隐藏在其内部的规律性。揭示出隐藏在其内部的规律性。第二十一页,讲稿共三十七页哦 食品试验设计与统计分析总体上讲属于生物统计学(食品试验设计与统计分析总体上讲属于生物统计学(Biometrics)范畴。)范畴。合理地进行调查或试验设计、科学地整理、分析所收集得来合理地进行调查或试验设计、科学地整理、分析所收集得来的资料是生物统计的根本任务。的资料是生物统计的根本任务。食品试验设计与统计分析是食品试验设计与统计分析是数理统计原理和方法在食品科学数理统计原理和方法在食品科学研究中的具体应用研究中的具体应用。它在食品科学研究中的作用主要体现在。它在食品科学研究中的作用主要体现在两方面:两方面:第二十二页,讲稿共三十七页哦n试验设计有广义与狭义之分试验设计有广义与狭义之分 广义的试验设计是指试验研究的课题设计,也就是指整个试验计划的拟定。广义的试验设计是指试验研究的课题设计,也就是指整个试验计划的拟定。主要包含课题名称、试验目的、研究依据、内容以及预期达到的效果,试验主要包含课题名称、试验目的、研究依据、内容以及预期达到的效果,试验方案,经济效益或社会效益的估计方案,经济效益或社会效益的估计,已具备的研究条件,参加研究人员的分,已具备的研究条件,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等等工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰写等等内容。内容。狭义的试验设计主要是指试验单位狭义的试验设计主要是指试验单位(试验单元试验单元)的选取、重复数目的确定的选取、重复数目的确定、试验单位的分组和试验处理的安排。通常讲的试验设计主要指狭义的、试验单位的分组和试验处理的安排。通常讲的试验设计主要指狭义的试验设计。合理的试验设计能控制和降低试验误差,提高试验的精确性试验设计。合理的试验设计能控制和降低试验误差,提高试验的精确性,为统计分析获得试验处理效应和试验误差的无偏估计提供必要的数据,为统计分析获得试验处理效应和试验误差的无偏估计提供必要的数据。食品试验研究中常用的试验设计方法有完全随机设计、随机区组设计、正交设食品试验研究中常用的试验设计方法有完全随机设计、随机区组设计、正交设计、均匀设计、回归正交设计和混料设计等计、均匀设计、回归正交设计和混料设计等。1、提供试验或调查设计的方法 第二十三页,讲稿共三十七页哦n调查设计也有广义与狭义之分调查设计也有广义与狭义之分 广义的调查设计是指整个调查计划的制定,包括调查研究的目的、对象与广义的调查设计是指整个调查计划的制定,包括调查研究的目的、对象与范围,调查项目及调查表,抽样方法的选取,抽样单位、抽样数量的确范围,调查项目及调查表,抽样方法的选取,抽样单位、抽样数量的确定,数据处理方法,调查组织工作,调查报告撰写与要求,经费预算等定,数据处理方法,调查组织工作,调查报告撰写与要求,经费预算等内容内容 狭义的调查设计主要包含抽样方法的选取,抽样单位、抽样数目的确定等等。通常讲狭义的调查设计主要包含抽样方法的选取,抽样单位、抽样数目的确定等等。通常讲的调查设计主要是指狭义的调查设计。合理的调查设计能控制与降低抽样误差,提高的调查设计主要是指狭义的调查设计。合理的调查设计能控制与降低抽样误差,提高调查的精确性,为获得总体参数的可靠估计提供必要的数据。调查的精确性,为获得总体参数的可靠估计提供必要的数据。试验或调查设计主要解决合理地收集必要而有代表性资料的问题。试验或调查设计主要解决合理地收集必要而有代表性资料的问题。第二十四页,讲稿共三十七页哦n整理资料的基本方法是根据资料的特性将其整理成整理资料的基本方法是根据资料的特性将其整理成统计表、绘制统计表、绘制成统计图成统计图。通过统计表、图可以大致看到所得资料集中、离散的通过统计表、图可以大致看到所得资料集中、离散的情况,并利用所收集得来的数据计算样本统计量,以表示该资料情况,并利用所收集得来的数据计算样本统计量,以表示该资料的数量特征、估计相应的总体参数。的数量特征、估计相应的总体参数。2、提供整理、分析数据资料的方法第二十五页,讲稿共三十七页哦统计分析的主要内容有两方面统计分析的主要内容有两方面1)统计分析最重要的内容是统计分析最重要的内容是差异显著性检验,即统计假设检验。差异显著性检验,即统计假设检验。通过抽样调查或控制试验,获得的是具有变异的资料。那么产生变异的通过抽样调查或控制试验,获得的是具有变异的资料。那么产生变异的原因是什么?是由于处理间(例如不同原料、不同工艺、不同配比间)的实原因是什么?是由于处理间(例如不同原料、不同工艺、不同配比间)的实质性差异所引起的,还是由于无法控制的偶然因素所引起的?质性差异所引起的,还是由于无法控制的偶然因素所引起的?显著性检验的目的就在于承认并尽量显著性检验的目的就在于承认并尽量排除这些无法控制的偶然因素的干扰,排除这些无法控制的偶然因素的干扰,将处理间是否存在本质差异揭示出来将处理间是否存在本质差异揭示出来。2、提供整理、分析数据资料的方法第二十六页,讲稿共三十七页哦 t 检验检验主要用于检验两个处理平均数差异是否显著;主要用于检验两个处理平均数差异是否显著;方差分析方差分析主要用于检验多个处理平均数间差异是否显著(主要用于检验多个处理平均数间差异是否显著(F检验检验););第二十七页,讲稿共三十七页哦统计分析的主要内容有两方面统计分析的主要内容有两方面2)对变量(试验指标或性状)间的关系进行研究对变量(试验指标或性状)间的关系进行研究 研究它们之间的联系性质和程度,或者寻求它们之间的联系形式,即进行研究它们之间的联系性质和程度,或者寻求它们之间的联系形式,即进行相关分析与回归分析相关分析与回归分析。通过对资料进行相关、回归分析,可以揭示出试验指标或。通过对资料进行相关、回归分析,可以揭示出试验指标或性状间的内在联系,为食品新产品的研制开发、产品质量的预测和控制提供理性状间的内在联系,为食品新产品的研制开发、产品质量的预测和控制提供理论依据。论依据。2、提供整理、分析数据资料的方法第二十八页,讲稿共三十七页哦nStatistics is a branch of mathematics.nLearn statistics one step at a time.nStatistics provides a powerful data analytic tool.nSampling:A sample is drawn from a much larger body of measurements,called the population.Example:10 sailors are drawn from 323 aboard a ship第二十九页,讲稿共三十七页哦六 常用的统计分析软件 1、SAS统计软件统计软件nSAS是当今国际上最著名的数据分析软件系统。20世纪60年代末期,由美国北卡罗纳州州立大学的A.J.Barr和J.H.Goodnight两位教授开始开发,1975年创建了美国SAS研究所。之后,推出的SAS系发展与完善,已成为大型集成应用软件系统。目前已广泛应用于自然科学和其他领域,SAS for Windows是其最新版本。将这个优秀软件应用于实际工作中,不但能够大大减少数据分析人员的工作量,而且提高了数据处理、结果存贮和应用的准确性、实用性、可信性。第三十页,讲稿共三十七页哦nSPSS(Statistical Package for Social Science),即,即“社会科学统计软件包社会科学统计软件包”,是专门针对社会科学的统计软件之一。,是专门针对社会科学的统计软件之一。n但是随着但是随着SPSS产品服务领域的扩大和服务深度的增加,产品服务领域的扩大和服务深度的增加,SPSS公司已于公司已于2000年正年正式将英文全称更改为式将英文全称更改为Statistical Product and Service Solutions,意为,意为“统统计产品与服务解决方案计产品与服务解决方案”。n由于由于SPSS具有强大的数据处理与统计功能,而被广泛地应用于自然科学和社会科学具有强大的数据处理与统计功能,而被广泛地应用于自然科学和社会科学中,其中涉及的领域包括工程技术、应用数学、社会学、经济学、商业、金融、生物中,其中涉及的领域包括工程技术、应用数学、社会学、经济学、商业、金融、生物学、医疗卫生、体育、心理学等学科,深受广大用户的青睐。学、医疗卫生、体育、心理学等学科,深受广大用户的青睐。2、SPSS统计软件第三十一页,讲稿共三十七页哦nSPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。迄今SPSS软件已有30余年的成长历史。全球约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。第三十二页,讲稿共三十七页哦nSPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮(从国外的角度看),它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件。在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。第三十三页,讲稿共三十七页哦缺点缺点n由于在由于在SPSS公司的产品线中,公司的产品线中,SPSS软件属于中、低档(软件属于中、低档(SPSS公司公司共有二十余个产品),因此从战略的观点来看,共有二十余个产品),因此从战略的观点来看,SPSS显然是把相当的显然是把相当的精力放在了用户界面的开发上。该软件只吸收较为成熟的统计方法,精力放在了用户界面的开发上。该软件只吸收较为成熟的统计方法,而对于最新的统计方法,而对于最新的统计方法,SPSS公司的做法是为之发展一些专门软公司的做法是为之发展一些专门软件,如针对树结构模型的件,如针对树结构模型的Answer Tree,针对神经网络技术的,针对神经网络技术的Neural Connection、专门用于数据挖掘的、专门用于数据挖掘的Clementine等,而不是直接等,而不是直接纳入纳入SPSS,因此他们在,因此他们在SPSS中均难觅芳踪。中均难觅芳踪。n另外,其输出结果虽然漂亮,但不能为另外,其输出结果虽然漂亮,但不能为WORD等常用文字处理软件直接等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这些都可以说是打开,只能采用拷贝、粘贴的方式加以交互。这些都可以说是SPSS软软件的致命伤。件的致命伤。第三十四页,讲稿共三十七页哦3、Excel 统计软件第三十五页,讲稿共三十七页哦4、OriginLab 统计软件第三十六页,讲稿共三十七页哦思考题n什么是试验设计,试验设计在科研和生产中有何重要意义?n什么是优化试验?介绍优化试验的种类。n说明试验设计的四个原则。为什么说区组原则是试验设计的核心原则?第三十七页,讲稿共三十七页哦