《试验统计与田间设计农业幻灯片.ppt》由会员分享,可在线阅读,更多相关《试验统计与田间设计农业幻灯片.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试验统计与田间设计农业第1页,共23页,编辑于2022年,星期二第一节第一节 科学研究与科学试验科学研究与科学试验一、农业和生物学领域的科学研究一、农业和生物学领域的科学研究自然科学自然科学 理论科学理论科学 实验科学实验科学 抽样调查抽样调查 科学试验科学试验 第2页,共23页,编辑于2022年,星期二二、科学研究的基本过程和方法二、科学研究的基本过程和方法(一一)科学研究的基本过程科学研究的基本过程 (1)根据本人的观察根据本人的观察(了解了解)或前人的观察或前人的观察(通过文献通过文献)对所研对所研究的命题形成一种认识或假说;究的命题形成一种认识或假说;(2)根据假说所涉及的内容安排相斥
2、性的试验或抽样调查;根据假说所涉及的内容安排相斥性的试验或抽样调查;(3)根据试验或调查所获的资料进行推理,肯定或否定或修根据试验或调查所获的资料进行推理,肯定或否定或修改假说,从而形成结论,或开始新一轮的试验以验证修改完善改假说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的认识或理论逐步发展、后的假说,如此循环发展,使所获得的认识或理论逐步发展、深化。深化。第3页,共23页,编辑于2022年,星期二(二二)科学研究的基本方法科学研究的基本方法 1.选题选题2.文献文献3.假说假说 4.假说的检验假说的检验 5.试验的规划与设计试验的规划与设计 第4页,共2
3、3页,编辑于2022年,星期二第二节第二节 试验方案试验方案一、试验因素与水平一、试验因素与水平二、试验指标与效应二、试验指标与效应三、制订试验方案的要点三、制订试验方案的要点第5页,共23页,编辑于2022年,星期二一、试验因素与水平一、试验因素与水平 试验方案试验方案是根据试验目的和要求所拟进行比较的一组试验是根据试验目的和要求所拟进行比较的一组试验处理处理(treatment)的总称。的总称。被变动并设有待比较的一组处理的因子称为试验因素,简称被变动并设有待比较的一组处理的因子称为试验因素,简称因因素或因子素或因子(factor)(factor),试验因素的量的不同级别或质的不同状态称为
4、,试验因素的量的不同级别或质的不同状态称为水平水平(level)(level)。第6页,共23页,编辑于2022年,星期二试验方案按其供试因子数的多少可以区分为以下试验方案按其供试因子数的多少可以区分为以下3类:类:(1)(1)单因素试验单因素试验(single-factor experiment)(single-factor experiment)单因素试验是指整个试验中只单因素试验是指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。格控制一致的试验。(2)(2)多因素试验多因素试验(mul
5、tiple-factor or factorial experiment)(multiple-factor or factorial experiment)多因素试验是指在多因素试验是指在同一试验方案中包含同一试验方案中包含2个或个或2个以上的试验因素,各个因素都分为不个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。同水平,其他试验条件均应严格控制一致的试验。(3)(3)综合性试验综合性试验(comprehensive experiment)(comprehensive experiment)综合性试验中各因素的各水平综合性试验中各因素的各水平不构成平衡的处理组合
6、,而是将若干因素的某些水平结合在一起形成不构成平衡的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合。少数几个处理组合。第7页,共23页,编辑于2022年,星期二二、试验指标与效应二、试验指标与效应 用于衡量试验效果的指示性状称用于衡量试验效果的指示性状称试验指标试验指标。试验因素对试验指标所起的增加或减少的作用称为试验因素对试验指标所起的增加或减少的作用称为试验效应试验效应(experimental effect)(experimental effect)。在同一因素内两种水平间试验指标的相差属在同一因素内两种水平间试验指标的相差属简单效应简单效应(simple(simple
7、 effect)effect)。一个因素内各简单效应的平均数称平均效应,亦称一个因素内各简单效应的平均数称平均效应,亦称主要效应主要效应(main effect)(main effect),简称,简称主效主效。两个因素简单效应间的平均差异称为两个因素简单效应间的平均差异称为交互作用效应交互作用效应(interaction(interaction effect)effect),简称,简称互作互作。第8页,共23页,编辑于2022年,星期二三、制订试验方案的要点三、制订试验方案的要点 1.拟订试验方案前应通过回顾以往研究的进展、调查交流、拟订试验方案前应通过回顾以往研究的进展、调查交流、文献探索等
8、。文献探索等。2.根据试验目的确定供试因素及其水平。根据试验目的确定供试因素及其水平。3.试验方案中应包括有对照水平或处理,简称对照试验方案中应包括有对照水平或处理,简称对照(check,符号,符号CK)。第9页,共23页,编辑于2022年,星期二 4.试验方案中应注意比较间的唯一差异原则,以便正确地试验方案中应注意比较间的唯一差异原则,以便正确地解析出试验因素的效应。解析出试验因素的效应。5.拟订试验方案时必须正确处理试验因素及试验条件间的拟订试验方案时必须正确处理试验因素及试验条件间的关系。关系。6.多因素试验提供了比单因素试验更多的效应估计,具有多因素试验提供了比单因素试验更多的效应估计
9、,具有单因素试验无可比拟的优越性。单因素试验无可比拟的优越性。第10页,共23页,编辑于2022年,星期二第三节第三节 试验误差及其控制试验误差及其控制一、试验数据的误差和精确性一、试验数据的误差和精确性二、试验误差的来源二、试验误差的来源三、随机误差的规律性三、随机误差的规律性四、随机误差的层次性四、随机误差的层次性五、试验误差的控制五、试验误差的控制第11页,共23页,编辑于2022年,星期二一、试验数据的误差和精确性一、试验数据的误差和精确性 将每次所取样品测定的结果称为一个将每次所取样品测定的结果称为一个观察值观察值,以,以y表示。理论表示。理论值或真值,以值或真值,以 表示,则表示,
10、则 ,即观察值,即观察值=真值真值+误差,每一误差,每一观察值都有一误差观察值都有一误差 ,可正,可负,可正,可负,。第12页,共23页,编辑于2022年,星期二 观察值间存在的变异可归结为两种情况观察值间存在的变异可归结为两种情况:一种是完全偶然性的,找不出确切原因的,称为一种是完全偶然性的,找不出确切原因的,称为偶然性误差偶然性误差(spontaneous error)(spontaneous error)或随机误差或随机误差(random error)(random error);另一种是有一定原因的称为另一种是有一定原因的称为偏差偏差(bias)(bias)或系统误差或系统误差(sys
11、tematic(systematic error)error)。系统误差影响了数据的准确性,准确性是指观测值与其理系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;论真值间的符合程度;而偶然误差影响了数据的精确性,精确性是指观测值间的而偶然误差影响了数据的精确性,精确性是指观测值间的符合程度。符合程度。第13页,共23页,编辑于2022年,星期二 二、试验误差的来源二、试验误差的来源 一般讲,随机误差是偶然性的。整个试验过程中涉及的随机一般讲,随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能波动因素愈多,试验的环节愈多,
12、时间愈长,随机误差发生的可能性及波动程度便愈大。性及波动程度便愈大。理论上,系统误差是可以通过试验条件及试验过程的仔细操理论上,系统误差是可以通过试验条件及试验过程的仔细操作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。偏差则较难控制。第14页,共23页,编辑于2022年,星期二三、随机误差的规律性三、随机误差的规律性图1.3 随机误差的分布模式 以大豆品种蛋白质含量的测以大豆品种蛋白质含量的测定为例,若从一批种子中抽取定为例,若从一批种子中抽取100份样品,分别进行蛋白质含量的份样品,分别进行蛋白质含量的测定
13、,若无系统偏差的干扰,则所测定,若无系统偏差的干扰,则所获获100个数据,将其平均数当作理论个数据,将其平均数当作理论真值真值 ,根据,根据 可计算出可计算出100个误差值。这个误差值。这100个误差值有个误差值有“”有有“”,平均起来正负相抵消等于,平均起来正负相抵消等于0。若将其画成坐标图,接近于一个对。若将其画成坐标图,接近于一个对称的钟形图称的钟形图(图图1.3),在靠近),在靠近0的、范围内出现的误差次数的、范围内出现的误差次数多,越远离多,越远离0出现的次数越少。出现的次数越少。第15页,共23页,编辑于2022年,星期二四、随机误差的层次性四、随机误差的层次性 仍以大豆品种蛋白质
14、含量测定为例,可以看到大豆蛋白仍以大豆品种蛋白质含量测定为例,可以看到大豆蛋白质测定中抽取样品时,因为取样过程的随机性存在取样的随质测定中抽取样品时,因为取样过程的随机性存在取样的随机误差,对于同一份样品,由于测定过程中的随机因素导致机误差,对于同一份样品,由于测定过程中的随机因素导致存在随机误差,两者虽都是随机误差,但发生的时段或层次存在随机误差,两者虽都是随机误差,但发生的时段或层次不一样,因此,随机误差具有层次性。这里前一阶段的是取不一样,因此,随机误差具有层次性。这里前一阶段的是取样误差,后一阶段的是测定过程误差。此时,观测值可表示样误差,后一阶段的是测定过程误差。此时,观测值可表示为
15、:为:第16页,共23页,编辑于2022年,星期二五、试验误差的控制五、试验误差的控制 根据以上关于试验误差来源的分析,研究工作者为保证根据以上关于试验误差来源的分析,研究工作者为保证试验结果的正确性,必须针对各种可能的系统偏差原因预防试验结果的正确性,必须针对各种可能的系统偏差原因预防多种多样的系统误差;同时针对不同阶段、不同层次偶然性多种多样的系统误差;同时针对不同阶段、不同层次偶然性因素造成的随机误差分别尽量控制这种不同阶段、不同层次因素造成的随机误差分别尽量控制这种不同阶段、不同层次上发生的随机误差,使之尽量缩小。上发生的随机误差,使之尽量缩小。第17页,共23页,编辑于2022年,星
16、期二第四节第四节 试验统计学的发展和本课程的主要内容试验统计学的发展和本课程的主要内容一、试验统计学的发展一、试验统计学的发展二、本课程的主要内容二、本课程的主要内容第18页,共23页,编辑于2022年,星期二17世纪世纪Pascal 和和Fermat的概率论;的概率论;18世纪世纪De Moivre、Laplace和和Gauss的正态分布理论;的正态分布理论;19世纪达尔文应用统计方法研究生物界的连续性变异;世纪达尔文应用统计方法研究生物界的连续性变异;孟德尔应用统计方法发现显性、分离、独立分配等遗传孟德尔应用统计方法发现显性、分离、独立分配等遗传 定律;定律;Karl Pearson用统计
17、方法研究进化问题,并创建了用统计方法研究进化问题,并创建了 Biometrika杂志;杂志;Galton研究了亲子身高的回归问题;研究了亲子身高的回归问题;20世纪以来世纪以来Gosset用实验方法发现了用实验方法发现了t分布;分布;一、试验统计学的发展一、试验统计学的发展第19页,共23页,编辑于2022年,星期二Fisher提出了方差分析,建立了试验设计的三大原理,并提出提出了方差分析,建立了试验设计的三大原理,并提出了随机区组、拉丁方等试验设计,还将统计方法用之于研究数了随机区组、拉丁方等试验设计,还将统计方法用之于研究数量性状的基因效应;量性状的基因效应;Yates、Yule等发展了一
18、系列的试验设计包括后来的混杂设计等发展了一系列的试验设计包括后来的混杂设计和不完全区组设计等;和不完全区组设计等;英国英国Rothamsted试验场在生物统计和田间试验设计方面卓试验场在生物统计和田间试验设计方面卓有贡献;有贡献;Neyman和和E.S.Pearson建立了统计推断的理论;建立了统计推断的理论;第20页,共23页,编辑于2022年,星期二Snedecor建立了统计实验室并出版了建立了统计实验室并出版了“Statistical Methods Applied to Experiment in Agriculture and Biology”;Wald建立序贯分析和统计决策函数的理
19、论;建立序贯分析和统计决策函数的理论;Cochran和和Cox系统地归纳了试验设计和抽样方法研究系统地归纳了试验设计和抽样方法研究 的进展,出版了的进展,出版了“Experimental Design”和和“Sampling Technique”二书;二书;Kempthorne将统计方法应用于数量性状的遗传研究,将统计方法应用于数量性状的遗传研究,出版了出版了“An Introduction to Genetic Statistics”;而而Mather则出版了则出版了“Biometrical Genetics”。第21页,共23页,编辑于2022年,星期二二、本课程的主要内容二、本课程的主要
20、内容本课程包括本课程包括7个单元个单元15章。章。第一单元在介绍科学研究基本过程、试验方案制订和试验误差及其第一单元在介绍科学研究基本过程、试验方案制订和试验误差及其控制的基础上进一步讲述田间试验的误差来源、土壤差异和控制误控制的基础上进一步讲述田间试验的误差来源、土壤差异和控制误差的小区技术、试验设计、实施规则以及试验数据的获取。差的小区技术、试验设计、实施规则以及试验数据的获取。第二单元从样本试验数据最基本的描述统计开始,进而介绍研第二单元从样本试验数据最基本的描述统计开始,进而介绍研究对象总体的理论分布、统计数的抽样分布及其概率计算。究对象总体的理论分布、统计数的抽样分布及其概率计算。第
21、22页,共23页,编辑于2022年,星期二 第三单元在误差理论的基础上引入通过假设测验进行统计推断的第三单元在误差理论的基础上引入通过假设测验进行统计推断的基本方法,介绍平均数比较的基本方法,介绍平均数比较的u测验、测验、t测验和测验和F测验,以及计数资测验,以及计数资料的料的 测验及其应用等。测验及其应用等。第四单元承上启下介绍参数估计方法包括矩法、最小二乘第四单元承上启下介绍参数估计方法包括矩法、最小二乘法和极大似然法等。法和极大似然法等。第五单元进入第五单元进入2个及个及2个以上变数间的回归与相关分析,包括一个以上变数间的回归与相关分析,包括一元、多元线性回归与相关,以及曲线回归。第六单元为方差分析的元、多元线性回归与相关,以及曲线回归。第六单元为方差分析的进一步应用,介绍单因素、多因素及不完全区组试验结果的统计分进一步应用,介绍单因素、多因素及不完全区组试验结果的统计分析。析。第七单元介绍应用于调查研究的抽样调查方法、抽样结第七单元介绍应用于调查研究的抽样调查方法、抽样结果的统计分析以及抽样方案的设计。果的统计分析以及抽样方案的设计。第23页,共23页,编辑于2022年,星期二
限制150内