试验设计与统计分析 精.ppt
《试验设计与统计分析 精.ppt》由会员分享,可在线阅读,更多相关《试验设计与统计分析 精.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试验设计与统计分析 第1页,本讲稿共64页Section 5.1Principle of Significance Tests假设测验的基本原理第2页,本讲稿共64页一、假设测验的理论基础某人宣称自由球命中率有80%。命中率有80%的射手,实地投射只有8/20命中率的机会不大。实地投射结果显示投20球中8球。结论:命中率有80%的宣称不可信。命中率有80%的自由球射手投20球命中的次数应服从二项分布B(20,0.8)。命中的次数小于或等于8的概率约为 0.0001。即重复实地投射20球10,000次只中8球以下的情形约只发生一次。第3页,本讲稿共64页假设宣称的叙述为真(命中率有80%),可推
2、得实验结果发生的可能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。“Prove by Contradiction”小概率原理一、假设测验的理论基础第4页,本讲稿共64页例例 某地区的当地小麦品种一般某地区的当地小麦品种一般667m2产产300kg,即当地品种,即当地品种这个总体的平均数这个总体的平均数 =300(kg),并从多年种植结果获得其标准,并从多年种植结果获得其标准差差=75(kg),而现有某新品种通过,而现有某新品种通过25个小区的试验,计得其样个小区的试验,计得其样本平均产量为每本平均产量为每667m2330kg,即即 =330,问新品种产量与当地
3、品种产量是否有显著差异?,问新品种产量与当地品种产量是否有显著差异?二、假设测验的步骤第5页,本讲稿共64页 (一一)先假设新品种产量与当地品种产量无差异,记作先假设新品种产量与当地品种产量无差异,记作 无效假设或零假设无效假设或零假设 对立假设或备择假设对立假设或备择假设 二、假设测验的步骤第6页,本讲稿共64页二、假设测验的步骤 (二二)在承认上述无效假设的前提下,获得平均数的抽样在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为先承认无效假设,从已知总体中抽取样本容量为n=25的样本,的样本,该样本平均
4、数的抽样分布具正态分布形状,平均数该样本平均数的抽样分布具正态分布形状,平均数 =300(kg),标准误,标准误 =15(kg)。如果新品种的。如果新品种的平均产量很接近平均产量很接近300 kg,应接受,应接受H0。如果新品种的平均产量与。如果新品种的平均产量与300相差很大,应否定相差很大,应否定H0。但如果试验结果与。但如果试验结果与300不很接近也不不很接近也不相差悬殊相差悬殊,就要借助于概率原理,具体做法有以下两种:就要借助于概率原理,具体做法有以下两种:第7页,本讲稿共64页1.计算概率计算概率 在假设在假设 为正确的条件下,根据的抽样分布算出获得为正确的条件下,根据的抽样分布算出
5、获得 330kg的概率,或者说算得出现随机误差的概率,或者说算得出现随机误差 30(kg)的概率:在此,的概率:在此,查附表,当查附表,当u=2时,时,P(概率概率)界于界于0.04和和0.05之间,即这一试验之间,即这一试验结果:结果:30(kg),属于抽样误差的概率小于,属于抽样误差的概率小于5%。二、假设测验的步骤第8页,本讲稿共64页2.计算接受区和否定区计算接受区和否定区 在假设在假设H0为正确的条件下,根据为正确的条件下,根据 的抽样分的抽样分布划出一个区间,如布划出一个区间,如 在这一区间内则接受在这一区间内则接受H0,如,如 在这一区间外则否在这一区间外则否定定H0。由于。由于
6、 因此,在因此,在 的抽样分布中,落在的抽样分布中,落在()区间内的有区间内的有95%,落在这一区间外的只有,落在这一区间外的只有5%。二、假设测验的步骤第9页,本讲稿共64页 如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限,则上述区间的界限,则上述区间()为接受假设的区域,简称为接受假设的区域,简称接受区接受区(acceptance region)(acceptance region);和和 为否定假设的区域,简称为否定假设的区域,简称否定区否定区(rejection region)(rejection region)。同理,若以同理,若以1%作为接受或否定作为接受或否定H0
7、的界限,则的界限,则()为接受区域,为接受区域,和和 为否定区域。为否定区域。二、假设测验的步骤第10页,本讲稿共64页 如上述小麦新品种例,如上述小麦新品种例,=300,,1.96 =29.4(kg)。因之,它。因之,它的两个的两个2.5%概率概率的否定区域为的否定区域为 30029.4和和 300+29.4,即,即大于大于329.4(kg)和小于和小于270.6(kg)的概率只有的概率只有5。图图 5%显著水平假设测验图示显著水平假设测验图示(表示接受区域和否定区域)(表示接受区域和否定区域)二、假设测验的步骤第11页,本讲稿共64页(三三)根据根据“小概率事件实际上不可能发生小概率事件实
8、际上不可能发生”原理接受或否定假设原理接受或否定假设 当当 由随机误差造成的概率由随机误差造成的概率P小于小于5%或或1%时,就可认为它时,就可认为它不可能属于抽样误差,从而否定假设。不可能属于抽样误差,从而否定假设。如如P0.05,则称这个差数是显著的。,则称这个差数是显著的。如如P 0假设:否定区H0:0 HA:0左尾测验右尾测验单尾测验单尾测验(one-sided test)接受区接受区三、两尾测验与一尾测验第16页,本讲稿共64页u 0.05=1.64u 0.01=2.33单尾测验分位数双尾测验分位数u 0.05=1.96u 0.01=2.58 否定区否定区否定区接受区接受区查表时,单
9、尾概率等于双尾概率乘以2三、两尾测验与一尾测验第17页,本讲稿共64页假设测验的两类错误假设测验的两类错误H0正确正确 H0 错误错误否定否定H0 错误错误()推断正确推断正确(1-)接受接受H0 推断正确推断正确(1-)错误错误()第一类错误(第一类错误(type I error),又称弃真错误或),又称弃真错误或 错误错误;第二类错误(第二类错误(type II error),又称纳伪错误或,又称纳伪错误或 错误错误第一类错误的概率为显著水平第一类错误的概率为显著水平 值。值。第二类错误的概率为第二类错误的概率为 值。值。四、假设测验的两类错误第18页,本讲稿共64页关于两类错误的讨论可总
10、结如下:关于两类错误的讨论可总结如下:(1)在样本容量在样本容量n固定的条件下,提高显著水平固定的条件下,提高显著水平 (取较小的取较小的 值值),如从,如从5%变为变为1%则将增大第二类错误的概率则将增大第二类错误的概率 值。值。(2)在在n和显著水平和显著水平 相同的条件下,真总体平均数相同的条件下,真总体平均数 和假设平均数和假设平均数 的相差的相差(以标准误为单位以标准误为单位)愈大,则犯第二类错误的概率愈大,则犯第二类错误的概率 值愈小。值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水平,如为了降低犯两类错误的概率,需采用一个较低的显著水平,如 =0.05;或适当增加样
11、本容量。;或适当增加样本容量。(4)如果显著水平如果显著水平 已固定下来,则改进试验技术和增加样本容量可已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。以有效地降低犯第二类错误的概率。四、假设测验的两类错误第19页,本讲稿共64页Section 5.2 Significance Tests for Means平均数的假设测验第20页,本讲稿共64页一、t分布数据来自正态总体N(,2)的假设下,随机样本的均数 服从正态 N(,2/n)标准差未知,用样本标准差s估计 以 标准化后服从标准正态 以 标准化后则服从 t 分布 的标准差估计值 又称为 的标准误(standard
12、 error of mean,简记为 )第21页,本讲稿共64页0 0标准正态分布t 分布自由度9t 分布自由度2一、t分布第22页,本讲稿共64页t 分布图形与正态分布图形相似都具有对称于零、单峰及钟形的特性t 分布图形的散布(spread)比正态分布图形大,t 分布图形的尾端具有较大的概率以 替代 来标准化,使得t分布有较大的变异性。t分布自由度越大图形越接近正态。样本容量越大s估计越可靠,估计值造成的额外变异性越小。一、t分布第23页,本讲稿共64页在自由度为 的t分布曲线图下,右方与 左方的面积和为 ,则称 为自由度为 的t分布概率为 的双侧临界值。可查表。0面积为/2面积为/2一、t
13、分布第24页,本讲稿共64页在自由度为 的t分布曲线图下,右方的面积为 ,则称 为自由度为 的t分布概率为 的单侧临界值。可查表。0面积为一、t分布第25页,本讲稿共64页-tt0一、t分布第26页,本讲稿共64页t 界值表界值表1.8122.228-2.228tf(t)=10=10的的t t分布图分布图第27页,本讲稿共64页 例例1 某春小麦良种的千粒重某春小麦良种的千粒重 34g,现自外地引入一,现自外地引入一高产品种,在高产品种,在8个小区种植,得其千粒重个小区种植,得其千粒重(g)为:为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千
14、粒重,问新引入品种的千粒重与当地良种有无显著差异?与当地良种有无显著差异?这里总体这里总体 为未知,又是小样本,故需用为未知,又是小样本,故需用t 测验;又新引入品种测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:二、单个样本平均数的假设测验第28页,本讲稿共64页H0:34g;对;对HA:34g。显显著水平著水平 =0.05。测验计算:测验计算:查附表查附表,v=7时,时,t0.05=2.365。现实得。现实得|t|0.05。推断:接受推断:接受H0:34g,即新引入品种千粒重与当地良种千粒重指定值
15、,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。没有显著差异。二、单个样本平均数的假设测验第29页,本讲稿共64页 由两个样本平均数的相差,以测验这两个样本所属的总体平由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。均数有无显著差异。测验方法测验方法 成组数据的平均数比较成组数据的平均数比较 成对数据的比较成对数据的比较 三、两个样本平均数相比较的假设测验第30页,本讲稿共64页(一一)成组数据的平均数比较成组数据的平均数比较 如果两个处理为完全随机设计的两个处理,各供试单如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所
16、得数位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组据皆称为成组数据,以组(处理处理)平均数作为相互比较的标平均数作为相互比较的标准。准。在两个样本的总体方差在两个样本的总体方差 和和 为未知,但可假定为未知,但可假定 ,而两个样本又为小样本时,用,而两个样本又为小样本时,用t t 测验。测验。三、两个样本平均数相比较的假设测验第31页,本讲稿共64页从样本变异算出平均数差数的均方从样本变异算出平均数差数的均方 ,其两样本平均数的差数标准误为:其两样本平均数的差数标准误为:于是有:于是有:由于假设由于假设 故故自由度自由度 三、两个样本平均数相比较的假设测验第32页,本
17、讲稿共64页 例例2 调查某农场每亩调查某农场每亩30万苗和万苗和35万苗的稻田各万苗的稻田各5块,得亩产量块,得亩产量(单单位:位:kg)于表于表1,试测验两种密度亩产量的差异显著性。,试测验两种密度亩产量的差异显著性。表表1 1 两种密度的稻田两种密度的稻田亩产亩产(kg)(kg)y1(30万苗万苗)y2(35万苗万苗)400450420440435445460445425420 假设假设H0:两种密度的总体产量没有两种密度的总体产量没有差异,即差异,即 对对 显著水平显著水平 =0.05 测验计算:测验计算:=428kg =440kg SS1=1930 SS2=550 故故 三、两个样本
18、平均数相比较的假设测验第33页,本讲稿共64页 查附表,查附表,v=4+4=8时时,t0.05=2.306。现实得现实得|t|=1.080.05。推断:接受假设推断:接受假设 ,两种密度的亩产量没有显著,两种密度的亩产量没有显著差异。差异。三、两个样本平均数相比较的假设测验第34页,本讲稿共64页(二二)成对数据的比较成对数据的比较 若试验设计是将性质相同的两个供试单位配成一对,并设若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为不同处理,则所得观察值为成对数据
19、成对数据。成对数据,由于同一配对内两个供试单位的试验条件很是接近,而成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。制试验误差,具有较高的精确度。在分析试验结果时,只要假设两样本的总体差数的平均在分析试验结果时,只要假设两样本的总体差数的平均数数 ,而不必假定两样本的总体方差,而不必假定两样本的总体方差 和和 相同。相同。三、两个样本平均数相比较的假设测验第35页,本讲稿共64页 设两个样本的观察值分别为设两个样本的观察值分别为x1
20、和和 x2,共配成,共配成n对,各个对的差数对,各个对的差数为为 d=x1x2,差数的平均数为,差数的平均数为 ,则差数平均数的标准,则差数平均数的标准误误 为:为:它具有它具有 v=n1。若假设。若假设 ,则上式改为:,则上式改为:即可测验即可测验 三、两个样本平均数相比较的假设测验第36页,本讲稿共64页 例例3 选生长期、发育进度、选生长期、发育进度、植株大小和其他方面皆比较一致植株大小和其他方面皆比较一致的两株番茄构成一组,共得的两株番茄构成一组,共得7组,组,每组中一株接种每组中一株接种A处理病毒,另处理病毒,另一株接种一株接种B处理病毒,以研究不同处理病毒,以研究不同处理方法的饨化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验设计与统计分析 试验 设计 统计分析
限制150内