试验设计与数据处理第二李云雁全书.pptx
引引 言言第1页/共323页0.1试验设计与数据处理的发展概况20世纪20年代,英国生物统计学家及数学家费歇(RAFisher)提出了方差分析20世纪50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化数学家华罗庚教授也在国内积极倡导和普及的“优选法”我国数学家王元和方开泰于1978年首先提出了均匀设计第2页/共323页0.2试验设计与数据处理的意义0.2.1试验设计的目的:合理地安排试验,力求用较少的试验次数获得较好结果例:某试验研究了例:某试验研究了3个影响因素:个影响因素:A:A1,A2,A3B:B1,B2,B3C:C1,C2,C3全面试验:27次正交试验:9次第3页/共323页0.2.2数据处理的目的通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。第4页/共323页第第1 1章章 试验数据的误差分析试验数据的误差分析第5页/共323页误差分析(erroranalysis):对原始数据的可靠性进行客观的评定误差(error):试验中获得的试验值与它的客观真实值在数值上的不一致试验结果都具有误差,误差自始至终存在于一切科试验结果都具有误差,误差自始至终存在于一切科学实验过程中学实验过程中客观真实值客观真实值真值真值第6页/共323页1.1真值与平均值1.1.1真值(truevalue)真值:在某一时刻和某一状态下,某量的客观值或实际值真值一般是未知的相对的意义上来说,真值又是已知的平面三角形三内角之和恒为平面三角形三内角之和恒为180国家标准样品的标称值国家标准样品的标称值国际上公认的计量值国际上公认的计量值 高精度仪器所测之值高精度仪器所测之值多次试验值的平均值多次试验值的平均值第7页/共323页1.1.2平均值(mean)(1)算术平均值(arithmeticmean)n等精度试验值适合:适合:n试验值服从正态分布第8页/共323页(2)加权平均值(weightedmean)适合不同试验值的精度或可靠性不一致时wi权重权重加权和加权和第9页/共323页(3)对数平均值(logarithmicmean)说明:若数据的分布具有对数特性,则宜使用对数平均值对数平均值算术平均值如果1/2x1/x22时,可用算术平均值代替设两个数:x10,x20,则第10页/共323页(4)几何平均值(geometricmean)当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。几何平均值算术平均值设有n个正试验值:x1,x2,xn,则第11页/共323页(5)调和平均值(harmonicmean)常用在涉及到与一些量的倒数有关的场合调和平均值几何平均值算术平均值设有n个正试验值:x1,x2,xn,则:第12页/共323页1.2误差的基本概念1.2.1绝对误差(absoluteerror)(1)定义绝对误差试验值真值或(2)说明n真值未知,绝对误差也未知n可以估计出绝对误差的范围:绝对误差限或绝对误差上界绝对误差限或绝对误差上界 或第13页/共323页绝对误差估算方法:最小刻度的一半为绝对误差;最小刻度的一半为绝对误差;最小刻度为最大绝对误差;最小刻度为最大绝对误差;根据仪表精度等级计算:根据仪表精度等级计算:绝对误差绝对误差=量程量程精度等级精度等级%第14页/共323页1.2.2相对误差(relativeerror)(1)定义:或或(2)说明:n真值未知,常将x与试验值或平均值之比作为相对误差:或第15页/共323页n可以估计出相对误差的大小范围:相对误差限或相对误差上界相对误差限或相对误差上界 n相对误差常常表示为百分数(%)或千分数()第16页/共323页1.2.3算术平均误差(averagediscrepancy)定义式:n可以反映一组试验数据的误差大小试验值试验值与算术平均值与算术平均值之间的偏差之间的偏差第17页/共323页1.2.4标准误差(standarderror)当试验次数n无穷大时,总体标准差:n试验次数为有限次时,样本标准差:n表示试验值的精密度,标准差,试验数据精密度第18页/共323页(1)定义:以不可预知的规律变化着的误差,绝对误以不可预知的规律变化着的误差,绝对误差时正时负,时大时小差时正时负,时大时小(2)产生的原因:偶然因素偶然因素(3)特点:具有统计规律小误差比大误差出现机会多小误差比大误差出现机会多正、负误差出现的次数近似相等正、负误差出现的次数近似相等当试验次数足够多时,误差的平均值趋向于零当试验次数足够多时,误差的平均值趋向于零可以通过增加试验次数减小随机误差可以通过增加试验次数减小随机误差随机误差不可完全避免的随机误差不可完全避免的 1.3.11.3.1随机误差随机误差(randomerrorrandomerror)1.3试验数据误差的来源及分类第19页/共323页1.3.2系统误差(systematicerror)(1)定义:一定试验条件下,由某个或某些因素按照某一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差一确定的规律起作用而形成的误差(2)产生的原因:多方面多方面(3)特点:系统误差大小及其符号在同一试验中是恒定的系统误差大小及其符号在同一试验中是恒定的它不能通过多次试验被发现,也不能通过取多次试验值它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小的平均值而减小只要对系统误差产生的原因有了充分的认识,才能对它只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。进行校正,或设法消除。第20页/共323页1.3.3过失误差(mistake)(1)定义:一种显然与事实不符的误差一种显然与事实不符的误差(2)产生的原因:实验人员粗心大意造成实验人员粗心大意造成(3)特点:可以完全避免可以完全避免 没有一定的规律没有一定的规律第21页/共323页1.4.1精密度(precision)(1)含义:反映了随机误差大小的程度在一定的试验条件下,多次试验值的彼此符合程度例:甲:例:甲:11.45,11.46,11.45,11.44乙:乙:11.39,11.45,11.48,11.50(2)说明:可以通过增加试验次数而达到提高数据精密度的目的试验数据的精密度是建立在数据用途基础之上的试验过程足够精密,则只需少量几次试验就能满足要求1.4试验数据的精准度 第22页/共323页(3)精密度判断极差(range)标准差(standarderror)R,精密度标准差,精密度第23页/共323页方差(variance)标准差的平方:样本方差(s2)总体方差(2)方差,精密度第24页/共323页1.4.2正确度(correctness)(1)含义:反映系统误差的大小(2)正确度与精密度的关系:n精密度不好,但当试验次数相当多时,有时也会得到好的正确度 n精密度高并不意味着正确度也高(a)(b)(c)第25页/共323页1.4.3准确度(accuracy)(1)含义:反映了系统误差和随机误差的综合表示了试验结果与真值的一致程度(2)三者关系无系统误差的试验 精密度精密度:ABC正确度:正确度:ABC准确度:准确度:ABC第26页/共323页有系统误差的试验 精密度精密度:ABC准确度:准确度:ABC,AB,C第27页/共323页1.5.1随机误差的检验1.5试验数据误差的统计假设检验 1.5.1.1检验(-test)(1)目的:对试验数据的随机误差或精密度进行检验。对试验数据的随机误差或精密度进行检验。在试验数据的总体方差在试验数据的总体方差已知的情况下,已知的情况下,(2)检验步骤:若试验数据若试验数据服从正态分布,则服从正态分布,则 计算统计量第28页/共323页查临界值 服从自由度为服从自由度为的的分布分布显著性水平显著性水平 一般取一般取0.01或或0.05,表示有显著差异的概率,表示有显著差异的概率n双侧(尾)检验(two-sided/tailedtest):检验若若则判断两方差无显著差异,否则有显著差异则判断两方差无显著差异,否则有显著差异第29页/共323页单侧(尾)检验(one-sided/tailedtest):左侧(尾)检验左侧(尾)检验:则判断该方差与原总体方差无显著减小,否则有显著减小则判断该方差与原总体方差无显著减小,否则有显著减小 右侧(尾)检验右侧(尾)检验 则判断该方差与原总体方差无显著增大,否则有显著增大则判断该方差与原总体方差无显著增大,否则有显著增大 若若若若(3)Excel在检验中的应用第30页/共323页1.5.1.2F检验(F-test)(1)目的:对两组具有正态分布的试验数据之间的精密度进行比对两组具有正态分布的试验数据之间的精密度进行比较较(2)检验步骤计算统计量设有两组试验数据:设有两组试验数据:都服从正态分布,样本方差分别为都服从正态分布,样本方差分别为和和和和,则,则第一自由度为第一自由度为第二自由度为第二自由度为服从服从F分布,分布,第31页/共323页查临界值给定的显著水平给定的显著水平查查F分布表分布表临界值临界值n双侧(尾)检验(two-sided/tailedtest):检验若若则判断两方差无显著差异,否则有显著差异则判断两方差无显著差异,否则有显著差异第32页/共323页单侧(尾)检验(one-sided/tailedtest):左侧(尾)检验左侧(尾)检验:则判断该判断方差则判断该判断方差1 1比方差比方差2 2无显著减小,否则有显著减小无显著减小,否则有显著减小 右侧(尾)检验右侧(尾)检验 则判断该方差则判断该方差1比方差比方差2无显著增大,否则有显著增大无显著增大,否则有显著增大 若若若若(3)Excel在F检验中的应用第33页/共323页1.5.2系统误差的检验1.5.2.1t检验法(1)平均值与给定值比较目的:检验服从正态分布数据的算术平均值是否与给定值有显著差异检验步骤:计算统计量:服从自由度服从自由度的的t分布分布(t-distribution)给定值(可以是真值、期望值或标准值)给定值(可以是真值、期望值或标准值)第34页/共323页双侧检验:若若则可判断该平均值与给定值无显著差异,否则就有显著差异则可判断该平均值与给定值无显著差异,否则就有显著差异n单侧检验 左侧检验左侧检验 若若且且则判断该平均值与给定值无显著减小,否则有显著减小则判断该平均值与给定值无显著减小,否则有显著减小 右侧检验右侧检验 若若且且则判断该平均值与给定值无显著增大,否则有显著增大则判断该平均值与给定值无显著增大,否则有显著增大第35页/共323页(2)两个平均值的比较目的:判断两组服从正态分布数据的算术平均值有无目的:判断两组服从正态分布数据的算术平均值有无显著差异显著差异计算统计量:两组数据的方差无显著差异时服从自由度服从自由度的的t分布分布s合并标准差:合并标准差:第36页/共323页两组数据的精密度或方差有显著差异时 服从服从t t分布,其自由度为:分布,其自由度为:t检验第37页/共323页双侧检验:若若则可判断两平均值无显著差异,否则就有显著差异则可判断两平均值无显著差异,否则就有显著差异n单侧检验 左侧检验左侧检验 若若且且则判断该平均值则判断该平均值1较平均值较平均值2无显著减小,否则有显著减小无显著减小,否则有显著减小 右侧检验右侧检验 若若且且则判断该平均值则判断该平均值1较平均值较平均值2无显著增大,否则有显著增大无显著增大,否则有显著增大第38页/共323页(3)成对数据的比较 目的:试验数据是成对出现,判断两种方法、两种仪目的:试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差器或两分析人员的测定结果之间是否存在系统误差计算统计量:成对测定值之差的算术平均值:成对测定值之差的算术平均值:零或其他指定值零或其他指定值 n对试验值之差值的样本标准差:对试验值之差值的样本标准差:服从自由度为服从自由度为的的t分布分布第39页/共323页t检验若否则两组数据之间存在显著的系统误差否则两组数据之间存在显著的系统误差,则成对数据之间不存在显著的系统误差,则成对数据之间不存在显著的系统误差,(4)Excel在t检验中的应用第40页/共323页1.5.2.2秩和检验法(ranksumtest)(1)目的:两组数据或两种试验方法之间是否存在系统误差、两种方法是否等效等,不要求数据具有正态分布(2)内容:设有两组试验数据,相互独立,n1,n2分别是两组数据的个数,总假定n1n2;将这个试验数据混在一起,按从小到大的次序排列每个试验值在序列中的次序叫作该值的秩(rank)将属于第1组数据的秩相加,其和记为R1R1第1组数据的秩和(ranksum)如果两组数据之间无显著差异,则R1就不应该太大或太小第41页/共323页查秩和临界值表:根据显著性水平 和n1,n2,可查得R1的上下限T2和T1检验:如果R1T2或R1T1,则认为两组数据有显著差异,另一组数据有系统误差如果T1R1T2,则两组数据无显著差异,另一组数据也无系统误差 第42页/共323页(3)例:设甲、乙两组测定值为:甲:8.6,10.0,9.9,8.8,9.1,9.1乙:8.7,8.4,9.2,8.9,7.4,8.0,7.3,8.1,6.8已知甲组数据无系统误差,试用秩和检验法检验乙组测定值是否有系统误差。(0.05)解:(1)排序:秩秩1234567891011.511.5131415甲甲8.68.89.19.19.910.0乙乙6.87.37.48.08.18.48.78.99.2第43页/共323页(2)求秩和R1R1=7911.511.5141568(3)查秩和临界值表对于 0.05,n1=6,n2=9得T1=33,T263,R1T2故:两组数据有显著差异,乙组测定值有系统误差第44页/共323页1.5.3异常值的检验 可疑数据、离群值、异常值可疑数据、离群值、异常值 一般处理原则为:在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误试验结束后,在分析试验结果时,如发现异常数据,则应先找出产生差异的原因,再对其进行取舍在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行统计处理;若数据较少,则可重做一组数据对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计方法 第45页/共323页1.5.3.1拉依达()检验法内容:可疑数据xp,若则应将该试验值剔除。说明:n计算平均值及标准偏差s时,应包括可疑值在内n3s相当于显著水平 0.01,2s相当于显著水平 0.05第46页/共323页可疑数据应逐一检验,不能同时检验多个数据 首先检验偏差最大的数首先检验偏差最大的数 剔除一个数后,如果还要检验下一个数,应重新计算平均值及标准偏差方法简单,无须查表 该检验法适用于试验次数较多或要求不高时3s3s为界时,要求为界时,要求n n10102s2s为界时,要求为界时,要求n n5 5 第47页/共323页有一组分析测试数据:0.128,0.129,0.131,0.133,0.135,0.138,0.141,0.142,0.145,0.148,0.167,问其中偏差较大的0.167这一数据是否应被舍去?(0.01)解:(1)计算例:(2)计算偏差(3)比较3s30.011160.03350.027故按拉依达准则,当 0.01时,0.167这一可疑值不应舍去第48页/共323页(2)格拉布斯(Grubbs)检验法内容:可疑数据xp,若 则应将该值剔除。Grubbs检验临界值检验临界值第49页/共323页格拉布斯(Grubbs)检验临界值G(,n)表第50页/共323页说明:计算平均值及标准偏差s时,应包括可疑值在内可疑数据应逐一检验,不能同时检验多个数据首先检验偏差最大的数首先检验偏差最大的数剔除一个数后,如果还要检验下一个数,应重新计算平均值及标准偏差能适用于试验数据较少时格拉布斯准则也可以用于检验两个数据偏小,或两个数据偏大的情况例:例1-13第51页/共323页(3)狄克逊(Dixon)检验法 单侧情形将n个试验数据按从小到大的顺序排列:x1x2xn-1xn如果有异常值存在,必然出现在两端,即x1或xn计算出统计量D或D查单侧临界值检验xn时,当 时,可剔除xnn检验检验x1时,当 时,可剔除x1第52页/共323页双侧情形计算D和D查双侧临界值n检验 当当 ,判断判断为异常值为异常值 当当 ,判断判断为异常值为异常值 第53页/共323页说明适用于试验数据较少时的检验,计算量较小单侧检验时,可疑数据应逐一检验,不能同时检验多个数据剔除一个数后,如果还要检验下一个数,应重新排序例:例1-14 第54页/共323页1.6.1有效数字(significancefigure)能够代表一定物理量的数字能够代表一定物理量的数字有效数字的位数可反映试验或试验仪表的精度数据中小数点的位置不影响有效数字的位数例如:例如:50,0.050m,5.0104m第一个非0数前的数字都不是有效数字,而第一个非0数后的数字都是有效数字例如:例如:29和和29.00第一位数字等于或大于8,则可以多计一位例如:例如:9.991.6有效数字和试验结果的表示第55页/共323页1.6.2有效数字的运算(1)加、减运算:与其中小数点后位数最少的相同(2)乘、除运算以各乘、除数中有效数字位数最少的为准(3)乘方、开方运算:与其底数的相同:例如:例如:2.42=5.8(4)对数运算:与其真数的相同例如例如ln6.841.92;lg0.000044第56页/共323页(5)在4个以上数的平均值计算中,平均值的有效数字可增加一位(6)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。(7)一些常数的有效数字的位数可以认为是无限制的例如,圆周率例如,圆周率、重力加速度、重力加速度g g、1/31/3等等(8)一般在工程计算中,取23位有效数字第57页/共323页1.6.3有效数字的修约规则4:舍去5,且其后跟有非零数字,进1位例如:例如:3.141593.1425,其右无数字或皆为0时,“尾留双”:若所保留的末位数字为奇数则进若所保留的末位数字为奇数则进1若所保留的末位数字为偶数则舍弃若所保留的末位数字为偶数则舍弃例如:例如:3.14153.1421.36651.366第58页/共323页1.7误差的传递误差的传递:根据直接测量值的误差来计算间接测量值的误差1.7.1误差传递基本公式间接测量值y与直接测量值xi之间函数关系:全微分全微分第59页/共323页函数或间接测量值的绝对误差为:n相对误差为:误差传递系数直接测量值的绝对误差;间接测量值的绝对误差或称函数的绝对误差。第60页/共323页函数标准误差传递公式:1.7.2常用函数的误差传递公式表1-4第61页/共323页1.7.3误差传递公式的应用(1)根据各分误差的大小,来判断间接测量或函数误差的主要来源:例例1-16(2)选择合适的测量仪器或方法:例例1-17第62页/共323页秩和临界值表 第63页/共323页n检验高端异常值检验高端异常值检验低端异常值检验低端异常值3781011131430统计量D计算公式第64页/共323页第第2 2章章 试验数据的表图表示法试验数据的表图表示法第65页/共323页2.1列表法将试验数据列成表格,将各变量的数值依照一定的形式和顺序一一对应起来(1)试验数据表记录表试验记录和试验数据初步整理的表格表中数据可分为三类:原始数据原始数据 中间数据中间数据最终计算结果数据最终计算结果数据第66页/共323页结果表示表表达试验结论 应简明扼要第67页/共323页(2)说明:三部分:三部分:表名、表头、数据资料表名、表头、数据资料 必要时,在表格的下方加上必要时,在表格的下方加上表外附加表外附加 表名表名应放在表的上方,主要用于说明表的主要内容,为应放在表的上方,主要用于说明表的主要内容,为了引用的方便,还应包含了引用的方便,还应包含表号表号 表头表头常放在第一行或第一列,也称为行标题或列标题,常放在第一行或第一列,也称为行标题或列标题,它主要是表示所研究问题的类别名称和指标名称它主要是表示所研究问题的类别名称和指标名称 数据资料数据资料:表格的主要部分,应根据表头按一定的规律表格的主要部分,应根据表头按一定的规律排列排列 表外附加表外附加通常放在表格的下方,主要是一些不便列在表通常放在表格的下方,主要是一些不便列在表内的内容,如指标注释、资料来源、不变的试验数据等内的内容,如指标注释、资料来源、不变的试验数据等 第68页/共323页(3)注意:表格设计应简明合理、层次清晰,以便阅读和使用;数据表的表头要列出变量的名称、符号和单位;要注意有效数字位数;试验数据较大或较小时,要用科学记数法来表示,并记入表头,注意表头中的与表中的数据应服从下式:数据的实际值10n表中数据;数据表格记录要正规,原始数据要书写得清楚整齐,要记录各种试验条件,并妥为保管。第69页/共323页2.2.1常用数据图(1)线图(linegraph/chart)表示因变量随自变量的变化情况线图分类:单式线图:表示某一种事物或现象的动态复式线图:在同一图中表示两种或两种以上事物或现象的动态,可用于不同事物或现象的比较2.2图示法第70页/共323页图图1 1 高吸水性树脂保水率与时间和温度的关系高吸水性树脂保水率与时间和温度的关系第71页/共323页图图2某离心泵特性曲线某离心泵特性曲线第72页/共323页(2)XY散点图(scatterdiagram)表示两个变量间的相互关系 散点图可以看出变量关系的统计规律 图图3散点图散点图第73页/共323页(3)条形图和柱形图用等宽长条的长短或高低来表示数据的大小,以反映各数据点的差异两个坐标轴的性质不同数值轴数值轴 :表示数量性因素或变量:表示数量性因素或变量 分类轴分类轴 :表示的是属性因素或非数量性变量:表示的是属性因素或非数量性变量图图4不同提取方法提取率比较不同提取方法提取率比较第74页/共323页分类:单式:只涉及一个事物或现象单式:只涉及一个事物或现象 复式:涉及到两个或两个以上的事物或现象复式:涉及到两个或两个以上的事物或现象 图图5不同提取方法对两种原料有效成分提取率效果比较不同提取方法对两种原料有效成分提取率效果比较第75页/共323页(4)圆形图和环形图圆形图(circlechart)也称为饼图(piegraph)表示总体中各组成部分所占的比例只适合于包含一个数据系列的情况饼图的总面积看成100%,每3.6圆心角所对应的面积为1%,以扇形面积的大小来分别表示各项的比例图图6全球天然维生素全球天然维生素E消费比例消费比例第76页/共323页环形图(circulardiagram)每一部分的比例用环中的一段表示 可显示多个总体各部分所占的相应比例,有利于比较图图7全球合成、天然维生素全球合成、天然维生素E消费比例比较消费比例比较第77页/共323页(5)三角形图(ternary)常用于表示三元混合物各组分含量或浓度之间的关系常用于表示三元混合物各组分含量或浓度之间的关系 三角形:等腰Rt、等边、不等腰Rt等顶点:纯物质边:二元混合物三角形内:三元混合物MABSxAxSxB1xAxS图图8等腰直角三角形坐标图等腰直角三角形坐标图第78页/共323页ABCxCxBxAxAxAxCxCxBxBMEF图图9等边三角形坐标图等边三角形坐标图第79页/共323页(6)三维表面图(3Dsurfacegraph)三元函数三元函数Z=f(X,Y)对应的曲面图,根据曲面图可以看对应的曲面图,根据曲面图可以看出因变量出因变量Z值随自变量值随自变量X和和Y值的变化情况值的变化情况 图图10三维表面图三维表面图 第80页/共323页(7)三维等高线图(contourplot)三维表面图上Z值相等的点连成的曲线在水平面上的投影 图图11三维等高线图三维等高线图 第81页/共323页绘制图形时应注意绘制图形时应注意:(1)在绘制线图时,要求曲线光滑,并使曲线尽可能通过较多的实验点,或者使曲线以外的点尽可能位于曲线附近,并使曲线两侧的点数大致相等;(2)定量的坐标轴,其分度不一定自零起;(3)定量绘制的坐标图,其坐标轴上必须标明该坐标所代表的变量名称、符号及所用的单位,一般用纵轴代表因变量;(4)坐标轴的分度应与试验数据的有效数字位数相匹配;(5)图必须有图号和图题(图名),以便于引用,必要时还应有图注。第82页/共323页2.2.2坐标系的选择坐标系(coordinatesystem)笛卡尔坐标系(又称普通直角坐标系)、半对数坐标系、对数坐标系、极坐标系、概率坐标系、三角形坐标系.对数坐标系(semi-logarithmiccoordinatesystem)半对数坐标系半对数坐标系 双对数坐标系双对数坐标系第83页/共323页(1)选用坐标系的基本原则:根据数据间的函数关系线性函数:普通直角坐标系线性函数:普通直角坐标系幂函数:双对数坐标系幂函数:双对数坐标系指数函数:半对数坐标指数函数:半对数坐标根据数据的变化情况两个变量的变化幅度都不大,选用普通直角坐标系;两个变量的变化幅度都不大,选用普通直角坐标系;有一个变量的最小值与最大值之间数量级相差太大时,可以选用有一个变量的最小值与最大值之间数量级相差太大时,可以选用半对数坐标;半对数坐标;两个变量在数值上均变化了几个数量级,可选用双对数坐标;两个变量在数值上均变化了几个数量级,可选用双对数坐标;在自变量由零开始逐渐增大的初始阶段,当自变量的少许变化引在自变量由零开始逐渐增大的初始阶段,当自变量的少许变化引起因变量极大变化时,此时采用半对数坐标系或双对数坐标系,起因变量极大变化时,此时采用半对数坐标系或双对数坐标系,可使图形轮廓清楚可使图形轮廓清楚第84页/共323页例:x10204060801001000200030004000y24146080100177181188200图图12普通直角坐标系普通直角坐标系第85页/共323页图图13对数坐标系对数坐标系第86页/共323页(2)坐标比例尺的确定在变量x和y的误差x,y已知时,比例尺的取法应使试验“点”的边长为2x,2y,而且使2x2y12,若2y2,则y轴的比例尺My应为:推荐坐标轴的比例常数M(1、2、5)10n(n为正整数),而3、6、7、8等的比例常数绝不可用;纵横坐标之间的比例不一定取得一致,应根据具体情况选择,使曲线的坡度介于3060之间第87页/共323页例2:研究pH值对某溶液吸光度A的影响,已知pH值的测量误差pH0.1,吸光度A的测量误差A0.01。在一定波长下,测得pH值与吸光度A的关系数据如表所示。试在普通直角坐标系中画出两者间的关系曲线。pH8.09.010.011.0吸光度A1.341.361.451.36设设2pH2A2mm解:解:pH0.1,A0.01横轴的比例尺为横轴的比例尺为纵轴的比例尺为纵轴的比例尺为第88页/共323页图图14坐标比例尺对图形形状的影响坐标比例尺对图形形状的影响第89页/共323页2.3.1Excel在图表绘制中的应用(1)利用Excel生成图表的基本方法(2)对数坐标的绘制(3)双Y轴(X轴)复式线图的绘制(4)图表的编辑和修改2.3.2Origin在图形绘制中的应用(1)简单二维图绘制的基本方法(2)三角形坐标图的绘制(3)三维图的绘制2.3计算机绘图软件在图表绘制中应用第90页/共323页表2-1离心泵特性曲线测定实验的数据记录表序号序号流量计读数流量计读数/(L/h)真空表读数真空表读数/MPa压力表读数压力表读数/MPa功率表读数功率表读数/W12附:泵入口管径:附:泵入口管径:_mm;泵出口管径:;泵出口管径:_mm;真空表与压力表;真空表与压力表垂直距离:垂直距离:_mm;水温:;水温:_;电动机转速;电动机转速r/min。第91页/共323页第92页/共323页第第3 3章章 试验的方差分析试验的方差分析 第93页/共323页方差分析(analysisofvariance,简称ANOVA)检验试验中有关因素对试验结果影响的显著性检验试验中有关因素对试验结果影响的显著性试验指标(experimentalindex)衡量或考核试验效果的参数衡量或考核试验效果的参数因素(experimentalfactor)影响试验指标的条件影响试验指标的条件可控因素可控因素(controllablefactor)水平(leveloffactor)因素的不同状态或内容因素的不同状态或内容 第94页/共323页3.1单因素试验的方差分析(one-wayanalysisofvariance)3.1.1单因素试验方差分析基本问题(1)目的:检验一个因素对试验结果的影响是否显著性(2)基本命题:设某单因素A有r种水平:A1,A2,Ar,在每种水平下的试验结果服从正态分布在各水平下分别做了ni(i1,2,r)次试验判断因素A对试验结果是否有显著影响 第95页/共323页(3)单因素试验数据表试验次数试验次数A1A2AiAr1x11x21xi1xr12x12x22xi2xr2jx1jx2jxijxrjnix1n1x2n2xinixrnr第96页/共323页3.1.2单因素试验方差分析基本步骤(1)计算平均值组内平均值:n总平均:第97页/共323页(2)计算离差平方和总离差平方和SST(sumofsquaresfortotal)n 表示了各试验值与总平均值的偏差的平方和表示了各试验值与总平均值的偏差的平方和n 反映了试验结果之间存在的总差异反映了试验结果之间存在的总差异 组间离差平方和SSA(sumofsquareforfactorA)n反映了各组内平均值之间的差异程度反映了各组内平均值之间的差异程度n由于因素由于因素A不同水平的不同作用造成的不同水平的不同作用造成的第98页/共323页组内离差平方和SSe(sumofsquareforerror)反映了在各水平内,各试验值之间的差异程度反映了在各水平内,各试验值之间的差异程度 由于随机误差的作用产生由于随机误差的作用产生 三种离差平方和之间关系:三种离差平方和之间关系:第99页/共323页(3)计算自由度(degreeoffreedom)总自由度:dfTn1组间自由度:dfAr1组内自由度:dfenr三者关系三者关系:dfTdfAdfe(4)计算平均平方均方离差平方和除以对应的自由度MSA组间均方组间均方MSe组内均方组内均方/误差的均方误差的均方第100页/共323页(5)F检验服从自由度为(服从自由度为(dfA,dfe)的)的F分布(分布(Fdistribution)对于给定的显著性水平对于给定的显著性水平,从,从F分布表查得临界值分布表查得临界值F(dfA,dfe)如果如果FAF(dfA,dfe),则认为因素,则认为因素A对试验结果有显著对试验结果有显著影响否则认为因素影响否则认为因素A对试验结果没有显著影响对试验结果没有显著影响第101页/共323页(6)方差分析表若若FAF0.01(dfA,dfe),称因素,称因素A对试验结果有非常显对试验结果有非常显著的影响,用著的影响,用“*”号表示;号表示;若若F0.05(dfA,dfe)FAF0.01(dfA,dfe),则因素,则因素A对对试验结果有显著的影响,用试验结果有显著的影响,用“*”号表示;号表示;若若FAF0.05(dfA,dfe),则因素,则因素A对试验结果的影响不对试验结果的影响不显著显著单因素试验的方差分析表单因素试验的方差分析表 差异源差异源SSdfMSF显著性显著性组间(因素组间(因素A)SSAr1MSASSA(r1)MSAMSe组内(误差)组内(误差)SSenrMSeSSe(nr)总和总和SSTn1第102页/共323页3.1.3Excel在单因素试验方差分析中的应用利用Excel“分析工具库”中的“单因素方差分析”工具第103页/共323页3.2双因素试验的方差分析讨论两个因素对试验结果影响的显著性,又称讨论两个因素对试验结果影响的显著性,又称“二元方二元方差分析差分析”3.2.1双因素无重复试验的方差分析(1)双因素无重复试验B1B2BsA1x11x12x1sA2x21x22x2sArxr1xr2xrs第104页/共323页(2)双因素无重复试验方差分析的基本步骤计算平均值 总平均:n Ai水平时:n Bj水平时:第105页/共323页计算离差平方和总离差平方和:因素A引起离差的平方和:因素B引起离差的平方和:误差平方和:第106页/共323页计算自由度 SSA的自由度:dfAr1SSB的自由度:dfBs1SSe的自由度:dfe(r1)(s1)SST的自由度:dfTn1rs1dfTdfAdfBdfe计算均方 第107页/共323页F检验FA服从自由度为(dfA,dfe)的F分布;FB服从自由度为(dfB,dfe)的F分布;对于给定的显著性水平,查F分布表:F(dfA,dfe),F(dfB,dfe)若FAF(dfA,dfe),则因素A对试验结果有显著影响,否则无显著影响;若FBF(dfB,dfe),则因素B对试验结果有显著影响,否则无显著影响;第108页/共323页差异源差异源SSdfMSF显著性显著性因素因素ASSAr1因素因素BSSBs1误差误差SSe总和总和SSTrs1无重复试验双因素方差分析表 无重复试验双因素方差分析表无重复试验双因素方差分析表第109页/共323页因素因素B1B2BsA1A2Ar3.2.2双因素重复试验的方差分析(1)双因素重复试验方差分析试验表双因素重复试验方差分析试验表双因素重复试验方差分析试验表第110页/共323页(2)双因素重复试验方差分析的基本步骤计算平均值总平均:任一组合水平(Ai,Bj)上:Ai水平时:Bj水平时:第111页/共323页计算离差平方和总离差平方和:因素A引起离差的平方和:因素B引起离差的平方和:交互作用AB引起离差的平方和:误差平方和:第112页/共323页计算自由度SSA的自由度:dfAr1SSB的自由度:dfBs1SSAB的自由度:dfAB(r1)(s1)SSe的自由度:dfers(c 1)SST的自由度:dfTn1rsc1dfTdfAdfBdfABdfe第113页/共323页计算均方第114页/共323页F检验若FAF(dfA,dfe),则认为因素A对试验结果有显著影响,否则无显著影响;若FBF(dfB,dfe),则认为因素B对试验结果有显著影响,否则无显著影响;若FABF(dfAB,dfe),则认为交互作用AB对试验结果有显著影响,否则无显著影响。第115页/共323页重复试验双因素方差分析表第116页/共323页3.2.3Excel在双因素方差分析中的应用(1)双因素无重复试验方差分析利用“分析工具库”中的“无重复双因素方差分析”工具(2)双因素重复试验方差分析利用“分析工具库”中的“重复双因素方差分析”工具第117页/共323页第第4 4章章 试验数据的回归分析试验数据的回归分析第118页/共323页4.1基本概念(1)相互关系确定性关系:变量之间存在着严格的函数关系变量之间存在着严格的函数关系相关关系:变量之间近似存在某种函数关系变量之间近似存在某种函数关系(2)回归分析(regressionanalysis)处理变量之间相关关系的统计方法确定回归方程确定回归方程:变量之间近似的函数关系式变量之间近似的函数关系式检验回归方程的显著性检验回归方程的显著性试验结果预测试验结果预测第119页/共323页4.2一元线性回归分析4.2.1一元线性回归方程的建立(1)最小二乘原理设有一组试验数据(如表),若x,y符合线性关系xx1x2xnyy1y2yn第120页/共323页计算值与试验值yi不一定相等 与yi之间的偏差称为残差:a,b回归系数(回归系数(regr