2,实验数据处理.ppt
《2,实验数据处理.ppt》由会员分享,可在线阅读,更多相关《2,实验数据处理.ppt(126页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2 实验数据处理实验数据处理材料学院材料学院 武建军武建军 前一页 休息l在自然界中,有很多的现象是不能用我们以前所学的知识所能解决的研究动机l比如我们在耐液锌蚀腐蚀合金研究过程中,它是由许多种元素配合,再通过高温熔炼而成。可以用多少种成份来配料,熔炼温度需要多高,后续如何处理?这些往往都是未知数。而且没有一定的规律可言。那就需要我们进行大量的试验来寻找它的配方及烧制温度。前一页 休息l在实验过程中将要利用各种方法对样品进行分析测试,产生许多测量数据。l按测量值获得的方法分为:直接测量、间接测量和组合测量l直接测量:如用米尺测量长度l间接测量:利用直接测量结果,根据特定关系计算特定物理量,如晶
2、面间距测量l组合测量:测量长宽,计算面积 前一页 休息第二章第二章 实验数据处理实验数据处理 l在自然科学领域,常用函数表达变量之间的数量关在自然科学领域,常用函数表达变量之间的数量关系系例如扩散层厚度与时间的关系,利用公式便于分析规律l如何利用有限的实验数据拟合出一个近似公式如何利用有限的实验数据拟合出一个近似公式,这这就是参数拟合问题。就是参数拟合问题。确定参数的方法主要有最小二乘法和最大似然法。l如要判断一组数据是否在某个精度范围内与理论公如要判断一组数据是否在某个精度范围内与理论公式一致式一致,就是假设检验问题。就是假设检验问题。l采用代数多项式来表示复杂的函数采用代数多项式来表示复杂
3、的函数,可用插值法可用插值法 前一页 休息2.1 2.1 误差理论简介误差理论简介 l误差的含义误差的含义绝对误差相对误差l置信区间置信区间贝叶斯理论区间估计l不同分布样本的区间估计不同分布样本的区间估计 前一页 休息一、误差的含义一、误差的含义l可以通过一定的试验测试或运算用估可以通过一定的试验测试或运算用估计值表示理论值的近似值。试验值计值表示理论值的近似值。试验值(估计值)与理论值(真值)之间的(估计值)与理论值(真值)之间的差值称绝对误差,简称误差。差值称绝对误差,简称误差。l真值往往很难得到,因而误差的绝对真值往往很难得到,因而误差的绝对值也是无法知道的。但是根据测量工值也是无法知道
4、的。但是根据测量工具或计算情况可以估计误差值上限或具或计算情况可以估计误差值上限或估计值的精确程度。估计值的精确程度。前一页 休息相对误差相对误差l误差限的大小还不能完全表示近似值误差限的大小还不能完全表示近似值的好坏,如的好坏,如101101与与1000510005两个量,两个量,虽然前者绝对误差较小,但是显然后虽然前者绝对误差较小,但是显然后者更精确。者更精确。l所以除了考虑误差的大小以外,还应所以除了考虑误差的大小以外,还应考虑准确值本身的大小,误差与准确考虑准确值本身的大小,误差与准确值的比值称为近似值的相对误差。值的比值称为近似值的相对误差。前一页 休息系统误差与随机误差系统误差与随
5、机误差l系统误差系统误差 由于某种原因所产生,并遵循一定的规由于某种原因所产生,并遵循一定的规律进行变化律进行变化.例如,随样品或试剂用量的大小按比例如,随样品或试剂用量的大小按比例进行变化例进行变化.l系统误差有一定的指向,系统误差有一定的指向,例如称量一种吸湿性物质,例如称量一种吸湿性物质,其误差总是正值其误差总是正值.它属于方法和技术问题,知道了它属于方法和技术问题,知道了产生的原因,便可消除或修正,所以此种误差也称产生的原因,便可消除或修正,所以此种误差也称可定误差可定误差.l随机误差随机误差 在相同条件下重复多次测定同一物理在相同条件下重复多次测定同一物理量时,误差大小或正负变化纯属
6、偶然而毫无规律,量时,误差大小或正负变化纯属偶然而毫无规律,这种误差称为随机误差,也叫偶然误差这种误差称为随机误差,也叫偶然误差.前一页 休息系统误差的特点l重现性l单向性l数值基本恒定l系统误差可以校正。可用一定的方法消除。前一页 休息随机误差分布随机误差分布l随机误差是不可预测、不可避免的随机误差是不可预测、不可避免的l根据统计理论,随机误差服从高斯分布根据统计理论,随机误差服从高斯分布(正态分布)(正态分布)l随机误差具有随机误差具有单峰性:较小误差出现的几率较大对称性:绝对值相等的正负误差出现的几率相等有界性:大误差出现的几率较低l因此,测量次数较多时,均值会趋于真值因此,测量次数较多
7、时,均值会趋于真值 前一页 休息随机误差的估算随机误差的估算l算术平均误差算术平均误差 用算用算术平均代替真值,术平均代替真值,可以计算绝对误差可以计算绝对误差的平均值。的平均值。l标准误差(方差)标准误差(方差)反映数据偏离真值反映数据偏离真值的分散程度,即均的分散程度,即均值与真值之间的接值与真值之间的接近程度。近程度。前一页 休息几个精度概念几个精度概念l精密度:多次测量结果之间的符合程精密度:多次测量结果之间的符合程度,反映随机误差的大小,重现性度,反映随机误差的大小,重现性l正确度:系统误差的大小正确度:系统误差的大小l准确度:测量值与真值的一致程度,准确度:测量值与真值的一致程度,
8、反映系统误差与随机误差的综合反映系统误差与随机误差的综合 前一页 休息在在热热工工、电电工工仪仪表表中中,正正确确度度等等级级一一般般都都用用引引用用误误差差来来表表示示,通通常常分分为为0.1,0.2,0.5,1.0,1.5,2.5,5.0 七级。七级。例例如如,某某仪仪表表正正确确度度等等级级为为R级级(引引用用误误差差R%),满满量量程程的的刻刻度度为为X,实实际使用时的测量值为际使用时的测量值为 x(x X),),则则 前一页 休息l通过上面的分析,可知为了减少通过上面的分析,可知为了减少仪表测量的误差,提高正确度,仪表测量的误差,提高正确度,应该使仪表尽可能在靠近满量程应该使仪表尽可
9、能在靠近满量程刻度的刻度的2/3以上的区域内使用的原以上的区域内使用的原则。则。前一页 休息提高实验数据准确度的方法 减少系统误差的途径 对照实验 空白实验 校准仪器 校正方法 减少偶然误差的途径 多次测量、取平均值 防范过失!前一页 休息粗大粗大误差误差l粗大误差也称过失误差,是一种不应发生,粗大误差也称过失误差,是一种不应发生,而仅由于粗心、疏忽等引起的误差。而仅由于粗心、疏忽等引起的误差。l往往是由于非正常实验条件或非正常操作往往是由于非正常实验条件或非正常操作所造成的所造成的.如测量时对错了标志如测量时对错了标志,误读了数误读了数码码,实验仪器未达到预想的指标,记录计算实验仪器未达到预
10、想的指标,记录计算错误,加错了试剂等错误,加错了试剂等l粗大误差的数值远大于系统误差和随机误粗大误差的数值远大于系统误差和随机误差,实际上已超出了误差范围差,实际上已超出了误差范围l含有粗差的测量值常称为坏值或异常值含有粗差的测量值常称为坏值或异常值,应应予以剔除予以剔除,否则会影响结果否则会影响结果 前一页 休息坏值剔除坏值剔除l用统计法进行坏值剔除的基本思想是:用统计法进行坏值剔除的基本思想是:给定一显著性水平给定一显著性水平,并确定一门限,并确定一门限值,凡超过这个门限的误差就认为它值,凡超过这个门限的误差就认为它不属于随机误差的范畴,而是粗差,不属于随机误差的范畴,而是粗差,并予以剔除
11、并予以剔除.前一页 休息拉依达拉依达()准则准则l拉依达准则又被简称为拉依达准则又被简称为3准则。由于随准则。由于随机误差服从正态分布规律,因此机误差服从正态分布规律,因此 P|3=99.7l有限次测量误差超过有限次测量误差超过3的几率很小,可的几率很小,可以剔除以剔除l由于实际上由于实际上未知,如果未知,如果 可以剔除,弃真几率很小可以剔除,弃真几率很小 前一页 休息例例某合金导线的电阻值测量次序电阻值/W 测量次序电阻值/W 测量次序电阻值/W140.42940.401740.42240.431040.431840.41340.381140.421940.39440.441240.4320
12、40.39540.461340.392140.30640.421440.362240.42740.401540.402340.43840.431640.432440.43 前一页 休息l24个测量值的均值为个测量值的均值为40.41l24个测量值的标准差个测量值的标准差S0.0321l3S0.0963l与平均值偏差最大的是与平均值偏差最大的是21次测量结果次测量结果40.30,偏差,偏差0.11,超过,超过3S,坏值,坏值l去掉该值后,均值去掉该值后,均值40.41,S0.0225l偏差最大(偏差最大(5,14)0.053S,有效,有效 前一页 休息肖维勒准则肖维勒准则l肖维勒认为,在肖维勒认
13、为,在n次测次测量中,某误差可能出现量中,某误差可能出现的次数小于半次时,则的次数小于半次时,则舍去这个误差值。舍去这个误差值。l误差等于或大于误差等于或大于出现出现的相对频数可近似地取的相对频数可近似地取为为1-Pl测量次数为测量次数为n,误差等,误差等于或大于于或大于 出现的次数出现的次数为为n(1-P)S S,即可判断为粗即可判断为粗差差 前一页 休息Chauvenet系数的数值表系数的数值表 n in in i34567891011121.381.531.651.731.801.861.921.962.002.03131415161718192021222.072.102.132.15
14、2.172.202.222.242.262.28232425304050751002005002.302.312.332.392.492.582.712.813.023.20 前一页 休息Grubbs准则准则l 格拉布斯格拉布斯(FEGrubbs)准则同样适用于准则同样适用于对同一参数进行重复测量得到的一列测量数对同一参数进行重复测量得到的一列测量数据的处理。据的处理。l这个准则经蒙持卡罗法考验后,认为是最有这个准则经蒙持卡罗法考验后,认为是最有效的判别方法。效的判别方法。l同上,当同上,当 时则认为时则认为xi是含有粗值是含有粗值的坏值,应予剔除的坏值,应予剔除 前一页 休息Grubbs系数
15、数值表系数数值表n n n 0.010.050.010.050.010.05345678910111.151.491.751.912.102.222.322.412.481.151.461.671.821.912.032.112.182.241213141516171819202.552.612.662.702.742.782.822.852.882.292.332.372.412.412.472.502.532.562122232425303540502.912.942.952.993.013.103.183.213.342.582.602.622.642.662.742.812.872.9
16、6 前一页 休息t检验法检验法l该准则又可称为罗曼诺夫准则。当测该准则又可称为罗曼诺夫准则。当测量次数较小时,按量次数较小时,按t分布的实际误差分分布的实际误差分布范围来判断粗大误差较为合理。布范围来判断粗大误差较为合理。lt检验准则的原则是:首先剔除一个与检验准则的原则是:首先剔除一个与均值偏离最大的数据,然后对剩余的均值偏离最大的数据,然后对剩余的数据进行统计计算,以判定该次剔除数据进行统计计算,以判定该次剔除是否合理,即判定已被剔除的那个数是否合理,即判定已被剔除的那个数据是否含有粗大误差。据是否含有粗大误差。前一页 休息l在剔除某一数据在剔除某一数据xi后,重新计算均值和方后,重新计算
17、均值和方差,如果时,剔除坏值差,如果时,剔除坏值xil其中其中lT为为t分布,自由度分布,自由度f=n-2 前一页 休息Dixon 准则准则l狄克松狄克松(Dixon)准则采用了极差比的方法,不必求方差。准则采用了极差比的方法,不必求方差。l对于某一等精度重复测量,按测量值的大小排列为对于某一等精度重复测量,按测量值的大小排列为 x1x2xnl如果上述测量值中有含有粗大误差的测量数据,首先值得怀如果上述测量值中有含有粗大误差的测量数据,首先值得怀疑的是疑的是x1、xn。l狄克松首先定义了一个与狄克松首先定义了一个与x1,xn和、和、n有关的极差比统计量有关的极差比统计量f(f的计算公式见表的计
18、算公式见表),如果,如果 f临界值临界值f(a,n)l则认为在显著性水平下,则认为在显著性水平下,x1、xn含有粗大误差,应予以剔除。含有粗大误差,应予以剔除。l 狄克松准则一次能判别两个数据狄克松准则一次能判别两个数据x1,xn,如果这两个数据都如果这两个数据都不含粗大误差,判断结束。不含粗大误差,判断结束。l如果这两个数据中有含粗大误差的数据,则予以剔除。剔除如果这两个数据中有含粗大误差的数据,则予以剔除。剔除后的数据列当做新的数据列,重新进行判断后的数据列当做新的数据列,重新进行判断 前一页 休息 前一页 休息实验结果的表示实验结果的表示l测量结果最常用的表示方式是均值和标准偏差。前测量
19、结果最常用的表示方式是均值和标准偏差。前者表征测试量的大小,后者表征测试的精密度。者表征测试量的大小,后者表征测试的精密度。l与之有关的是有效位的取舍与之有关的是有效位的取舍.所谓有效位是指某种所谓有效位是指某种测量所达到的精度测量所达到的精度.如下列测试值:如下列测试值:10.09,10.11,10.09,10.10和和10.12,其均值为,其均值为10.102,标准偏差为,标准偏差为0.0130.但测试值仅准确到小但测试值仅准确到小数点后面第一位,而第二位为可疑位,故结果的表数点后面第一位,而第二位为可疑位,故结果的表示为:示为:前一页 休息二、置信度与置信区间二、置信度与置信区间l设一未
20、知参数设一未知参数X(例如材料的硬度例如材料的硬度),虽然其虽然其精确值未知,但是可由若干试验值(样本)精确值未知,但是可由若干试验值(样本)估计它在某个范围内。如果有区间估计它在某个范围内。如果有区间x1,x2,对于给定值对于给定值m(0 m1),),X值在值在X1-X2之间出现的概率满足之间出现的概率满足lP(X1XX2)=ml则称随机区间则称随机区间x1,x2是是X的的100m%置信区置信区间,间,X1是置信下限,是置信下限,X2是置信上限,百分是置信上限,百分数数100m%称为置信度。称为置信度。前一页 休息置信区间举例置信区间举例l假如真值为假如真值为XoXo,拟合出参数的值拟合出参
21、数的值XX,XX,意味着在某个概率下意味着在某个概率下,多次测量的多次测量的X X估计值估计值(近似等于近似等于Xo)Xo)可以落在以上范围内。可以落在以上范围内。l如果估计值如果估计值X X服从正态分布服从正态分布,X,X在某范围在某范围(如如XX1 1,X,X2 2 区间区间)选值的概率等于高斯概率密度选值的概率等于高斯概率密度曲线下曲线下X X1 1到到X X2 2的面积。若采用标准误差的面积。若采用标准误差和和测量值测量值X X来表示测得的真值来表示测得的真值XoXo范围范围,则则P(X -Xo X +)0.68P(X-2 Xo X+2)0.95P(X-3 Xo X+3)0.9974l
22、显然,区间越宽,置信度越高。显然,区间越宽,置信度越高。前一页 休息三、不同分布的区间估计三、不同分布的区间估计l1.对于正态分布样本,可以对于正态分布样本,可以用若干样用若干样本平均值估计总体平均值本平均值估计总体平均值 前一页 休息举例举例 前一页 休息例二例二l如果方差未知,可以用样本方差如果方差未知,可以用样本方差s s作为作为总体方差总体方差的近似值,样本均值与整的近似值,样本均值与整体均值之间服从体均值之间服从t t分布分布。前一页 休息例例3l钢中钢中Cr含量的含量的5次次测定结果测定结果(%)为为1.12,1.15,1.11,1.16,1.12。根据。根据这批数据估计这批数据估
23、计Cr的的含量范围含量范围(90%)。l1.10,1.16 前一页 休息normfitlMU估计值估计值,SIGMA估计值估计值,MU区间区间,SIGMA区间区间=normfit(x,alpha)对给定数对给定数据据x,在置信度在置信度100(1-)条件下给出正态条件下给出正态分布参数的无偏估计分布参数的无偏估计 l该函数输入变量最多该函数输入变量最多2个,第个,第2参数参数 的的缺缺省值省值=0.05 对应于置信度对应于置信度90%(双边)或(双边)或95%(单边)。(单边)。l函数的输出值最多可以有函数的输出值最多可以有4个,可以选择前个,可以选择前14个作为输出结果。个作为输出结果。前一
24、页 休息2.0-12.0-1分布参数的估计分布参数的估计 前一页 休息举例举例 前一页 休息binofitlbinofit 对对二项分布数据参数和置信区二项分布数据参数和置信区间估计间估计lbinofit(x,n)对于给定数据对于给定数据 X返回取返回取1的几率的几率 lphat,pci=binofit(x,n,alpha)给出给出极大似然估计值和极大似然估计值和100(1-)%置信区置信区间间 l缺省值缺省值 =0.05 对应于对应于90%置信区间置信区间(双边)或(双边)或95%(单边)。(单边)。前一页 休息3.3.契比雪夫不等式契比雪夫不等式 前一页 休息l变量之间的关系分为两类。一类
25、是确定性变量之间的关系分为两类。一类是确定性关系,如函数关系。另一类是非确定性关关系,如函数关系。另一类是非确定性关系。当自变量系。当自变量x确定以后,因变量确定以后,因变量y并不确并不确定,而是符合一定分布的随机变量。二者定,而是符合一定分布的随机变量。二者的关系可以表示为的关系可以表示为y=f(x)+,l随机项随机项 N(0,1),f(x)是确定函数,称为回是确定函数,称为回归函数。归函数。l回归分析的任务一是根据经验公式、散点回归分析的任务一是根据经验公式、散点图等确定回归函数;还要检验回归函数是图等确定回归函数;还要检验回归函数是否合理;回归的目的是用否合理;回归的目的是用f(x)预测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 数据处理
限制150内