误差理论与数据处理基础知识.doc
《误差理论与数据处理基础知识.doc》由会员分享,可在线阅读,更多相关《误差理论与数据处理基础知识.doc(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、误差理论与数据处理基础知识0-1 物理实验中的测量误差与不确定度误差和不确定度的概念物理实验离不开对各种物理量进行测量,由测量所得的一切数据,都毫无例外地包含有一定数量的测量误差,没有误差的测量结果是不存在的。测量误差存在于一切测量之中,贯穿于测量的全过程。随着科学技术水平的不断提高,测量误差可以被控制得越来越小,但却永远不会降低到零。测量误差测量值真值。何谓真值?真值是在特定条件下被测量量的客观实际值,当被测量的测量过程完全确定,且所有测量的不完善性完全排除时,则测量值就等于真值。这就是说,真值是通过完善的测量才能获得。然而,严格、完善的测量难以做到,故真值就不能确定。在实践中,有一些物理量
2、的真值或从相对意义上来说的真值是可以知道的,这有如下几种:(1)理论真值。如平面三角形三内角之和恒为180;某一物理量与本身之差恒为零,与本身之比值恒为1;理论公式表达值或理论设计值等。(2)计量单位制中的约定真值。国际单位制所定义的七个基本单位,根据国际计量大会的共同约定,凡是满足上述定义条件而复现出的有关量值都是真值。(3)标(基)器相对真值。凡高一级标准器的误差是低一级或变通测量仪器误差的时,则可认为前者是后者的相对真值。如经国家级鉴定合格的标准器称为国家标准器,它在同一计量单位中精确度最高,从而作为全国该计量单位的最高依据。国际铂铱合金千克原器的质量将作为国际千克质量的真值。在科学实验
3、中,真值就是指在无系统误差的情况下,观测次数无限多时所求得的平均值。但是,实际测量总是有限的,故用有限次测量所求得的平均值作为近似真值(或称最可信赖值)。1误差(error)误差即观测值与真值之间的差异。如前所述,测量误差就是测量值减去真值。(1)绝对误差(absolute error)。某物理量值与其真值之差称绝对误差,它是测量值偏离真值大小的反映,有时又称真误差。即 绝对误差量值-真值 修正值-绝对误差真值-量值 真值量值+修正值这说明量值加上修正值后,就可以消除误差的影响。在精密计量中,常常用加一个修正值的方法来保证量值的准确性。(2)相对误差(relative error)。绝对误差与
4、真值的比值所表示的误差大小称为相对误差或误差率。有时,两组测量的绝对误差相同,但真值不同,而此时实际反映了两种不同的准确度。所以采用相对误差就能够清楚地表示出测量的准确程度。按定义,当绝对误差很小时,此时相对误差还有一种表达形式,即分贝误差。同种物理量之比取对数,再乘以20,这称为分贝A(单位用dB表示)。设两个同种物理量之比为 (0-1-1)则按分贝的定义有 (0-1-2)如果比值a产生了一个误差,那末将引起A产生一个误差(此为分贝误差),则 (0-1-3)式(0-1-3)减去式(0-1-2),得 (0-1-4)该式即为相对误差与分贝误差之间的关系式。从数学上可知则式(0-1-4)可写成或
5、分贝误差主要用在声学及无线电计量之中,如计算声压级,按规定空气中的基准声压(大约相当于蚊子飞行发出声音的声压),如有一声的声压,则其声压级按式(0-1-4)计算为。相对误差还有一种简便实用的形式引用误差。它在多挡或连续刻度的仪表中得到广泛应用。为了减少误差计算中的麻烦和划分仪表正确度等级的方便,一律取仪表的量程或测量范围上限值作为误差计算的分母(即基准值),而分子一律取用仪表量程范围内可能出现的最大绝对误差值。于是,定义引用误差为在热工、电工仪表中,正确度等级一般都是用引用误差来表示的,通常分成0.1、0.2、0.5、1.0、1.5、2.5和5.0七级。上述数值表示该仪表最大引用误差的大小,但
6、不能认为仪表在各个刻度上的测量都具有如此大的误差。例如某仪表正确度等级为R级(即引用误差为R%),满量程的刻度值为X,实际使用时的测量值为(一般X),则 (0-1-5)通过上面的分析,可知为了减少仪表测量的误差,提高正确度,应该使仪表尽可能在靠近满量程刻度的区域内使用。这正是人们利用或选用仪表时,尽可能在满刻度量程的以上区域内使用的原因。(3)误差的分类根据误差产生的原因和性质将误差分为系统误差和随机误差两大类。系统误差在相同条件下,多次测量同一物理量时,测量值对真值的偏离(包括大小和方向)总是相同的,这类误差称为系统误差。系统误差的特点是恒定性,不能用增加测量次数的方法使它减小,在实验中发现
7、和消除系统误差是很重要的,因为它常常是影响实验结果准确程度的主要因素,能否用恰当的方法发现和消除系统误差,是测量者实验水平高低的反映,但是又没有一种普遍适用的方法去消除系统误差,主要是靠对具体问题作具体的分析与处理,要靠实验经验的积累。如果我们能够确定系统误差的数值,就应该把它从实验结果中扣除,消除它的影响,或者说,把系统误差的影响减小到偶然误差的范围以内,这种数值已知的系统误差称为“已定系统误差”。还有一类系统误差,只知道它存在于某个大致范围,而不知道它的具体数值,我们称之为“未定系统误差”。例如仪器的允差就属于这一类。关于系统误差的限制和消除将在后面介绍随机误差(偶然误差)由于偶然的不确定
8、因素造成每一次测量值的无规律的涨落,测量值对真值的偏离时大时小、时正时负,不能由上次测量值预计下一次测量值的大小,这类误差称为随机误差,也称偶然误差。造成偶然误差的因素是多方面的,如仪器性能和测量者感官分辩力的统计涨落,环境条件(如温度、湿度、气压、气流、微震)的微小波动,测量对象本身的不确定性(如气压、放射性物质单位时间内衰变的粒子数,小球直径或金属丝直径)等等。偶然误差的特点是它的随机性,如果在相同的宏观条件下,对某一物理量进行多次测量,当测量次数足够大时,便可以发现这些测量值呈现出一定的规律性统计规律性,即它们服从某种概率分布。下面我们对一个实际测量的结果进行统计分析(表0-1-1),就
9、可以发现随机误差的特点和规律。表0-1-1中观测总次数n150次,某测量值的算术平均值为3.01,共分14个分区间,每个区间的间隔为0.01。为直观起见,把表中的数据画成频率分布的直方图如(图0-1-1),从图中便可分析归纳出随机误差的以下四个特点。表0-1-1 测值分布值区间1234567测值xi2.952.962.972.982.993.003.01误差-0.06-0.05-0.04-0.03-0.02-0.010出现次数nI46611142024频率0.0270.040.040.0730.0930.1330.16区间891011121314测值xI3.023.033.043.053.06
10、3.073.08误差xi0.010.020.030.040.050.060.07出现次数ni17121210842频率0.1130.080.080.0660.0580.0270.018图0-1-1 频率分布直方图a)随机误差的有界性。在某确定的条件下,误差的绝对值不会超过一定的限度。表0-1-1中的xi均不大于0.07,可见绝对值很大的误差出现的概率近于零,即误差有一定限度。b)随机误差的单峰性。绝对值小的误差出现的概率比绝对值大的误差出现的概率大,最小误差出现的概率最大。表0-1-1中的次数为110次,其中的占61次,而的仅40次。可见随机误差的分布成单峰形c)随机误差的对称性。绝对值相等的
11、正负误差出现的概率相等。表0-1-1正误差出现的次数为65次,而负误差为61次,两者出现的频率分别为0.427和0.407,大致相等。d)随机误差的抵偿性。在多次、重复测量中,由于绝对值相等的正负误差出现的次数相等,所以全部误差的算术平均值随着测量次数的增加趋于零,即随机误差具有抵偿性。抵偿性是随机误差最本质的统计特性,凡是具有相互抵偿特性的误差,原则上都可以按随机误差来处理。虽然随机误差产生的原因尚不清楚,但由于它总体上遵守统计规律,因此理论上可以计算出它对测量结果的影响。(4)误差的表示方法算术平均误差在一组测量中,用全部测值的随机误差绝对值的算术平均值来表示。按定义 (0-1-6) 式中
12、:xi一组测量中的各个测量,i1,2,n(测量的次数);一组测值的算术平均值,第i个测值xi与平均值之偏差(即误差)的绝对值这种表示方法已经考虑到了观测次数n对随机误差的影响,但是各次观测中相互间符合的程度不能予以反映。因为一组测量中,偏差彼此接近的情况与另一组测量中偏差有大、中、小的情况,两者的算术平均误差很可能相等。标准误差(又称均方根误差)它是观测值与真值偏差的平方和观测次数n比值的平方根,按定义 (0-1-7)式中,A被测物理量的真值; 第i个测值xi与真值A之偏差。在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替,此时的标准误差按下式计算: (0-1-8)标准误
13、差对一组测量中的特大或特小误差反映非常敏感,所以,标准误差能够很好地反映出测量的精密度。这正是标准误差在工程测量中广泛被采用的原因。例1 有两组观测数据:第一组 2.9、3.1、3.0、2.9、3.1第二组 3.0、2.8、3.0、3.0、3.2求平均值、算术平均误差、标准误差,并分析其准确度及精密度。解 列表计算如下:第 一 组 测 量算术平均值3.0算术平均误差标准误差n-1第 二 组 测 量算术平均值3.0算术平均误差标准误差n-1从计算结果可知:两组数据的平均值一样,即测量的准确度一样;两组数据的测量精密度实际上不一样。因为第一组数据的重现性较好,但此时的算术平均误差是一样的,显然未能
14、反映出精密度来。标准误差n-1的计算结果说明第一组测量数据比第二组精密度高。标准误差不仅仅是一组观测值的函数,而且更重要的是它对一组测量中的大误差及小误差反映比较敏感。因此,在试验中广泛用标准误差来表示测量的精密度。极限误差通常定义极限误差的范围为标准误差的3倍,即3n-1。从统计的角度计算得,所测物理量的真值落在3n-1范围内的概率为99.7%,而超出此范围的可能性实际上已经非常小,故把它定义为极限误差。(5)几个重要概念精密度(简称精度precision)它表示测量结果中随机误差大小的程度,即在一定条件下,进行多次、重复测量时,所得测量结果彼此之间符合的程度,通常用随机不确定度来表示。正确
15、度(correctness)它表示测量结果中系统误差大小的程度。即在规定的条件下,测量中所有系统误差的综合。准确度(又称精确度accuracy)准确度是测量结果中系统误差与随机误差的综合,它表示测量结果与真值的一致程度。从误差的观点来看,准确度反映了测量的各类误差的综合。如果所有已定系统误差已经修正,那末准确度可用不确定度来表示。2不确定度(uncertainty)不确定度是由于测量误差的存在而对被测量值不能肯定的程度。表达方式有系统不确定度、随机不确定度、总不确定度。可按估值的不同方法把不确定度归并为A、B两类分量。前者是多次重复测量后,用统计方法计算出的标准误差;后者是用其他方法估计出的近
16、似的“标准误差”。系统不确定度实质上就是系统误差限,常用未定系统误差可能不超过的界限或半区间宽度e来表示。随机不确定度实质上就是随机误差对应于置信概率1-a时的置信区限k(a为显著性水平)。当置信因子k1时,标准误差就是随机不确定度,此时的置信概率(按正态分布)为68.27%。总不确定度是由系统不确定度与随机不确定度按合成方差的方法合成而得的。它反映了测量结果中未能确定的量值的范围。不确定度是测量结果的测度,没有不确定度说明,测量结果将无从比较。1993年,国际计量局(BIPM)等7个国际组织发表了测量不确定度表示指南。这一国际的权威性文献,对计量和科学实验工作极其重要。综上所述,不确定度与误
17、差有区别,误差是一个理想的概念,一般不能准确知道;但不确定度反映误差存在分布范围,即随机误差分量和未定系统误差分量综合的分布范围,可由误差理论求得。总之,不确定度是未定误差的特征描述,而不是指具体的误差大小和符号,故不确定度不能用来修正测量结果。图0-1-2 给出了精密度、正确度和准确度的示意图。图0-1-2 精密度(a)、正确度(b)、准确度(c)的示意图0-3 实验数据的分析与处理一、系统误差的分析与处理系统误差是一种固定的或服从一定规律变化的误差。对某物理量作多次重复测量时,系统误差不具有抵偿性,故通常不能用处理随机误差的方法来处理。前面讨论随机误差是以测量数据中不包含系统误差为前提的。
18、可是系统误差与随机误差往往是同时存在于测量数据中,有时系统误差对实验结果的影响比随机误差还要严重。如果不消除或不减少系统误差的影响,就会使得对随机误差的估计变得毫无意义。对于一个具体实验来说,要能找出造成系统误差的主要原因。然后,从实验中设法限制和消除这些因素的影响。下面我们就系统误差的主要来源如何判断系统误差的存在以及限制和消除系统误差进行讨论。1.系统误差的来源分析(1)装置误差仪器、仪表误差仪器、仪表误差是由于使用的仪器或量具在结构上不完善、或没有按照操作规程使用而引起的误差。例如电工仪表、电桥、电位差计等的误差。标准器误差标准器是提供标准量值的器具,如标准电池、标准电阻等,它们本身的标
19、称值含有的误差。安置误差安置误差是由于仪器或被测工件的安置不当所引的误差。例如,有些电工仪表按规定应水平放置,而在使用时,垂直放置仪表引起的误差。装备、附件误差装备、附件误差主要指的是电源的波形、三相电源的不对称度,各种测量附件如转换开关、触点、接线引起的误差以及测试设备和电路的安装、布置或调整不完善等产生的误差。(2)方法误差(理论误差)测量方法本身的理论根据不完善或采用了近似公式引起的误差称为方法误差。例如,电阻与温度的关系为RR20+(t-20)+(t-20)2式中:R温度t的电阻; R20温度20时的电阻;电阻的一次温度系数; 电阻的二次温度系数;在实验中不考虑温度因素的影响而引起的系
20、统误差R-(t-20)-(t-20)2,消除它的方法就是进行温度修正。(3)观测者误差观测者误差是由于观测者的生理或心理上的特点和固有习惯所造成的。例如,观测者对刻度尺进行估读时,习惯地偏向某一方向(始终偏大或偏小)记录信息或计时的滞后等所造成的误差。(4)环境误差环境误差是在测量时的环境影响量(如温度、湿度、气压、电磁场等)偏离规定值时而产生的误差。除上述系统误差的来源外,还有很多系统误差是很复杂的。例如,刻度盘刻度线不准确而引起的测量示数的误差,就是一种比较复杂的系统误差。因此,我们在设计和制造测量仪器以及设计选择测量方法时,都要预先考虑系统误差的来源,尽可能将系统误差减小到所允许的范围内
21、。2.系统误差存在的判断对比检验是判断系统误差存在的常用方法。这里所说的对比,可以是把要判断的实验结果跟标准值、理论值比较;或者是跟准确度较高的仪器设备的测量值相比较;还可以是跟采用不同的实验方法测得的结果相比较。由于随机误差不可避免,在系统误差与随机误差同时存在的情况下,应进行多次测量以减少随机误差的影响,才能有效地判断系统误差的存在。在多次测量中,分析测量数据随时间变化的规律(特别是偏差的变化),往往会有助于发现随时间线性变化或周期变化的系统误差。分布检验也是判断系统误差的一种重要方法。这是一种假设检验,先由理论分析和过去同类测量的经验,认为测量值应该遵从某种分布,然后用统计量作检验,判断
22、实验结果是否与假设分布相符,如果不符可怀疑测量中存在着系统误差。直接分析实验原理、方法以及实验条件的变化,也是判断系统误差的一种有效方法。如果实验方案本身就存在着不完备性。比如说计算公式是近似的,测量方法受到某种副效应或某种干扰的影响,则这个实验必然存在着系统误差。另外,有些实验所研究的物理现象存在着统计涨落,测量仪器产生零点漂移,控制的实验条件随时间而明显变化等,这些因素也就带来了系统误差。总之,对实验本身的分析研究,往往会使我们能直接找出系统误差并可估计其大小。3.系统误差的限制和消除方法(1)消除产生系统误差的根源。在测量之前,要求测量者对可能产系统误差的环节作仔细的分析,从产生根源上加
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差 理论 数据处理 基础知识
限制150内