测量误差与数据处理n上海理工.pptx
《测量误差与数据处理n上海理工.pptx》由会员分享,可在线阅读,更多相关《测量误差与数据处理n上海理工.pptx(192页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.2.测量误差与数据处理测量误差与数据处理第1页/共192页2.1 概述测量的目的 求出物理量的真值测量过程中各种因素 测量数据有误差 测量过程都是某人、在一定环境条件下,使用一定的仪器进行的。1、由于测量仪器的结构不可能完美无缺;2、观测者的操作、调整和读数也不可能完全准确;3、环境条件的变化(如温度的波动、振动、电磁辐射的随机变化);4、理论的近似性等等,第2页/共192页对一个物理量进行n次测量,获得了n个测量值 谓之测定值,那么,每次测量后测定值所包含的误差为:不能:用 n个方程求n+1 个未知数,不能求出真值X。可以:在给定条件下,找出测定值与真值间误差的分布规律,从而由一组测定值
2、中确定一个所谓的最优概值,用它来代表我们要测的物理量,随后对这最优概值的精确度做出估计。这个过程称之为数据处理数据处理。数据处理的目的和过程就是使随机误差对最终结果的影响减至最小。第3页/共192页2.1.1、误差的基本概念、误差的基本概念 测量值x 与真值x0之差,就称为误差(也称绝对误差),记为x,即 测量误差测量误差=测得值测得值-真值真值 x =x x0真值是一定条件下被测量的客观实际值,是被测量本身所具有的真实大小,只有通过完善的测量才有可能获得。实际上,由于被测量的定义和测量不可能完善,因而真值往往是未知的,真值只是一个理想的概念。只有少数情况下才可能知道。第4页/共192页 约定
3、真值:世界各国公认的几何量和物理量的最高基准的量值 相对真值:标准仪器的测得值或用来作为测量标准用的标准器的值、高一级精度仪表的测量值。约定真值是具有不确定度如砝码、秤。如:公制热力学温度基准:开(K)约定是水处于三相点时温度值的1/273.16。约定公制长度基准:米(m)m=1650763.73 -氪-86的2p10-5d5能级间跃迁在真空中的辐射波长 理论真值:设计时给定或用数学、物理公式计算出的给定值。如三角形内角之和为180度。第5页/共192页 对同一测量对象,误差的绝对值越小,测量值就越好。而对不同的测量对象,就不能只凭误差来评判测量结果的优劣。例如,分别测量一个长方形的长和宽,若
4、以米尺测量,误差都是0.5 mm,那么前者的结果比后者好。因此,在这种情况下,需用相对误差来说明测量精确度的高低。相对误差为绝对误差与真值之比,用百分率表示:相对误差=绝对误差真值100%当绝对误差很小时可以用以下近似式:相对误差绝对误差测量结果(真值的最佳估计值)100%用符号表示:引用误差第6页/共192页 引用误差 在多档和连续刻度的仪表中,因为各档示值和对应真值都不一样,这时若按上式计算相对误差,所用的分母也不一样,故很麻烦。为方便计算,又定义了引用误差,这是一种简化和实用方便的相对误差。其分母一律取仪表满量程的最大刻度值(满刻度值),用M 表示;其分子为在测量范围内产生的最大绝对误差
5、,用 表示;用 f表示引用误差。其表达式为第7页/共192页2.1.2、测量数据的处理 数据处理的任务就是对测量所获得的一系列数据进行深入的分析,以便得到各参数之间的关系,有时还需要用到数学解析的方法,推导出各参量之间的函数关系。通过数据处理可以确定并表示出输入变量与输出变量之间的关系,从而揭示事物的本质及事物之间的内在联系。第8页/共192页2、误差来源、误差来源 分析误差来源是测量误差分析的重要环境,只有知道了误差源才能消除或减少测量误差。主要有以下四种误差源。1)、设备装置误差 标准器误差 仪器仪表误差 辅助设备和附件误差2)、环境误差环境条件(温度、湿度、气压、振动等)与标准状态不一致
6、,引起测量装置和被测量本身的变化所造成的误差。第9页/共192页3)、方法和理论误差由于所采用的测量原理或者测量方法本身的近似、不严格、不完备所产生的测量误差。电流表外接电流表外接电流表内接电流表内接第10页/共192页4)、人员误差 操作人员视觉、读数误差、经验、熟练程度、精神方面原因(疲劳)第11页/共192页3、误差的分类、误差的分类 系统误差(System error)是被测量的数学期望与真值之差(数学期望是无限多次测量结果的平均值),表示测量结果偏离真值的程度。由特定原因引起、具有一定因果关系并按确定规律产生,如装置、环境、动力源变化、人为因素。再现性-偏差(Deviation)理论
7、分析/实验验证-原因和规律-减少/消除第12页/共192页3、误差的分类、误差的分类 随机误差(Random error)是测量值与数学期望之差。它是同一条件下多次测量同一量值时,误差的绝对值和符号以不可预测的规律随机变化的误差,表示测量结果分散性的程度。因许多不确定性因素而随机发生 偶然性(不明确、无规律)概率和统计性处理(无法消除/修正)第13页/共192页3、误差的分类、误差的分类 粗大误差(Abnormal error)是明显歪曲测量结果的误差。它一般是由测量者的主观原因引起,或由于测量条件以外地改变以引起的误差均属粗大误差。发现粗大误差就要立即剔除。第14页/共192页 p X0 x
8、i x 真值真值 期望值期望值 测量值测量值系统误差系统误差随机误差随机误差第15页/共192页2.2 随机误差的估计2.2.1 测量数据的统计处理一、频率分布直方图与经验分布曲线的建立一、频率分布直方图与经验分布曲线的建立 用同一个仪器对同一对象在相同条件下进行多次测量,其结果总是各不相同的,例如对某处于稳定工作状况下运行的透平机械进行测量,发现其转速是在某一区间波动的,现在以同一工况下50次测量中所获取的数据作一分析。第16页/共192页4753.14757.54752.74752.84752.14749.24750.64751.04753.94751.24750.34757.34754.
9、14751.24752.34748.44752.54754.74750.04751.04752.34751.84750.64754.54752.44751.64747.94748.34753.44755.54752.74749.14753.24751.94755.44755.64750.24756.74755.14752.04751.14752.64753.64749.14755.64754.04753.94752.84754.54753.7例例2-1 透平机械同一稳定工况下对其转速进行多次测量,得到的结果如下:(单位是转/分)第17页/共192页问题1 1、在这些数据中究竟哪一个数据是最可信
10、赖的?也就是说被测量的物理量的真值最大可能是什么?2 2、能不能以99%99%的把握断定真值在哪一个数据区间中?数据的特点1、随机性:在等精度的测量条件下,测定值互不相等,呈现波动状态,这就是数据的随机性.2、规律性:测定值皆在4747.0到4758.0之间,范围并不大,并且落在4750.0到4754.0之间的次数很多,而落在这一区间以外的数据却很少,这种在数值上的有界性和中间大两头小的单峰性规律在被测量技术中是普遍存在的.第18页/共192页有关名词与概念 我们将所研究对象的单个测量值称为个体,全部测量值称为母体(所有可能出现的值),母体中的一部分称为子样,子样中所包含的个体数目称为子样容量
11、。随机变量:在随机因素的作用下用等精度测量法对同一对象进行多次测量以后可以发现,每一次测量结果各不相同,我们把这些具有数值变化而事先又无法确定的测定值用来表示。当测量次数无限增加,对于任何一个实数x,当 x时,在全部测量值中出现的次数有确定的概率,我们称这样的测定值为随机变量。如果随机变量的取值可以是数轴上某一区间的任意数值,则称为连续型随机变量。不难理解随机误差也是随机变量。第19页/共192页在实际工作中,我们经常将这些本质上是连续变化的测定值离散化。例如我们决不会将U型管压力计的读数读成 米(虽然它在一脉动过程中是确实存在过的),也不能对五位数字显示的仪表中读出六位或七位的读数。因此,在
12、实际工作中,测定值以及测量误差所表现出来的数据一般都是离散型随机变量。第20页/共192页测量值随机变化分布规律研究方法(1)对所研究的子样,找出最大值和最小值;本例中最大值是4757.5,而最小值为4747.9(2)决定组距和组数:在子样容量较大时,组数分得多些,组距可小一些,通常可分为1020组。子样容量小时,可适当少分几组。组距可以等分也可以不等分,一般来说,分组应突出子样的特点并冲淡子样的随机波动为原则。在本例中将数据分为11组,组距为1.0。(3)决定分点:通常应使分点比原测量精度高一位,并避免个体数据恰好落在分点上。例如本例中可分成如下十一组:4747.054748.05,474.
13、05749.05,4756.054757.05,4757.054758.05第21页/共192页(4)计算出各组频数:用唱票的办法数出落在各组的数目,称为频数。各组频数与子样容量之比称为频率。(5)计算出测定值最小的组至最大组的累积频数和累积频率(6)编制测定值子样的频数、频率分布表,绘制频数分布直方图;(7)绘制累积频率分布图,这种分布也称经验分布。第22页/共192页表表2-1 频数、频率分布表频数、频率分布表第23页/共192页频率分布直方图与累积频率分布(经验分布)图频数分布直方图累积频率分布图,也称经验分布第24页/共192页频数(频率)分布直方图和累积频率分布图都是研究测定值数据规
14、律性的重要工具。1、用同样的仪表及测量手段再测量50次,再作一次上述的数据整理工作 发现它与第一次的数据会有若干差异;2、将这二组数据混在一起,组成了容量为 的子样,用它得出的子样频数(频率)分布直方图及累积频率分布 又与前两组不同;3逐步增加子样的容量并相应地加大组数后,各组的频率将逐步以某确定的数值稳定下来,直方图的也逐渐趋向于一条曲线。第25页/共192页4、当子样容量趋于无穷大,测定值将连续地充满数轴的某一区间,这时各组的频率可任意地接近于某一定值,此值即称为概率;而频率的直方图将演变为一光滑曲线,称之为分布密度曲线,如果表达为函数则称为分布密度函数,用f(x)来表示。同样,对于经验分
15、布和函数Fn(x),当子样容量趋于无穷大时趋向于母体的理论分布曲线和理论分布函数F(x)图图2-3 当子样容量限增大时,频率直方图和经验分布的演变当子样容量限增大时,频率直方图和经验分布的演变 a)频率直方图频率直方图 b)累积频率分布)累积频率分布(经验分布经验分布)直方图直方图第26页/共192页人们对不同的测量对象在等精度测量条件下作了大量的试验,通过对各测定值的统计及分析,绘制了大量频率直方图后发现:尽管在子样容量较小时直方图差别很大,但随着子样的增加,最终的分布密度曲线的形状将趋于一个共同的规律:1、分布密度曲线都有一个峰值,而且此峰值一般都落在该随机变量散布区间的中心。2、而各条分
16、布密度曲线的差异却在于密集程度不同,有的随机变量在中心部分集中度高,有的却比较分散。第27页/共192页为了衡量测定值数据的密集程度,引入两个常用的概念:子样平均值:把子样数据的算术平均值看作子样散布的中心子样方差:它是一个描述在子样平均值附近散布程度的参数第28页/共192页二、随机误差分布的性质对大量测定值进行分析研究,并建立了直方图以后,逐渐通过子样认识了母体,同时对含有随机误差的测定值分布规律进行了总结,它大体上有如下一些性质:(一)有界性:观察子样发现,不论子样容量有多大,测定值总是在一定的、相当窄的范围内变动,故而随机误差也总是在一定的、相当窄的范围内变动的。由于测量的精确度不一,
17、测定值的随机误差也会不一样,但无论如何它是有界的。(二)对称性:当子样容量足够大后就可发现,出现正的误差和负误差的次数大致相等;更确切地说,绝对值相等但符号相反的误差以同样的频率出现。在概率密度曲线上这样的性质就表现出它的对称性。对称轴x=m的m是母体各元素的算术平均值,它随容量的增加而逐渐地逼近其真值,当子样容量趋于无穷大时,它就代表着测量对象的真值。第29页/共192页(三)补偿性:在等精度测量的条件下,全部随机误差的算术平均值在子样容量为无穷大时趋于零。(四)单峰性:随机误差非但是有界的,而且具有单峰性,也就是说,误差的绝对值越小,其出现的频率就越大,测量值等于其算术平均值(或说随机误差
18、为零)时出现的概率为最大,这就是概率密度曲线的单峰性。以上四点性质都是从大量的观察统计中得到的,已经获得了公认,因此也称为随机误差分布的公理。在这几点性质的基础上,推导出正态分布函数,并发展了误差理论。第30页/共192页2.2.2 随机误差的正态分布规律一、正态分布密度函数一、正态分布密度函数 分析结果表明,当观测次数很多时,随机误差的出现,呈现出统计学上的规律性。而且,观测次数越多,规律性越明显。当观测次数n无限增多(n)、误差区间d无限缩小(d0)时,各矩形的顶边就连成一条光滑的曲线,这条曲线称为“正态分布曲线”,又称为“高斯误差分布曲线”。所以随机误差具有正态分布的特性。根据误差分布的
19、四点性质及概率论原理推导出正态分布函数 参见书P17二、正态分布函数的性质二、正态分布函数的性质 正态分布具有和误差分布相同的四点性质第31页/共192页测量数据 直方图(频率直方图,经验分布直方图)概率论原理 分布密度曲线、分布密度函数f(x)随机误差分布四个性质 理论分布曲线、理论分布函数F(x)(有界性、单峰性、对称性、补偿性)正态分布函数推导数据量无穷大误差,不知测量值数学期望值(平均值)标准误差第32页/共192页当m和确定后,曲线的形状就确定了。所以m和是决定正态分布的两个特征参数。在概率论和数理统计学中,它们都是随机变量的数字特征。其中m表示随机变量的集中位置,而表示随机变量的分
20、散程度。上式可简写为:n(x;m,)。其中n表示正态分布,注意“;”第33页/共192页正态分布的平均值与真值当样本数为无穷大时,样本数的数学期望(平均值)是真值的最佳估计值X0是真值第34页/共192页满足归一化条件满足归一化条件可以证明:可以证明:0 0总面积总面积=1=1正态分布特点正态分布特点总面积=1第35页/共192页三、正态分布表及其应用三、正态分布表及其应用考虑特殊情况,令m=0,=1,n(t;0,1)称为标准正态分布密度函数。将正态分布密度函数积分,得到正态分布函数N(x;m,);同理,令m=0,=1,得到N(t;0,1)称为标准正态分布函数。第36页/共192页由于标准正态
21、分布函数广泛应用于误差理论中,所以已将函数制成表格(附表一、二)。标准正态分布密度函数与分布函数具有如下性质:(一)(二)对于非标准正态分布n(x;m,)及N(x;m,),则可先进行标准化,然后用标准正态分布表来求取。例2-2,2-3,2-4第37页/共192页查表为:0.9332第38页/共192页第39页/共192页=N(1;0,1)-N(-1;0,1)=N(1;0,1)-(1-N(1;0,1)=2N(1;0,1)-1=2*0.8413-1=0.6826x-m=,N(/;0,1)x-m=-,N(-/;0,1)问第40页/共192页2.2.4 随机误差的估计随机误差的估计前面正态分布公式中的
22、m,都是母体分布的特征量,都是子样容量为无穷大时的理论值。测量次数总是有限的,如何通过有限次的测量所获得的测定值来估计被测量的真值及其误差范围,这是误差理论所要解决的问题一、参数的点估计一、参数的点估计 参数估计分为点估计和区间估计。通过子样测量值计算出子样的特征量,并根据子样特征量对母体特征量进行估计称为点估计。第41页/共192页为了把某一统计量作为未知母体分布参数的估计值,我们还希望这个估计值的数学期望就等于该未知母体参数,具有这种性质的估计值叫做母体参数的无偏估计(值)。协调估计值并不一定等于无偏估计值。无偏估计值可以用下式表示:(一)子样平均数的数学期望这说明子样平均数的数学期望就等
23、于母体的数学期望,对于测定值这个随机变量,子样平均数 的数学期望就等于母体的平均数m,所以最优概值 是母体平均数m的无偏估计。n组或无穷组子样平均值的平均值某一组子样的平均值母体的数学期望,即这个随机变量所有值的平均值第42页/共192页第43页/共192页(二)子样平均数方差这说明子样平均数的方差并不等于母体的方差,而只是它的1/n倍。这一结论可以推广到等精度测量条件下,对测量对象进行多次测量所获得结果的平均值要比单次测量所获结果精确的多。第44页/共192页平均值的标准差平均值作为期望值的最佳估计值多组数据的平均值也是随机变量,符合正态分布其标准差为:测量次数n越多,平均值标准差越小。n超
24、过一定数值后,(1)标准差的减小明显慢了下来(2)测量工作量大量增加,带来新的误差 一般根据情况,选择4-20次第45页/共192页(三)子样最大或然方差的数学期望研究它的数学期望子样平均值其数学期望第46页/共192页由方差的定义第47页/共192页应该为n n-1第48页/共192页二、参数的区间估计二、参数的区间估计 点估计是用一个数去估计未知参数。区间估计就是用一个区间估计未知数,即把未知数估计在某两个界限之间,并且还要知道未知数落在这个区间的可靠性有多少。如一个人的年龄95%可能是30-35岁之间。数理统计学中的区间估计,就是要用有确切意义的数字表达某个未知母体参数落在一定区间内的“
25、肯定程度”。下面用一个简单的数字例子说明区间估计的原理和方法求95%的置信区间步骤计算平均值 平均值符合正态分布 正态分布标准化 查表求95%概率区间 第49页/共192页第50页/共192页如果以 代入可得 从表面看来,最后上式的意义是m落在 区间的概率为95,但这是毫无意义的,因为m是母体平均数,是一个确切的数值,我们不能说它落在某区间的概率是多少,事实上既然括号内已没有任何随机的东西,当然就没有什么概率可言了。第51页/共192页应该这样理解,进行多次抽样,可得到多个不同的xm2.94这个区间,95%的x落在这个区间有95%的x2.94这个区间包含m问题是 本身是随机变量,故区间 也是随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 测量误差 数据处理 上海 理工
限制150内