不确定度分析和误差原理.ppt
数据处理数据处理误差及不确定度分析马元明目目 录录n误差原理与分析计算误差原理与分析计算 误差原理误差原理 误差传递误差传递 平均值原理平均值原理 异常数据剔除异常数据剔除n不确定度原理与分析计算不确定度原理与分析计算 不确定度原理不确定度原理 不确定度的合成不确定度的合成 不确定度合成例题不确定度合成例题n回归分析回归分析 直线回归直线回归 其他回归其他回归n量热误差分析量热误差分析 误差原理与分析计算误差原理与分析计算 误差原理误差原理 误差传递误差传递 平均值原理平均值原理 异常数据剔除异常数据剔除 绝对误差n测量绝对误差=测量值真值n示值误差=仪器示值真值n真值是指被测量的客观真实值,一般都是未知的。仅特殊场合已知和最高基准可看作真值。n数据处理统计中将平行测量的期望值作为统计量的拟定真值,可证明当测量次数无限大时,子样的统计量是总体的统计量的无偏估计。相对误差n绝对误差与测量值相差小时用绝对误差,相差大时用相对误差。n引用误差的规定是用于仪器精度的评定。误差的普遍意义和关系n测量误差是不可避免的,只要误差在一定范围内就认为是正常的。n减小误差影响,提高测量精度。n对测量结果作出可靠性评定,即给出精确度的估计。定义量纲相对误差绝对误差 真值无反应测量效果绝对误差测量值真值与被测量相同结果的实际误差值误差分类n系统误差:其值固定不变或按某种确定规律变化的误差。可重复表现,但规律性并不一定确知。n随机误差:有正有负,不可预知。具有随机变量的一切特征,可用统计方法做出估计,不能“修正”消除。n粗大误差:超出正常范围的随机大误差。在数据中应该去除。统计量和估计量 设总体以随机变量表示,容量为n的子样以随机变量(1 2 n)表示。现作子样的实值函数 T=T(1 2 n),则 T(1 2 n)也为一随机变量,称T的统计量。为了估计总体某一参数,由子样(1 2 n)建立不带未知数的某一统计量T(1 2 n),当获得子样的某一具体观测值(l1 l2 ln)时,算出统计量的值T(l1 l2 ln)=t,可作为估计值,则称T(1 2 n)为的估计值。估计量的评价n无偏性 设t为未知数参数的估计量,若 E(t)=,则t为的无偏估计量。表明估计量t的波动中心为,此时只有随机误差,无系统误差。n有效性 分散性用 E(t-)2衡量。E(t-)2=D(t)表明无偏估计以方差较小为好,即较为有效。n一致性 估计量t依概率收敛于,则称t为的一致估计量。区间估计n对于未知数,除了要求它的点估计t外,还常常需要以一定的可靠程度估计出包含真值的某个区间,以及包含真值的概率。n参数若有Pt1 t2=1-a为置信概率。(t1,t2)为在置信度P上的置信区间,说明有P的概率落在(t1,t2)范围内。置信区间的上下限常取为对称的。n区间估计有明确的可靠性含义。n置信度的大小应根据具体问题给出,一般取90%或95%。随机误差特征n正态分布概率密度n正态分布概率图n对称性n有界性n抵偿性n对f(x)的影响n平均分布n反正弦分布n截尾正态分布n三角分布三种分布的标准差以及各置信区间相应的概率分布标准差P()P(2)P(3)正态分布(or 仪器)/30.6830.9550.997三角分布(or 仪器)/(6)(1/2)0.7580.9661均匀分布(or 仪器)/(3)(1/2)0.57711随机误差特征n期望值E(x)n误差的分布中心nE(C)=CnE(x1+x2)=E(x1)+E(x2)nE(C*x)=C*E(x)nE(x1*x2)=E(x1)*E(x2)相互独立,协方差为0n方差D(x)n随机波动大小nD(C)=0nD(C*)=C2*D()nD(1+2)=D(1)+D(2)+D(1,2)系统误差检验方法 n通过实验对比(高精度和等精度)n通过理论分析判断(模型简化)n对测量数据的直接判断(线性和周期)n用统计方法进行判断 数据数目少时可靠性差 只能对系统误差存在判断,不能给出数值 误差传递 误差传递n传递系数f/xi按测量值计算。n优点:线性传递,计算简单。n缺点:当展开式高次项不可忽略时,应该按照定义式计算。误差传递n当以相对误差表示各误差分量时,其传递关系为n测量结果总误差等于各原始误差乘以传递系数的代数和线性叠加法则。n误差作用独立性,一个误差结果对其他误差因素无关,它们构成总误差的独立部分。n可用于已知系统误差的分析计算。n建立不确定度合成法则基本依据,精度分析基础。传递系数的计算n微分法求传递系数n几何发求传递系数(可通过几何运算和解析几何计算转化为微分法)n按传动关系确定传递系数(已知一个方向的传递系数或总的传递系数,求其中一个)用于y=f(x)测量y求x的传递系数的情况n计算说明定义法和线性叠加法则的误差大小差别。例题 R1R2 VsV算术平均值原理 对同一量进行多次等精度重复测量而得到的数据的处理。“等精度”指各次测量的标准差相同,并不是有相同的误差。等精度多次重复测量结果xi的算术平均值作为被测量的估计量,具有一致性、无偏性和最优性。算术平均值的误差(线性和、分布相同):等精度测量数据的残差和性质n残差=测量值算术平均值n性质1:残差代数和为0.n性质2:残差平方和最小。与最小二乘法一致。算术平均值的标准差对X进行n此重复测量,视各数据为独立随机变量:测量标准差可按残差估计标准差的贝塞尔公式估计加权平均值原理 对某一量进行多次测量,每次的精度不同,可信度不同,采用加权平均值计算。“权”表示该数据相对其他数据的可信程度。权的确定(一般化为最可约数字):单位权及单位标准差n若某一数据xk的权p=1,则pk称为单位权,而xk的标准差sk称为单位权标准差,记为s0.n将各残差vi分别乘以各自的权平方根,得加权残差,按加权残差计算的为单位权标准差。加权算术平均值的精度估计加权算术平均值的精度估计 两个计算值一般不同,主要由系统误差引起,一般后面的计算比较准确,特别是数据较多时。不能指望通过平均值减少所有的系统误差,其标准差也不能全面地反映系统误差的影响。例题n根据文献报道,真空中光速及其标准差如下i12345678Ci(km)299792.3299792.5299793.1299794.2299792.6299789.8299793.0299795.1Si(km)2.41.00.31.90.73.00.33.1n解:取各测量数据的权为:pi=1/si2,(i=1,2n)计算加权平均值为 (piCi)/(pi)=299792.99 异常数据的剔除(I)一:莱以特准则 n次等精度测量,若某一数据的残差满足下列条件即为含粗大误差,应剔除。n局限性:测量数据较少时可靠性差,特别是当采用贝塞尔公式计算标准差时,若nr0(n,a)即为含粗大误差,应剔除。当剔除一个数据后,其余应再次计算统计量,检验可以数据。优点:计算简便,有较好的使用效果。不确定度原理与分析计算不确定度原理与分析计算 不确定度原理不确定度原理 不确定度的合成不确定度的合成 不确定度合成例题不确定度合成例题 不确定概念n在多次重复测量中,可看出测量数据结果将在某一范围内波在多次重复测量中,可看出测量数据结果将在某一范围内波动,从而展示了这种不确定性。测量结果可能的取值范围越动,从而展示了这种不确定性。测量结果可能的取值范围越小,测量结果的可靠性越高。小,测量结果的可靠性越高。n测量的不确定度表示由于测量中存在误差而使被测量值不能测量的不确定度表示由于测量中存在误差而使被测量值不能肯定的程度,它的大小表征测量结果的可信程度,它是肯定的程度,它的大小表征测量结果的可信程度,它是表征表征误差对测量结果影响程度的参数误差对测量结果影响程度的参数。某一确定的测量方法具有。某一确定的测量方法具有确定的不确定度值。确定的不确定度值。n表示测量结果的分散性,表征被测量的真值所处量值范围的表示测量结果的分散性,表征被测量的真值所处量值范围的评定。评定。n不确定度不是真误差,是以参数形式定量表示无法修正的那不确定度不是真误差,是以参数形式定量表示无法修正的那部分误差的范围,表征合理赋予的被测量值的分散性参数部分误差的范围,表征合理赋予的被测量值的分散性参数。表示以测量结果为中心的变化。表示以测量结果为中心的变化。n按是否用统计方法求得,分为按是否用统计方法求得,分为A类和类和B类,都是标准不确定类,都是标准不确定度。度。不确定的表征参数n方差D或标准差S可作为测量不确定性的表征参数,反映了测量结果可能取值的分散程度。D或S小时,误差分布线高而窄,表明测量结果取值不确定的程度小而精度高。n实践中S常称为不确定度,用u表示:u=Sn也可用扩展不确定度U表示:U=k*u k称为包含因子,是相对于置信概率P的置信系 数,置信概率P为测量数据包含于区间(-ku,ku)的概率。不确定的表征参数n当u值可信度较高时,由选定的P值按正态分布确定k值(当被测量服从正态分布时)。n当u值可信度较低时(由小子样获得u),则应按t分布确定k值。n不确定度也可以以相对量的形式给出:ux/x,Ux/x。n不确定度的合成结果不仅与各分量的不确定度有关,而且与误差间的相关性有关。n自由度指所给方差(标准差)的估计量中所含独立变量的个数。自由度越大,所给估计方差越可靠。当按t分布计算时,自由度必须涉及。统计方法估计不确定度(I)n一:矩法n估计的有偏性:n由上可得为无偏估计量。因此取:标准差为:有偏估计,开放后产生系统误差。统计方法估计不确定度(II)n二:赛贝尔公式 有偏估计,有系统误差,其值偏小,无偏形式修正如下:1/Mn为修正系数,对于正态分布情形,其值见表。统计方法估计不确定度(II)n由修正结果系数看,有偏性只有在测量数据较少时才有较明显。由此造成的影响可用估计量S的标准差Ss来评定:n很小时,所得的估计量S的分散性较大,但n增大时,这一分散性减小。统计方法估计不确定度(III)n三:极差法:n标准差估计:对于正态分布,dn值见表n测量数据较少时,极差法给出的结果为标准差的无偏估计,精度比贝塞尔公式给出的结果略高一些。统计方法估计不确定度(IV)n四:最大误差法:无偏估计,特别地可用于一次实验数据。n12345678910152025301/Kn1.250.880.750.680.640.610.580.560.550.530.490.460.440.431/Kn1.771.020.830.740.680.640.610.590.570.510.480.460.44统计方法估计不确定度(V)n五:别捷尔斯公式:无偏估计,精度与贝塞尔公式相近标准差不确定度合成n各误差分量相应的不确定度合成测量结果的总不确定度时,不应按线性关系叠加,而是采用方差求和的方法,并且还考虑到各误差分量的相关关系。测量结果的总误差为各项原始误差的线性和:根据随机变量方差性质,其线性和方差为:标准差不确定度合成n相关项R反映了各项误差间的线性关联对标准差合成的影响。误差具有正相关关系时,其相互间的抵偿性减弱,此时,误差间的相关系数为正值,合成的总标准差偏大。反之,误差间具有负相关关系时,抵偿性增强,合成总标准差偏小。n当误差间具有最强的正相关关系时,相关系数为1,合成的标准差最大。若各项误差间均满足这一条件,即kl=1,则关系式可化简为:n当误差间互不相关时,相关系数kl=0,此时标准差可化简为:标准差不确定度合成n实际中,以子样的标准差代替总样的标准差,且各误差间互不相关的情形是常能得到满足或近似满足的。因此:n系统分量的误差也用类似于随机误差的标准不确定度表示。且一般认为不确定系统误差与随机误差是不相关的,则合成的标准不确定度应为:n当系统误差相关项和随机误差相关项都为0时:标准差不确定度合成 可见,对于不确定度合成中的系数既是误差传递中的传递系数。扩展不确定度合成n由上述扩展不确定度与标准不确定度关系得,在扩展不确定合成中,只要将扩展不确定度除以各自的置信系数后,按照标准不确定度合成,最后标准不确定度再乘以总的置信系数就可得总的扩展不确定度,这样可以避免扩展不确定的公式计算。n实际中,多数误差因素服从正态分布,非正态分布误差因素比重较小,此时总误差接近正态分布,k值按正态分布取。当各个误差和总误差都取相同的正态分布置信度时可以得到扩展不确定度的合成公式与标准不确定度的公式相同。特殊地,当rkl=0时:n对于不确定的系统误差,其扩展不确定的合成可直接用“方和根”法。n对于单次测量结果,当测量误差服从正态分布,且互不相关时,不论是随机误差还是系统误差其扩展不确定度一律按统一方式合成。例题 如图,测得l与a,计算h值。设a=35.42,l=48.62m测量扩展不确定度分别为:Ua=1,Ul=0.05m。求h的扩展不确定度。alh算术平均值不确定度合成算术平均值标准差则其不确定度为:总不确定度为:t分布n被测量x服从正态分布,其数学期望为,标准差为,即服从N(,)。nx的n个测量值平均值也服从正态分布:n若以子样标准差s代替总体分布的。则变量 服从自由度r=n-1的t分布。对于子样的不确定度置信系数按正态分布取值一般有较大的误差。子样较小时,合成总扩展不确定度时,应按t分布确定k值。t分布评定扩展不确定度 变形得 此法给出的扩展不确定度具有确定的置信概率,而与估计标准s的可靠性无关,与按正态分布给出的扩展不确定度不同,此法克服了估计标准s可靠性的影响。自由度表示不确定估计量所含信息的大小,反映了不确定估计量的可信程度,是不确定度小子样估计的重要参数。对于单次测量 令t=ta,则x-=应视为相应于置信概率P=1-a的扩展不确定度Up,有:统计法估计不确定度的自由度 等精度测量数据残差平方和 中所包含的变量vi的数目为n,残差为:计算式中的约束条件为 ,约束条件个数为1,所以残差平方和的自由度为:r=n-1 等精度测量数据数目为n,待求量数目为t,则残差平方和包含数目为n。为获得n个残差所列的t个方程,即约束条件为t。所以残差平方和的自由度为:r=n t 非统计法估计不确定度的自由度 标准不确定度计算自由度 S(ui)表示ui的标准差(ui)的估计量 (ui)反映了ui的可信程度扩展不确定计算自由度UU扩展不确定度的估计区间,为U的扩展不确定度kU表示UU的包含因子总不确定度的自由度 总标准不确定度的自由度取决于分量的自由度。当各不确定度分量估计量ui的自由度i已知,按韦尔奇-萨特斯韦特公式计算合成标准不确定度uc的有效自由度。各不确定度分量ui与总不确定uc的关系为:不确定度合成例题 为分析转台速率精度,测量时段T内的转角则可得角速度 ,设测得T=300s,=6.48*107,分析其相对扩展不确定度。式中,转角测量误差包括两部分,测量仪器光栅刻线误差1和角度伺服跟踪误差2.于是误差表达式写为:可得其误差表达式为:n解:由测量方程测量不确定度的微小分量n舍去某一个不确定度分量计算的总不确定度和没有舍去以前计算的总不确定度若很接近,则称此不确定度为微小分量,可以在计算中略去不算。n原则:舍去后以不影响合成总不确定度的有效数字为限。通常按总不确定度的1/3来确定(合成后不确定偏差为0.5%)。不确定合成的意义n提高测量结果精确度 控制测量误差因素 选择有利的测量方法 控制最大误差分量 充分利用误差的抵偿性 为了有效提高测量精度,应从最大误差分量着手,控制最大误差分量,提高精度。在多次重复测量的算术平均值中,其标准差减小为测量标准差的(1/n)1/2,不等精度测量的条件下,按加权算术平均值原理处理测量数据。例题分析弓高弦法测量大直径的最佳条件。回归分析回归分析 直线回归直线回归 其他回归其他回归 一元线性回归回归方程的方差分析回归方程的方差分析回归方程的显著性检验重复测量数据检验回归方程拟合质量显著性检验的步骤 根据回归方程预报和控制因变量y的取值范围 利用回归方程进行估计和预测n回归分析主要目的是根据回归方程进行因变量预测和自变量控制。其中包括点估计和区间估计。点估计即用回归方程直接求解,而区间估计需要置信度的计算。n区间估计包括:1:由x0求出y的平均值的估计区间,称为置信区间。2:由x0求出一系列yi值的估计区间,称为预测区间。y平均值的置信区间估计y的个别值(yi)的区间估计 一般y个别值预测区间比置信区间要宽一些。表明,y的平均值比预测y的个别值更精确。预测区间置信区间函数一元非线性回归n非线性关系的两种解决方法:一是通过变量代换,化曲线回归为直线回归,用一元线性回归方程的方法求解。二是通过级数展开,区间函数变成多项式的形式,把解曲线回归转化成解多项式回归。n对一元线性回归方程,可用相关系数R来衡量线性回归效果。可化为直线的常用曲线多元线性回归逐步回归与多项式回归n逐步回归分析,指从一个自变量开始,按照每个自变量对因变量影响的显著程度的大小依次引入。如果由于新变量的引入,使先引入自变量的影响不再显著,则将先 前自变量剔除。这项工作进行到再没有影响显著的自变量可引入为止。n回归多项式可转化为多元线性回归方程。抛物线回归的幂次选择 称为M次抛物线回归。抛物线的幂次可从一次线性关系配起,然后逐级提高幂次,每提高一级,进行一次方差分析,并对本级与前一级回归平方和之差进行一次检验。如果差异显著,再升一级;否则,认为前一级幂次已经恰当。幂次选择具体方法量热误差分析量热误差分析流动混合功率P的标准差焓计算公式标准不确定度分析滴定标准差分析t误差处理简明思路测量前(分析)测量结果标准差s不确定度u测量(控制实验条件)随机误差系统误差一定系统误差修正值N多次测量xi其它校正仪器未定系统误差仪其它某种方法消除统计分量A=SxThanksvery much!g0(n,a)表 n a0.010.05n a0.010.0531.161.15172.782.4841.491.46182.822.5051.751.67192.852.5361.941.82202.882.5672.101.94212.912.5882.222.03222.942.6092.322.11232.962.62102.412.18242.992.64112.482.23253.012.66122.552.28303.102.74132.612.33353.182.81142.662.37403.242.87152.702.41503.342.96162.752.441003.593.171/Mn表 n2345678910151/Mn1.2531.1281.0851.0641.0511.0421.0361.0321.0281.018n2025304050607080901001/Mn1.0131.0111.0091.0061.0051.0041.0041.0031.0031.0025ndn1/dn ndn1/dn ndn1/dn ndn1/dn21.1280.886282.8470.3512143.4070.2935404.3220.231431.6930.590892.9700.3367153.4720.2880454.4150.226542.0590.4857103.0780.3249203.7350.2677504.5980.222352.3260.4299113.1730.3152253.9310.25441005.0250.19962.5340.3946123.2580.3069304.0850.24482005.4950.18272.7040.3698133.3360.2998354.2130.23744005.8820.170 t 分布表 F检验表excel