误差分布与精度指标.ppt





《误差分布与精度指标.ppt》由会员分享,可在线阅读,更多相关《误差分布与精度指标.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 误差分布与精度指标误差分布与精度指标本章重点本章重点 1.正态分布与偶然误差的规律;正态分布与偶然误差的规律;2.衡量精度的指标;衡量精度的指标;3.精度、准确度、精确度以及测量不确定度的概念;精度、准确度、精确度以及测量不确定度的概念;2-1 正态分布正态分布 概率论中的正态分布是误差理论与测量平差基础中随机变量的基本分布。概率论中的正态分布是误差理论与测量平差基础中随机变量的基本分布。为什么正态分布是一种重要分布?为什么正态分布是一种重要分布?(1)设有相互独立的随机变量)设有相互独立的随机变量X1,X2,Xn,其总和为其总和为X=Xi,无论这些随无论这些随机变量原来服从什么
2、分布,也不论它们是同分布或不同分布,只要它们具有机变量原来服从什么分布,也不论它们是同分布或不同分布,只要它们具有有限的均值和方差,且其中每一个随机变量对其总和有限的均值和方差,且其中每一个随机变量对其总和X的影响都是均匀地小,的影响都是均匀地小,即没有一个比其他变量占有绝对优势,其总和即没有一个比其他变量占有绝对优势,其总和X将是服从或近似服从正态分布将是服从或近似服从正态分布的随机变量。的随机变量。换句话说,当对某个量进行观测时,总是不可避免地受到若干偶然因素换句话说,当对某个量进行观测时,总是不可避免地受到若干偶然因素的影响,其中每一个引起的基本误差项为的影响,其中每一个引起的基本误差项
3、为i,而,而总的的测量量误差差=i,如果,如果每一个每一个对其总和对其总和 的影响都是均匀地小,那么,总和的影响都是均匀地小,那么,总和 就是服从正态分布的就是服从正态分布的随机变量。随机变量。(2)有许多种分布,如二项分布、)有许多种分布,如二项分布、t分布等等,当分布等等,当n 时,它们多趋近于时,它们多趋近于正态分布,或者说许多种分布都是以正态分布为极限分布的。正态分布,或者说许多种分布都是以正态分布为极限分布的。一、一维正态分布一、一维正态分布1.概率密度概率密度:其中其中和和是分布密度的两个参数。正态分布也称为高斯分布。对一维随机是分布密度的两个参数。正态分布也称为高斯分布。对一维随
4、机变量数字特征为变量数字特征为和和的正态分布,一般记为的正态分布,一般记为 x 。2.一维正态随机变量一维正态随机变量X的数学期望和方差的数学期望和方差推导:推导:作变量代换,令作变量代换,令则有则有 因为因为 故故等号右边第二项的积分详见李庆海、陶本藻编等号右边第二项的积分详见李庆海、陶本藻编概率统计原理在测量中的应用概率统计原理在测量中的应用293页。页。数学期望数学期望 有甲乙两射手他们射击技术如下表:有甲乙两射手他们射击技术如下表:击中环数x 8 9 10 随机量概率概率 P甲乙 0.3 0.1 0.6 0.2 0.5 0.3试问哪一个射手技术好呢?试问哪一个射手技术好呢?甲:甲:80
5、.3+90.1+100.6=9.3 乙:乙:80.2+90.5+100.3=9.1平均起来甲的技术好些。这种平均值就是随机变量的数学期望。平均起来甲的技术好些。这种平均值就是随机变量的数学期望。定义定义1.1:设离散型的随机变量的分布律为设离散型的随机变量的分布律为 PX=xi=pi,i=1,2,若级数若级数 绝对收敛,则称级数绝对收敛,则称级数 为随机变量为随机变量X的数学期的数学期望或算数平均值,记为望或算数平均值,记为定义定义1.2:若连续型的随机变量若连续型的随机变量X的概率密度为的概率密度为f(x),若积分,若积分绝对收敛,则称积分绝对收敛,则称积分 为为X的数学期望或平均值,记为的
6、数学期望或平均值,记为一维正态随机变量一维正态随机变量X的数学期望的数学期望推导:推导:概率概率=1 由由数学期望看出数学期望看出甲乙两射手中甲的技术好些,还需要研究谁的技术稳甲乙两射手中甲的技术好些,还需要研究谁的技术稳定,即各次射击的环数偏离平均值的程度,也就是研究随机变量相对其均定,即各次射击的环数偏离平均值的程度,也就是研究随机变量相对其均值的离散程度,最直观的方法求偏差的数学期望,即值的离散程度,最直观的方法求偏差的数学期望,即但上式带有绝对值,运算不方便,通常用但上式带有绝对值,运算不方便,通常用 来度量随机变量相来度量随机变量相对其均值的离散程度。对其均值的离散程度。方差定义:方
7、差定义:设设X是一随机变量,若是一随机变量,若 存在,则称之为随机变量存在,则称之为随机变量的方差,记为的方差,记为 在应用中为了与随机变量有相同的量纲,引入在应用中为了与随机变量有相同的量纲,引入标准差标准差(或(或均方差均方差),记),记为为 由定义可知,方差就是随机变量由定义可知,方差就是随机变量X的函数的函数 的数学期的数学期望,对于离散型的随机变量,若望,对于离散型的随机变量,若X的分布律为的分布律为 则有则有对于连续型的随机变量对于连续型的随机变量X,若,若X的概率分布密度函数为的概率分布密度函数为f(x),则有,则有推导推导令令推导推导作变量代换,令作变量代换,令即即证毕。证毕。
8、3.一维正态随机变量出现在给定区间一维正态随机变量出现在给定区间 内的概率内的概率则有则有由正态分布概率数值表查得:由正态分布概率数值表查得:如果令如果令二、二、N维正态分布维正态分布 设随机向量设随机向量 服从正态分布,则服从正态分布,则n维正态分布的随机向维正态分布的随机向量量X的联合概率密度函数是的联合概率密度函数是n维正态随机变量维正态随机变量 的数学期望和方差(的数学期望和方差(数字特征数字特征)分别为)分别为其中:其中:是随机变量是随机变量Xi的方差,的方差,是随机变量是随机变量Xi对随机变量对随机变量Xj的互协方差。的互协方差。2-2 偶然误差的规律性偶然误差的规律性 任何一个观
9、测量,客观上总是存在着一个能代表其真正大小的数。这一数任何一个观测量,客观上总是存在着一个能代表其真正大小的数。这一数值就称为该观测量的真值。从概率和数理统计的观点看,当观测量仅含偶值就称为该观测量的真值。从概率和数理统计的观点看,当观测量仅含偶然误差时,其数学期望也就是它的真值。然误差时,其数学期望也就是它的真值。一、真误差一、真误差偶然误差的定义偶然误差的定义 设进行了设进行了n n次观测,其观测值为次观测,其观测值为L L1 1、L L2 2、L Ln n,假定观测量的真值假定观测量的真值为为 、,由于各观测值都带有一定的误差,由于各观测值都带有一定的误差 ,因此,每一,因此,每一观测值
10、观测值L Li i与其真值或与其真值或E E(L Li i)之间必存在一差数,设为)之间必存在一差数,设为 (2-2-1)式中式中 称为真误差,有时简称为误差。称为真误差,有时简称为误差。(2-2-3)若记若记则有则有(2-2-2)如果以被观测量的数学期望如果以被观测量的数学期望表示其真值,则表示其真值,则 测量平差中所要处理的观测值是测量平差中所要处理的观测值是假定不包含系统误差和粗差的假定不包含系统误差和粗差的,仅仅仅仅是指是指偶然误差偶然误差。人们从无数的测量实践中发现,在相同的观测条件下,大量偶然误差的人们从无数的测量实践中发现,在相同的观测条件下,大量偶然误差的分布表现出一定的统计规
11、律性,那就是它服从正态分布。分布表现出一定的统计规律性,那就是它服从正态分布。1 1.统计表统计表 在某测区,在相同的条件下,独立地观测了在某测区,在相同的条件下,独立地观测了358358个三角形的全部内角,个三角形的全部内角,由于观测值带有误差,故三角观测值之和不等于其真值由于观测值带有误差,故三角观测值之和不等于其真值180180,根据(,根据(2-2-2-2-1 1)式,各个三角形内角和的真误差可由下式算出:)式,各个三角形内角和的真误差可由下式算出:式中式中(L(L1 1+L+L2 2+L+L3 3)i i表示各三角形内角和的观测值。表示各三角形内角和的观测值。现取误差区间的间隔现取误
12、差区间的间隔dd为为0.200.20,将一组误差按其正负号与误差值的,将一组误差按其正负号与误差值的大小排列;统计误差出现在各区间内的个数,以及大小排列;统计误差出现在各区间内的个数,以及“误差出现在某个区间误差出现在某个区间内内”这一事件的频率这一事件的频率(n=358(n=358),其结果列于表),其结果列于表2-12-1中。中。二、偶然误差的统计规律二、偶然误差的统计规律 误差的误差的 区间区间 为负值为负值 为正值为正值 备备注注 个数个数 频率频率 个数个数 频率频率 0.000.200.200.400.400.600.600.800.801.001.001.201.201.401.
13、401.601.60以上以上 454033231713640 0.1260.1120.0920.0640.0470.0360.0170.0110 0.6300.5600.4600.3200.2350.1800.0850.0550 464133211613520 0.1280.1150.0920.0590.0450.0360.0140.0060 0.6400.5750.4600.2950.2250.1800.0700.0300 d=0.20等于等于区间区间左端左端值的值的误差误差算入算入该区该区间内间内和和 1810.505 177 0.495 表表 2-1 从表从表2-12-1中可以看出,误差
14、的分布情况具有以下性质:中可以看出,误差的分布情况具有以下性质:(1 1)误差的绝对值有一定的限值;)误差的绝对值有一定的限值;(2 2)绝对值较小的误差比绝对值较大的误差;)绝对值较小的误差比绝对值较大的误差;(3 3)绝对值相等的正负误差的个数相近。)绝对值相等的正负误差的个数相近。为了便于以后对误差分布互相比较,选取另一测区的为了便于以后对误差分布互相比较,选取另一测区的421421个三角形内个三角形内角和的一组真误差,按上述方法作了统计,其结果列于表角和的一组真误差,按上述方法作了统计,其结果列于表2-22-2。表表2-22-2中所列的中所列的421421个真误差,尽管其观测条件不同于
15、表个真误差,尽管其观测条件不同于表1-11-1中的真误中的真误差,但从表中可以看出;愈接近于零误差的区间,其频率愈大;随着离差,但从表中可以看出;愈接近于零误差的区间,其频率愈大;随着离开零误差愈来愈远,其频率亦逐渐递减;且出现在正负误差区间内的频开零误差愈来愈远,其频率亦逐渐递减;且出现在正负误差区间内的频率基本上相等。表率基本上相等。表2-22-2的误差分布情况与表的误差分布情况与表2-12-1内误差分布的情况具有相内误差分布的情况具有相同的性质。同的性质。表表 2-2 误差的误差的 区间区间 为负值为负值 为正值为正值 备备注注 个数个数 频率频率 个数个数 频率频率 0.000.200
16、.200.400.400.600.600.800.801.001.001.201.201.401.401.601.601.801.802.002.002.202.202.402.402.602.60以上以上 403431252016149756210 0.0950.0810.0740.0590.0480.0380.0330.0210.0170.0120.0140.0050.0020 0.4750.4050.3700.2950.2400.1900.1650.1050.0850.0600.0700.0250.0100 3736292718171310874320 0.0880.0850.0690.
17、0640.0430.0400.0310.0240.0190.0170.0090.0070.0050 0.4400.4250.3450.3200.2510.2000.1550.1200.0950.0850.0450.0350.0250 d=0.20等于等于区间区间左端左端值的值的误差误差算入算入该区该区间内间内和和 2100.499 2110.501 2.2.直方图直方图 横坐标表示误差的大小,纵坐标代表横坐标表示误差的大小,纵坐标代表各区间内误差出现的频率除以区间的间隔各区间内误差出现的频率除以区间的间隔值,即值,即 取间隔值取间隔值d d=0.20=0.20,分别根据表,分别根据表2-12-
18、1和和表表2-22-2绘出图绘出图2-12-1和图和图2-22-2。此时图中每一。此时图中每一误差区间上的长方条面积就代表误差出现误差区间上的长方条面积就代表误差出现在该区间内的频率。例如,图在该区间内的频率。例如,图2-12-1中画出中画出斜线的长方条面积,就是代表误差出现在斜线的长方条面积,就是代表误差出现在0.000.00+0.20+0.20区间内的频率为区间内的频率为0.1280.128。图图2-1 图图2-2 3.3.偶然误差的经验分布与理论分布偶然误差的经验分布与理论分布 图图2-3 在相同观测条件下所得到的一组独立观测值的误在相同观测条件下所得到的一组独立观测值的误差,只要误差的
19、数量差,只要误差的数量n足够大,误差出现在各区间内足够大,误差出现在各区间内的频率就总是稳定在某一常数(理论频率)附近。当的频率就总是稳定在某一常数(理论频率)附近。当n时,各频率也就趋于一个完全确定的数值,这就时,各频率也就趋于一个完全确定的数值,这就是误差出现在各区间的概率。即是误差出现在各区间的概率。即在一定的观测条件下,在一定的观测条件下,对应着一种确定的误差分布。对应着一种确定的误差分布。在在n的情况下,由于误差出现的频率已趋于完的情况下,由于误差出现的频率已趋于完全稳定,如果此时把误差区间间隔无限缩小,图全稳定,如果此时把误差区间间隔无限缩小,图 2-1及图及图2-2中各长方条顶边
20、所形成的折线将分别变成如中各长方条顶边所形成的折线将分别变成如图图2-3所示的两条光滑的曲线。这种曲线也就是误差所示的两条光滑的曲线。这种曲线也就是误差的概率分布曲线,或称为误差分布曲线。由此可见,的概率分布曲线,或称为误差分布曲线。由此可见,偶然误差的频率分布,随着偶然误差的频率分布,随着n 的逐渐增大,都是以正的逐渐增大,都是以正态分布为其极限。态分布为其极限。通常也称偶然误差的频率分布为其经验分布,而通常也称偶然误差的频率分布为其经验分布,而将正态分布称为它们的理论分布。在以后的理论研究将正态分布称为它们的理论分布。在以后的理论研究中,都是以正态分布作为描述偶然误差分布的数学模中,都是以
21、正态分布作为描述偶然误差分布的数学模型型.图图2-1 图图2-24.4.偶然误差的特性偶然误差的特性 1 1)在一定的观测条件下,误差的绝对值有一定的限值,或者说,超)在一定的观测条件下,误差的绝对值有一定的限值,或者说,超出一定限值的误差,其出现的概率为零;出一定限值的误差,其出现的概率为零;2 2)绝对值较小的误差比绝对值较大的误差出现的概率大;)绝对值较小的误差比绝对值较大的误差出现的概率大;3 3)绝对值相等的正负误差出现的概率相同;)绝对值相等的正负误差出现的概率相同;4)4)根据(根据(2-2-32-2-3)式可知,偶然误差的数学期望为零,即)式可知,偶然误差的数学期望为零,即 换
22、句话说,偶然误差的理论平均值为零。换句话说,偶然误差的理论平均值为零。对于一系列的观测而言,不论其观测条件是好是差,也不论是对同对于一系列的观测而言,不论其观测条件是好是差,也不论是对同一个量还是对不同量进行观测,只要这些观测是在相同的条件下独进行一个量还是对不同量进行观测,只要这些观测是在相同的条件下独进行的,则所产生的一组偶然误差必然具有上述的四个特性。的,则所产生的一组偶然误差必然具有上述的四个特性。(2-2-4)(2-2-6)图图2-1 图图2-2 图图2-3 图图2-1和图和图2-2中各长方条的纵坐标为中各长方条的纵坐标为 ,其,其面积即为误差出现在该区内的频率面积即为误差出现在该区
23、内的频率,这种分布为经验这种分布为经验分布。其理论分布为(图分布。其理论分布为(图2-3),纵坐标就是),纵坐标就是的密的密度函数度函数 f(),而长方条的面积为),而长方条的面积为f()d,即即代表误差出现在该区间内的概率,代表误差出现在该区间内的概率,即即 P()=f()d顾及顾及 为偶然误差,可写出为偶然误差,可写出的概率密度式为的概率密度式为式中式中 为中误差。当为中误差。当 参数确定后,即可画出它参数确定后,即可画出它所对应误差分布曲线。由于所对应误差分布曲线。由于E()=0,所以曲线,所以曲线是以横坐标为是以横坐标为0处的纵轴为对称轴。处的纵轴为对称轴。当当 不同时,曲线的位置不变
24、,但分布曲线不同时,曲线的位置不变,但分布曲线的开头将发生变化。例如,图的开头将发生变化。例如,图2-3中就是表示中就是表示 不相等时的两条曲线。偶然误差不相等时的两条曲线。偶然误差是服从是服从 N(0,)分布的随机变量。)分布的随机变量。2-3 衡量精度的指衡量精度的指标 考察上节两个实例中误差在一定区间出现的频率(考察上节两个实例中误差在一定区间出现的频率(概率概率):):表表2-12-1:-0.20+0.20-0.20+0.20区间的频率为区间的频率为0.2540.254(25.4%)25.4%),-0.60 -0.60+0.60+0.60区间内的频率为区间内的频率为0.665(66.5
25、%0.665(66.5%),),绝对值大于绝对值大于0.60.6误差的频率为误差的频率为0.3350.335(33.5%)33.5%)表表1-21-2:-0.20+0.20-0.20+0.20区间的频率为区间的频率为0.1830.183(18.3%)18.3%)-0.60 -0.60+0.60+0.60区间内的频率为区间内的频率为0.492(49.2%)0.492(49.2%),绝对值大于绝对值大于0.60.6误差的频率为误差的频率为0.508(50.8%).0.508(50.8%).上述数字说明表上述数字说明表2-12-1中的误差更集中于零附近,因此说这一组误差分布中的误差更集中于零附近,因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差 分布 精度 指标

限制150内